El ‘not provided’ y las visitas de marca, un nuevo reto SEO

Desde principios de 2012, Google empezó a ocultar las palabras que había usado un usuario para llegar a un determinado sitio web. Es decir, cuando alguien buscaba “restaurante mexicano”, los programas de analítica podían saber la procedencia de esa visita, pero no detectar qué buscaba el usuario.

En su lugar, en Analytics aparecía ese dato como not provided.

not provided analytics

Supuestamente, Google limitó esa información para preservar la privacidad, y afectaba a las búsquedas de los usuarios que habían hecho login en Google o algunos de sus sitios como YouTube, Google+, etc.

¿Por qué todo el mundo habla ahora del ‘not provided’?

Desconocer el origen de algunas búsquedas no había sido un problema ahora, porque se estimaba que el porcentaje de not provided suponía en torno al 10% de todas las búsquedas.

Como en casi todos los movimientos que hace la compañía, se ha creado mucha controversia con el not provided, ya que Google sí ofrece datos de las campañas de Adwords, pero son muy pocas palabras comparadas con todas las palabras orgánicas que llevan tráfico a una web.
En su blog, puede comprobarse la gran cantidad de comentarios que se han generado y en los que, además, la gente critica la opacidad del buscador.

Not provided en el blog de Google

Aumento del ‘not provided’

El porcentaje de búsquedas not provided era muy pequeño hasta que, en agosto de 2013, Google elevó al 45,55% el tráfico que considerado bajo ese concepto, con lo que, entre otras cosas, no podemos distinguir el tráfico de “marca” del de “no marca”.
Esto es importante desde el punto de vista de posicionamiento orgánico porque no sabemos si ese tráfico está aumentando debido a los esfuerzos SEO o al branding de una marca.

Not provided en agosto de 2013

Y parece que esto no ha hecho más que empezar. Durante este mes de septiembre, el porcentaje de tráfico con origen desconocido se ha elevado al 76,52% y se prevé que, durante diciembre de 2013, no podamos acceder a ningún dato relativo al origen de las palabras en Google Analytics.

Not provided en septiembre de 2013

Alternativas para tener los datos ‘not provided’

Cuando hemos sido conscientes del gran cambio que va a suponer la desaparición de esta información del origen de la búsqueda a la hora de trabajar el SEO, las agencias, freelances, SEO inhouse y especialistas en analítica web nos hemos puesto a buscar posibles soluciones.

En Internet, existe mucha rumorología, ficheros Excel que supuestamente calculan el not provided de una web, etc. Aquí hay algunas alternativas:

  • Opción 1: usar los datos de Webmaster Tools

En la herramienta Google Webmaster Tool sí tenemos los datos relativos a lo que buscó el usuario.
El problema es que solo se muestra un juego de datos muy limitado, no podemos acceder a todos los datos y ese juego de datos cambia cada mes, por lo que no podemos extrapolar y establecerlo como una métrica correcta, ya que no es constante en el tiempo.

El propio representante de Google, Matt Cutts, confirma que no es un método válido:

Matts Cutts opina sobre el not provided

  • Opción 2: usar los datos de las landing page de Analytics

En Google Analytics, podemos filtrar todas las visitas que vienen con not provided.

De las búsquedas con not provided, podemos saber a qué página de nuestra web llegaron.
Teniendo estos datos, podemos saber qué páginas han recibido tráfico, y tratar de inferir por qué búsqueda llegaron. Por ejemplo, si llegan a una página de recetas de comida española podemos suponer que han buscado algo como “cocina española”, “recetas españolas” y sus combinaciones.

El problema es que cualquier página de nuestra web recibe tráfico de decenas de combinaciones de palabras y no podemos inferir las palabras exactas que llevaron a ese usuario a caer en nuestra landing page. Además, en lo relativo al tráfico de marca no sirve, ya que mucha gente habrá llegado buscando “cocina española mimarca.com”, “recetas de mimarca.com”, etc.

  • Opción 3: extrapolar los datos

Aunque no es un método 100% fiable, podemos crear un segmento de Analytics para sacar el tráfico not provided:

filtro analytics not provided

 

Aplicamos este segmento y podemos ver qué tanto por ciento de tráfico not provided teníamos antes de agosto y cuánto tenemos ahora en las páginas más importantes de nuestra web. También si eran palabras “de marca” o “no de marca”.
Ahora, extrapolamos los datos y podemos hacer un cálculo de la situación actual:
extrapolar datos de analytics: notprovided

Aunque podría valer para salir al paso y calcular datos del pasado, no es una opción que vaya a servir en el futuro, ya que actualmente el 75% de las búsquedas llevan not provided, pero según Not Provided Count, se calcula que en menos de dos meses el 100% de las búsquedas orgánicas lo llevarán.

Es decir, este método sirve para calcular una foto fija del pasado, pero no para saber si mejoramos la adquisición de tráfico gratuito de palabras de “marca” o “no marca” a nuestra web.

Conclusiones

A no ser que Google haga una marcha atrás en su reciente cambio, no vamos a poder distinguir las búsquedas que llegan a nuestra web usando palabras de “marca” y “no de marca”. De hecho, hace unos años, Google rectificó en una iniciativa similar pero, actualmente y según han declarado públicamente, parece que no tienen intención de volver a hacerlo.

Así, solo podremos obtener esta información en las campañas de Adwords porque, según Google, es un tráfico que estamos pagando y como anunciantes tenemos derecho a saber por qué palabras llegan a nuestro sitio.

Para calcular el retorno de la inversión de un proyecto de posicionamiento orgánico, tendremos que hacerlo teniendo en cuenta el aumento de todo el tráfico SEO; no solo del tráfico “no marca”.

En el caso de grandes empresas, donde las búsquedas de marca se ven influenciadas por las campañas de publicidad en medios, habrá que tener en cuenta la estacionalidad no solo de las búsquedas, sino también de la inversión en medios, ya que se supone que ciertos meses tendrán una mayor cantidad de búsquedas de marca.

¿Y cómo calculamos el ROI de un proyecto SEO?

Bueno, eso da para un post nuevo pero, como complemento al aumento de tráfico, podemos calcular el ROI de un proyecto SEO usando un diccionario de palabras claves y comprobando el posicionamiento de las misma, pero no tomando el diccionario como única métrica sino como complemento al aumento de tráfico orgánico que experimenta un sitio, tal y como afirma el propio Google.

Lecturas relacionadas
Si quieres ampliar los conocimientos sobre el not provided, te recomiendo que leas estos artículos que me inspiraron a la hora de escribir este post, y que son la fuente de las imágenes que he utilizado:
– When Keyword (not provided) is 100 Percent of Organic Referrals, What Should Marketers Do?, Rand Fishkin.
– Smarter Data Analysis of Google’s https (not provided) change: 5 Steps, Avinash Kaushik.