Alzado.org

Logs y estadísticas: la verdad, pero no toda

Los logs o estadísticas del servidor son la fuente de información primaria, más barata y fiable de conocimiento acerca de los usuarios actuales de nuestro sitio.

Sin embargo los logs no nos informan del comportamiento de quienes no usan nuestro sitio, es decir, no nos dirán como captar nuevos usuarios.

Por ello los logs no deben ser nuestra única guía porque corremos el riesgo de encerrarnos en nuestros usuarios actuales y no crecer.

Satisfacer a quienes ya están satisfechos

Los logs reflejan el comportamiento de los usuarios actuales del sitio. Podemos suponer que quienes usan un sitio es porque están razonablemente satisfechos y son capaces de usarlo, por tanto son una muestra reducida y sesgada del público.

Sin embargo las estadísticas dicen muy poco de quienes llegaron y no les satisfizo o no supieron encontrar lo que buscaban y por supuesto no dicen nada sobre quienes no nos usan. Esto es preocupante, porque a no ser que nuestro sitio haya tocado techo o esté cercano a hacerlo (algo improbable), los usuarios actuales son una pequeña parte de nuestros usuarios potenciales.

Esto significa que si tienes un sitio que no ha despegado porque no ha atraido a mucha gente, mirando los logs sólo conocerás mejor a esa poca gente que te usa, pero no te dirán como captar a más gente.

El crecimiento real va a estar durante algunos años aún en captar a nuevos usuarios, al menos en países como los nuestros con poco desarrollo de Internet.

Cifras contaminadas

Los robots de buscadores, los usuarios que se van a los pocos segundos, los proxys, etc. están contaminando los logs y ocultando la realidad de lo que sucede en el sitio.

Debemos depurar los logs de esta contaminación, aunque en algunos casos estos sesgos directamente invalidan el dato, por ejemplo el de visitas o visitantes únicos.

Usuarios que llegan y se van

Entre el 50-70% de las visitas de cualquier sitio llegan, ven una página y se van a los pocos segundos. Los logs no nos dicen por qué estos usuarios abandonan el sitio.

Podemos pensar que llegan accidentalmente desde buscadores y realmente no buscaban lo que nosotros ofrecemos o podemos pensar que si buscaban lo que ofrecemos, pero no le gustaron nuestros contenidos. Otros simplemente pueden comprobar si el sitio está actualizado y en caso contrario salir.

Las hipótesis pueden ser variadas, pero la realidad la tendremos que averiguar por otros métodos como los tests de usuarios, los estudios de contexto, etc

Vistantes únicos y visitas, datos problemáticos

Son dos datos que se proporcionan comúnmente en las estadísticas de los grandes sitios cuando en realidad tienen escasa fiabilidad.

Los visitantes únicos se cuentan una vez aunque realicen multiples visitas y se les identifica por su IP cuando vuelven al sitio.

El problema grave es la identificación por IP. No sabemos cuantas personas hay detrás de cada proxy. Todos los usuarios que se conectan a través del mismo proxy (grandes empresas o instituciones) quedan registradas en los logs como un único visitante. Además muchos proveedores de Internet utilizan IPs dinámicas, con lo que cada vez que se conecta el mismo usuario puede tener una IP diferente.

Las visitas o sesiones contabilizan periodos de actividad, es decir, cuando el usuario deja de utilizar la web durante un tiempo determinado, cuando vuelve a visitarla cuenta como una nueva visita. Pueden ser util saber las visitas en un día porque en determinadas webs no tiene sentido entrar más de una vez al día, pero el global de visitas de en una semana o un mes, no nos vale, porque no sabemos si es el mismo usuario u otro. No sabemos si muchos nos usan poco, o pocos nos usan mucho.

Páginas vistas por visita o visitantes únicos

Páginas por visita = páginas vistas totales / visitas o visitantes únicos

Este dato es muy poco fiable técnicamente y su interpretación puede variar según el escenario de uso real del sitio.

Técnicamente
Como comentábamos antes no sabemos cuantas personas hay detrás de cada proxy. Al contar todas las personas con un mismo proxy como un único visitante, el número de páginas vistas por visita aumenta artificialmente. Tampoco sabemos cuantas veces una misma persona puede entrar en una misma mañana y ser contado como diferentes visitas.

Escenario de uso
Más páginas vistas por visita no significan necesariamente que el sitio funcione mejor. Hay que plantearse cuál sería el número de páginas vistas en un escenario de uso realista del sitio web.

Por ejemplo, en sitios de contenidos de visita frecuente o a los que se llega mayoritariamente por buscadores, vínculos en otros sitios o newsletters, el número difícilmente puede ser mayor de 2 o 3 páginas vistas por visita.

Solo en la primera visita pueden visualizarse muchas páginas, en posteriores visitas el usuario solo chequea los contenidos actualizados, si los hay.

En sitios de venta, pocas páginas vistas por visita puede tener un significado ambiguo. Por un lado puede significar que el sitio sea muy eficiente y el usuario encuentra rápidamente lo que busca. Una web no es un centro comercial donde la gente pasea por todas las secciones, por va directamente a lo que le interesa. Pero también podría significar que el usuario no es capaz de encontrar lo que busca, lo intenta brevemente y se sale del sitio.

Demasiadas paginas vistas por visita no serian siempre una buena señal, quien sabe si el usuario se ha perdido y va dando tumbos por el sitio o si realmente esta interesado en los contenidos.

El número de páginas vistas por visita es un dato a descartar.

Los peculiares datos de la OJD

Muchos de los datos de la OJD de paginas vistas por visita son asombrosos. La mayoría de sitios no bajan de 10 paginas vistas por visita y muchos incluso tienen 20 o 30. En realidad solo en sitios transaccionales pueden tener sentido tantas paginas vistas por visita.

Quizás tiene que ver con que la OJD cuenta una nueva visita tras sólo 10 minutos de inactividad, un tiempo muy escaso. La utilidad de considerar una nueva visita puede tener sentido para separar comportamientos diferentes del usuario con objetivos diferentes, sin embargo, es bastante probable que si el usuario vuelve al sitio tras 20 minutos de inactividad, seguramente es para seguir buscando algo que dejo a medias, por tanto no debería contarse como nueva visita.

Mentiras, medias verdades y estadísticas

O como dice el chiste "si yo me como un pollo y somos dos, tu te has comido medio"

Cuando se miran datos globales: tiempo por visita, páginas vistas por visita, etc. con frecuencia se olvida que son promedios y que la realidad puede ser bien diferente.

Algunas personas pueden estar viendo muchas páginas y otros muy pocas, sin embargo tendremos un dato promedio que en realidad no es el comportamiento real de nadie.

Número de páginas vistas

Es uno de los datos más interesantes, por lo general para una página individual podemos interpretar una página vista como un usuario diferente que la ha visto.

El número de páginas vistas totales del sitio, no indica el número de usuarios del sitio, claro está, pero si el nivel de actividad de los usuarios.

La precaución hay que tenerla en las páginas donde si puede tener sentido que un usuario la visite varias veces. Por ejemplo, el primer paso de un formulario de compra de un producto, es visualizado muchas más veces antes de decidirse a iniciar la compra. El usuario explora hasta donde puede antes de decidirse a comprar, por tanto si tenemos 100 páginas vistas del primer paso del formulario de compra y 50 del segundo paso, no podemos concluir rápidamente que hemos perdido a 50 usuarios por el camino.

Pequeños análisis son útiles

A veces en lugar de hacer un gran análisis de logs con grandes datos y herramientas, es mejor hacer un seguimiento individual a algunos usuarios.

También es interesante realizar pequeños experimentos colocando parámetros en algunos vínculos para comprobar su efectividad según su posición, forma o etiquetado en la página.

Estos pequeños análisis sirven para hacerse una idea real de como un usuario concreto esta utilizando el sitio web y lo que funciona y no funciona, datos que los grandes números nos esconden y son incapaces de explicar.

Salir de la versión móvil