¿Más visitas que páginas vistas?

Por desgracia, todavía queda mucha gente analizando logs de servidor web (y no obtenidos mediante Tag). No discutiremos ahora sus razones (que son muchas), pero sí uno de los problemas recientemente planteados en la gestión de campañas a partir de logs:

En mi dashboard obtengo más visitas que paginas vistas.

¿Cómo puede ser esto posible?

En primer lugar indicar que las páginas vistas miden la visualización de archivos con formatos como html, htm, jsp, etc..y por otro lado las visitas se miden a través del acceso de una ip o cookie que visita el sitio web.

En archivos de (web server) logs tenemos, además de páginas, otros elementos (hits) como son las imágenes jpg, gifs, o las hojas de estilo css. Esto no se incluye como página vista porque en realidad no son páginas.

Pues bien, puede darse el caso de que otros sitios web linquen a imágenes de tu propio sitio web, es decir, se hace una petición de una imagen al servidor, en la herramienta por tanto aparecerá una visita, pero ninguna página vista.

En este caso se debería decidir que es lo que mejor conviene, si excluir estas visitas, que realmente no han accedido al sitio web, o tenerlas en cuenta ya que están accediendo a un recurso de nuestro sitio web.

Una vez más, un dilema que no se presentara cuando usemos Tags (o huellas).

fuente: Asociación Española de Analítica Web de 

Cuando Eli Goldratt conoció Web Analytics

Los proyectos web deben maximizar su beneficio, para ello es necesario sacarle el máximo provecho a “la capacida instalada”, o sea a lo que ya tenemos.

El máximo provecho se obtiene generando que mas “cosas de las que queremos que ocurran” finalmente pasen. La cantidad de cosas que pasan por un sistema se denomina throughput.

El throughput es la cantidad efectiva de flujo que hay en un sistema. O sea, si simplificamos al maximo nuestro proyecto web y decimos que el sistema está compuesto por tres pasos.

  1. Campana de SEM.
  2. Pagina de producto.
  3. Venta.

Entonces supongamos que tenemos 50 personas que hacen click en la campana de SEM, 30 que hacen click en un producto y 10 que compran. El throughput cuanto será en este sistema? Solo 10!

O sea por el sistema pasan solo 10 cosas de las que queremos que pasen.

Ahora bien, en todos los pasos tenemos restricciones. Del total de impresiones no tenemos todos clicks, de todos los clicks no todos son landings, de todas las landings no todos se interesan por un producto y finalmente de todos los que se interesan por un producto compran (podríamos agregar un paso más, MUY importante, no todos los que compran vuelven a hacerlo, o sea “Recompra”).Veamos un ejemplo bien representativo de lo que se hace actualmente.

Supongamos un proyecto donde tenemos un sitio de ecommerce, el sitio de e-commerce recibe leads (o potenciales clientes) de una campana de banners.En este caso el proceso va a ser:

  1. clicks 1.000.
  2. vista de producto 200.
  3. compra 50.

Cuál es el throughput del sistema? Bueno, parece simple, solo 50 unidades.

Para vender más generalmente los manager incrementan el presupuesto publicitario, que básicamente lo que hace es solo incrementar de manera directa la cantidad de clicks.

Ahora bien, porque aumentar la cantidad de impresiones para llevar más gente al site, si el problema no está ahí. O sea, claro que vamos a generar un efecto en las ventas ya que es un sistema, o sea un conjunto de cosas interrelacionadas que tienen un objetivo común.

O sea modificando cualquier actividad, vamos a modificar el comportamiento del resto del sistema. Ahora, si en lugar de ver todo separado analizamos el throughput, la respuesta parece ser mucho más sencilla.

El problema, o restricción esta en las ventas. A que deberíamos aspirar como paso 1 en el sistema del modelo de ejemplo? Deberíamos antes que nada ver que impide que de 200 interesados solo 50 compren.

Esa y solo esa es en este momento nuestra restricción. Y cualquier modificación que hagamos en ese paso va a generar mucho mas resultados que cualquier otra.

Por qué? Piensen en el villar, golpeamos una bola blanca con un taco con una fuerza determinada, está a su vez golpea otra bola con menor fuerza y así a cada bola posterior. Si necesitamos golpear con fuerza a la última bola, deberíamos pegarle directamente a esta.

En este caso es igual, debemos apuntar nuestros esfuerzos de manera directa a nuestro “cuello de botella”. Y cabe agregar, SOLO a nuestro cuello de botella.

Apuntar varias cosas a la vez no solo reduce el efecto en el cuello de botella (los recursos son escasos y cuanto más cosas haga, menos invierto en cada una de ellas), sino que además modifica todo el sistema dejándonos sin control sobre las acciones implementadas.

fuente: Analytics 2.0 en español de

Construyendo informes: combinando dimensiones y medidas

En las herramientas más modernas son muchos los diferentes informes que podemos construir, incluyendo dimensiones y métricas al vuelo, cruzando los datos, segmentando en tiempo real…

Esto ofrece una potencia enorme, pero también da pié a errores muy comunes a la hora de construir informes, ya que en ciertos casos podemos obtener datos dispares y que parecen no tener mucho sentido a la hora de comparar resultados.

Para introducir la teoría, diremos que existen tres tipos diferentes de medidas y dimensiones: basados en hit, basados en visita y basados en visitante.

Una dimensión está basada en el hit si su valor puede cambiar varias veces durante una misma visita. Por ejemplo, grupos de contenido o productos son dimensiones que pueden tomar diferentes valores durante la misma visita de nuestro usuario. Métricas basadas en el hit son por ejemplo “vistas de página” o “adiciones al carrito de la compra”. Los eventos que definen estas métricas pueden ocurrir numerosas veces dentro de la misma visita.

Las dimensiones basadas en la visita son aquellas que sólo toman valor una vez durante toda la visita del usuario. Un ejemplo claro es la localización geográfica del visitante, o el referente original de la visita. De la misma manera, para las métricas de este tipo, el evento que las define solo ocurre una vez durante la visita. La métrica “visitas” o la “duración de la visita” son métricas que solo ocurren una vez en la misma sesión.

Por último, las dimensiones basadas en visitante, os lo podéis imaginar: aquellas que no van a cambiar para el mismo visitante, incluso a lo largo de varias visitas. Por ejemplo, cada visitante tiene solo una campaña inicial, o un buscador origen inicial. Las métricas basadas en visitante incluyen todos los “únicos”: “visitantes únicos”, “compradores únicos”, etc..

Si seleccionamos una dimensión basada en visitante, podemos utilizar para medirla una métrica basada en visitante, visita y hit. Si seleccionamos una dimensión basada en visita, podremos solamente medirla a partir de métricas basadas en visita y hit. De la misma manera, solo podremos utilizar una dimension basada en hit si la medimos con una métrica basada en hit.

Medir una dimensión basada en hit o en visita, en función de una métrica basada en visitante como puede ser “visitantes únicos”, producirá una inexactitud proporcional al porcentaje de visitas repetidas en el intervalo de tiempo.

Para finalizar ponemos el siguiente ejemplo: Creamos un informe utilizando una métrica basada en hit, pongamos, el grupo de contenido visitado. Para medirla, utilizamos la métrica “Visitantes únicos”, que se trata de una métrica basada en visitante. En este informe, los datos serán cada vez más inexactos a medida que el mismo visitante vuelve al sitio y visita diferentes grupos de contenidos. La métrica se produce una vez (”visita única”) y se mide en ese momento (el primer grupo de contenido visitado). A partir de ahi, la métrica no vuelve a producirse, y los siguientes grupos de contenidos no se relacionan con la visita, con lo que los datos serán cada vez más inexactos.

fuente: Asociación Española de Analítica Web de