RepresentaciÃ³n visual de datos I

Alzado.org

hace 6 años

Disponer de buenos datos sobre un tema, no garantiza automÃ¡ticamente buenas decisiones. Los datos solo revelan su significado cuando son representados de manera adecuada.

Con una representaciÃ³n visual poco clara los oyentes desconfiarÃ¡n del anÃ¡lisis y las conclusiones. SerÃ¡ difÃcil convencerlos aunque los datos sean inequÃvocos.

En este artÃculo tomamos ideas y ejemplos de Edward Tufte, un especialista en representaciÃ³n de datos.

El accidente del Challenger

En el accidente del Challenger los ingenieros no convencieron a los responsables de la peligrosidad del lanzamiento porque no mostraron de manera adecuada los datos de los que disponia.

La causa del accidente fue que ciertos componentes de los cohetes sufrÃan mayor desgaste a bajas temperaturas. El lanzamiento se efectuÃ³ en un dÃa especialmente frÃo, con el resultado que todos conocemos.

El problema es que los ingenieros no demostraron claramente a los responsables del lanzamiento, que la baja temperatura habÃa sido la causa del desgaste en lanzamientos anteriores.

Este grÃ¡fico creado por los ingenieros responsables de la fabricaciÃ³n del cohete no dejaba claro la relaciÃ³n entre daÃ±os en el cohete y baja temperatura.

No se asocia causa y efecto porque:

Los datos estÃ¡n ordenados segÃºn una variable no relevante, el orden temporal de los lanzamientos. Hubiera afectado si los cohetes fueran reutilizados, pero los cohetes eran siempre nuevos.

Dibujar pequeÃ±os cohetes solo distrae a la audiencia del anÃ¡lisis de los datos y dificulta su comprensiÃ³n. Sobrecarga el grÃ¡fico.

Las temperaturas estÃ¡n escritas sentido vertical, lo que dificulta la lectura de un dato clave.

La leyenda no se muestra prÃ³xima a los datos lo que obliga a recordar el significado de cada trama.

La leyenda no es clara, el significado de cada trama no es obvio. Aunque podemos ver fÃ¡cilmente un dato individual concreto, es imposible una percepciÃ³n de conjunto que nos permita asociar baja temperatura a mayor desgaste de la pieza.

La leyenda original utilizada:

Una buena leyenda por el contrario hubiera revelado esta relaciÃ³n de manera mÃ¡s clara. Leyenda modificada:

Una ordenaciÃ³n por temperaturas (no temporal) hubiera dejado clara la relaciÃ³n entre baja temperatura y desgaste. En este grÃ¡fico ordenado por temperaturas, vemos como los mayores desgastes se acumulan en temperaturas mÃ¡s bajas, aunque el grÃ¡fico sigue incluyendo la mayorÃa de problemas comentados antes.

Principios para la buena representaciÃ³n de datos:

Â¿QuÃ© queremos mostrar?

Â¿CuÃ¡l es el objetivo de nuestra representaciÃ³n? Antes de plantear la forma que queremos dar a los datos, debemos tener claro que queremos mostrar.

Nuestro objetivo puede ser mostrar como una variable explica las variaciones en otra. Otro objetivo puede ser alertar claramente cuando la evoluciÃ³n de un dato no es la prevista. Cada objetivo requiere de una representaciÃ³n distinta.

InformaciÃ³n que valga la pena

Muestra solo informaciÃ³n que sea interesante, no se debe mostrar informaciÃ³n solo por el mero hecho de disponer de ella.

Aumentar el volumen de informaciÃ³n oscurece la informaciÃ³n realmente relevante.

Hacer comparaciones.

Un dato no significa nada a menos que se compare con otro. Saber el volumen de las ventas de hoy no significa nada si no tenemos un dato anterior con el que compararlas.

Pero cualquier comparaciÃ³n no es vÃ¡lida, la comparaciÃ³n debe aportar algo y tener en cuenta los ciclos, desviaciones, etc. que nos pueden llevar a engaÃ±o.

Importancia de los ciclos

Si tenemos ciclos semanales (dentro de la semana), no es vÃ¡lida una comparaciÃ³n con el dÃa anterior, sino con la semana anterior. Si tenemos ciclos mensuales, deberemos comparar el dato con el mes anterior.

Desviaciones + o –

Cuando lo importante es monitorizar la evoluciÃ³n de unos datos, mostrar directamente el valor de la desviaciÃ³n sobre las previsiones o el mes anterior, permite ver de manera rÃ¡pida el ajuste de los datos, sin necesidad de comparar el dato real con el previsto.

De este modo la alerta salta rÃ¡pidamente en caso de grandes desviaciones.

Mostrar causalidad

Es importante que quede clara cual es la razÃ³n de la variaciÃ³n en los datos, por eso se debe incluir en la representaciÃ³n la variable causante de estas variaciones.

Mostrar tendencias

PequeÃ±as variaciones diarias pueden esconder una tendencia. Introducir datos acumulados de cierto periodo nos muestra la tendencia general que siguen nuestros datos.

Muchas variaciones diarias acentuadas pueden esconder una tendencia general al alza o a la baja. En estos casos esconder datos individuales ayuda a ver claramente la tendencia.

Mostrar juntos datos relacionados

Para facilitar las comparaciones los datos a comparar deben estar prÃ³ximos. Si estÃ¡n separados por mucho espacio porque entonces hay que memorizar un dato mientras se busca el otro y la comparaciÃ³n no es tan evidente. La Ley de la Proximidad (Gestalt) explica este efecto.

Otras ideas de Tufte:

– Ratio datos/tinta (Tufte): relaciÃ³n entre el volumen de datos que contiene un grÃ¡fico y la tinta usada para dibujarlo. A ratio mÃ¡s alto, mayor calidad del grÃ¡fico, es decir, cuanto menos tinta, mayor simplicidad, mejor grÃ¡fico. Aplicado a la web, tinta podrÃan ser pÃxeles.

– La mÃ¡s pequeÃ±a diferencia efectiva: se refiere a hacer todas las distinciones visuales tan sutiles como sea posible. Esto permite al grÃ¡fico contener mÃ¡s datos sin quedar recargado y difÃcil de leer.

– No mostrar el "0" si no es relevante. Si el rango de datos estÃ¡ lejos de "0" y se incluye, el espacio donde los datos varÃan serÃ¡ mÃ¡s pequeÃ±o y serÃ¡ menos claro.

El accidente del Challenger

Principios para la buena representaciÃ³n de datos:

Comparte esto: