09.05.2013 Views

Una mirada progresiva y orgánica a la visualización de ventas

Una mirada progresiva y orgánica a la visualización de ventas

Una mirada progresiva y orgánica a la visualización de ventas

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Postgrado Visualización <strong>de</strong> <strong>la</strong> Información<br />

IDEC - Universitat Pompeu Fabra<br />

Treensights<br />

<strong>Una</strong> <strong>mirada</strong><br />

<strong>progresiva</strong> y <strong>orgánica</strong><br />

a <strong>la</strong> <strong>visualización</strong> <strong>de</strong><br />

<strong>ventas</strong><br />

Equipo CuaTreeGram:<br />

Judith Argi<strong>la</strong><br />

Hermes Carretero<br />

Gilbert Martínez<br />

Ricardo Vega<br />

Profesores:<br />

Juan Carlos Dürsteler<br />

Victor Pascual<br />

Alejandro Ramírez<br />

Barcelona 2011 - 2012


Postgrado Visualización <strong>de</strong> <strong>la</strong> Información<br />

IDEC - Universitat Pompeu Fabra<br />

Treensights<br />

<strong>Una</strong> <strong>mirada</strong><br />

<strong>progresiva</strong> y <strong>orgánica</strong><br />

a <strong>la</strong> <strong>visualización</strong> <strong>de</strong><br />

<strong>ventas</strong><br />

Equipo CuaTreeGram:<br />

Judith Argi<strong>la</strong><br />

Hermes Carretero<br />

Gilbert Martínez<br />

Ricardo Vega<br />

Profesores:<br />

Juan Carlos Dürsteler<br />

Victor Pascual<br />

Alejandro Ramírez<br />

Barcelona 2011 - 2012


Informe Proyecto Final<br />

Treensights. <strong>Una</strong> <strong>mirada</strong> <strong>progresiva</strong> y <strong>orgánica</strong> a <strong>la</strong><br />

<strong>visualización</strong> <strong>de</strong> <strong>ventas</strong>.<br />

Postgrado Visualización <strong>de</strong> <strong>la</strong> información<br />

IDEC - Universitat Pompeu Fabra<br />

Profesores:<br />

Juan Carlos Dürsteler<br />

Víctor Pascual<br />

Alejandro Ramírez<br />

Alumnos:<br />

Judith Argi<strong>la</strong><br />

Hermes Carretero<br />

Gilbert Martínez<br />

Ricardo Vega<br />

Barcelona 2011 - 2012


Agra<strong>de</strong>cimientos:<br />

Judith Argi<strong>la</strong>: a <strong>la</strong>s conversaciones con Pau sobre arte, que alimentaron mis<br />

obsesiones, y a We feel fine, que me metió <strong>de</strong>finitivamente en esta historia<br />

Hermes Carretero: a Marta y Crapulesque por el apoyo incondicional, a Gabri,<br />

Víctor y Dani por <strong>la</strong>s asistencias ténicas, y a mis infatigables compañeros <strong>de</strong><br />

esta aventura por su fiereza visualizadora.<br />

Gilbert Matínez: al sentido <strong>de</strong>l humor y a <strong>la</strong> realidad sin sentido. A <strong>la</strong> tortil<strong>la</strong> <strong>de</strong><br />

patatas en general y a <strong>la</strong> <strong>de</strong> mi madre en particu<strong>la</strong>r.<br />

Ricardo Vega: a una ratona, una ratoncita, a un par <strong>de</strong> dinosaurios, a mis compañeros,<br />

y sobre todo a mí mismo por aguantarme a mí mismo. Y a FONDART...


Contenidos<br />

0. Presentación 1. Explorando el terreno<br />

1.1. Exploración conceptual<br />

1.2. Exploración estadística<br />

1.3. Limpieza y filtrado<br />

2. Marcando los límites<br />

2.1. Para quién trabajamos<br />

2.2. Y al principio fue el caos…<br />

2.3. Definiendo el problema<br />

3. Se busca metáfora<br />

visual<br />

3.1. P<strong>la</strong>nta un árbol<br />

3.2. Exploratory Metaphora<br />

Analysis (EMA)<br />

3.3. Un ADN económico<br />

3.4. Multipanel: show them<br />

all<br />

3.5. Un Frankenstein y un<br />

Jackpot<br />

3.6. Crisis, waffles y vuelta a<br />

<strong>la</strong>s raíces<br />

4. Codificación visual<br />

4.1. Valores y atributos: baile<br />

<strong>de</strong> parejas<br />

4.2. Datos categóricos<br />

4.3. Datos numéricos<br />

4.3.1. La fuerza representativa<br />

<strong>de</strong> un isotipo<br />

4.4. Dimensión geográfica<br />

4.5. Dimensión temporal<br />

4.6. Últimos ajustes


5. Definiendo <strong>la</strong><br />

interacción<br />

5.1. El camino <strong>de</strong> <strong>la</strong> navegación<br />

5.2. Selección <strong>de</strong> variables<br />

5.3. Selección temporal<br />

5.4. Interacción en los árboles:<br />

focus&context<br />

5.5. El camino <strong>de</strong> regreso<br />

5.6. Recorridos simu<strong>la</strong>dos<br />

6. Test <strong>de</strong> evaluación y<br />

usabilidad<br />

6.1. Primeros pasos hacia una<br />

heurística <strong>de</strong> <strong>la</strong> <strong>visualización</strong><br />

6.2. Autoevaluación heurística<br />

y recorridos cognitivos<br />

6.3. Test <strong>de</strong> usuario<br />

7. Código<br />

7.1. Antece<strong>de</strong>ntes<br />

7.2. Librerías<br />

7.3. Funcional<br />

7.2. Generación <strong>de</strong> datos<br />

estructurados<br />

7.2. Recuperación y procesado<br />

<strong>de</strong> datos<br />

7.2. Lógica <strong>de</strong> presentación<br />

8. Visualización final<br />

8.1. Gráfico principal: árboles<br />

8.2. Gráfico secundario: mapa<br />

con burbujas<br />

8.3. Gráfico secundario: mapa<br />

<strong>de</strong> provincias por colores<br />

Anexos<br />

9.1. EDA ampliada<br />

9.2. Personas y escenarios<br />

9.3. Mo<strong>de</strong>lo <strong>de</strong> heurística<br />

9.4. Prototipos<br />

9.5. Presentaciones<br />

9.6. Formato maquetación


Presentación<br />

Esta es <strong>la</strong> historia <strong>de</strong> un proyecto. En concreto, <strong>de</strong> uno <strong>de</strong> los proyectos finales que se realizaron para<br />

<strong>la</strong> primera edición <strong>de</strong>l Posgrado <strong>de</strong> Visualización <strong>de</strong> <strong>la</strong> Información, <strong>de</strong> <strong>la</strong> Universidad Pompeu Fabra,<br />

en mayo <strong>de</strong> 2012.<br />

La petición académica inicial era <strong>la</strong> creación <strong>de</strong> una <strong>visualización</strong> a partir <strong>de</strong> una base <strong>de</strong> datos <strong>de</strong>terminada:<br />

<strong>la</strong> <strong>de</strong>l registro <strong>de</strong> <strong>ventas</strong> <strong>de</strong>l año 2008 <strong>de</strong> una respetada empresa cata<strong>la</strong>na. El objetivo era<br />

aplicar los conocimientos y metodologías aprendidos durante el curso para generar un sistema visual<br />

que aportara valor y luz a un problema <strong>de</strong>terminado. Definir cuál era ese problema formaba parte <strong>de</strong>l<br />

reto <strong>de</strong>l proyecto.<br />

Las páginas que siguen son una crónica <strong>de</strong> cómo el grupo <strong>de</strong> los CuaTreeGrams (anteriormente también<br />

conocidos como “Los Topos” y como “Los Tres Tristes Trees”) se enfrentaron al reto, fase a fase,<br />

hasta llegar a <strong>la</strong> Visualización final. Por el camino se encontraron con i<strong>de</strong>as <strong>de</strong>scabel<strong>la</strong>das, centenares<br />

<strong>de</strong> gráficos parciales, un parto, metáforas <strong>de</strong> todo pe<strong>la</strong>je, librerías indómitas, festivales <strong>de</strong> Eurovisión<br />

y recorridos <strong>de</strong> interacción imposibles dignos <strong>de</strong> una ilustración <strong>de</strong> Escher. Hemos intentado recoger<br />

aquí todos esos pasos, <strong>la</strong>s i<strong>de</strong>as aceptadas y <strong>la</strong>s <strong>de</strong>scartadas, <strong>la</strong> evolución y <strong>la</strong>s conclusiones y, <strong>de</strong> vez en<br />

cuando, también algo <strong>de</strong>l humor y el sentimiento que han ido empapando el proyecto.<br />

Antes <strong>de</strong> empren<strong>de</strong>r <strong>la</strong> lectura, vaya por <strong>de</strong><strong>la</strong>nte un <strong>de</strong>scubrimiento: <strong>la</strong> realidad siempre resulta mucho<br />

más caótica, irracional e inenarrable <strong>de</strong> lo que los diagramas <strong>de</strong>l buen infovisualizador apuntan, así que<br />

este documento es a <strong>la</strong> vez testimonio y ejercicio <strong>de</strong> or<strong>de</strong>nación <strong>de</strong> i<strong>de</strong>as. Confiamos en que sirva para<br />

que otros revivan con nosotros <strong>la</strong>s discusiones, conclusiones, sufrimientos y locuras (p<strong>la</strong>centeras) <strong>de</strong><br />

estos dos meses; para nosotros, queda como recuerdo y guía <strong>de</strong> referencia para futuros proyectos.


Las 3 preguntas c<strong>la</strong>ve para sobrevivir a un proyecto <strong>de</strong> infovis:<br />

¿Pero Valencia no era ayer <strong>de</strong> color amarillo? (Herramientas)<br />

¿Seguro que estamos trabajando sobre <strong>la</strong> misma versión? (Organización)<br />

¿Cada cúanto dices que tiene contracciones? (Entorno)


1 O<br />

explorando el terreno<br />

cómo los Rai<strong>de</strong>rs of the Lost Lens<br />

nos perdimos en los datos y finalmente<br />

encontramos un camino


1. explorando el terreno<br />

Freemind categorías web.<br />

Freemind que refleja <strong>la</strong> estructura<br />

conceptual <strong>de</strong> lentes <strong>de</strong> <strong>la</strong><br />

empresa cata<strong>la</strong>na, según su web.<br />

En negrita, aquel<strong>la</strong>s categorías<br />

que tienen más visibilidad en los<br />

menús.<br />

12<br />

Un dataset <strong>de</strong> 7 millones <strong>de</strong> registros es, sin duda, un lugar interesante para empezar un proyecto. En<br />

nuestro caso, se trataba <strong>de</strong> un fragmento <strong>de</strong> <strong>la</strong> base <strong>de</strong> datos <strong>de</strong> una conocida empresa cata<strong>la</strong>na, que<br />

nos facilitó sus registros <strong>de</strong> <strong>ventas</strong> <strong>de</strong>l año 2008 con <strong>la</strong> esperanza <strong>de</strong> que pudiéramos aportar alguna<br />

<strong>visualización</strong> que arrojara nueva luz sobre <strong>la</strong>s siempre misteriosas y cambiantes corrientes <strong>de</strong> mercado.<br />

Con ese ambiguo objetivo en mente, iniciamos nuestro proyecto: primer paso, <strong>de</strong>scarga e insta<strong>la</strong>ción <strong>de</strong><br />

los datos.<br />

Para saber realmente a qué nos enfrentábamos, necesitábamos tantear el terreno: explorar <strong>la</strong> base <strong>de</strong><br />

datos para, por una parte, enten<strong>de</strong>r su estructura, y por otra, empezar a visualizar los datos para <strong>de</strong>tectar<br />

los primeros patrones y los posibles errores. Nuestra exploración tenía que ser tanto conceptual<br />

como estadística.<br />

Exploración conceptual<br />

Un ‘cuadro’ para colgar en <strong>la</strong> pared cada vez que trabajemos.<br />

Empezamos por el más básico y rupestre <strong>de</strong> los Exploratory Data Analysis (EDA): <strong>la</strong> lectura <strong>de</strong> <strong>la</strong> web <strong>de</strong><br />

<strong>la</strong> empresa cata<strong>la</strong>na, en una primera aproximación para enten<strong>de</strong>r cómo presenta y organiza el<strong>la</strong> misma<br />

su propio negocio. Allí encontramos <strong>la</strong> explicación <strong>de</strong> en qué categorías se organizan sus productos, así<br />

como los atributos que se utilizan para esa c<strong>la</strong>sificación. Con esa información, sumada a <strong>la</strong> que <strong>la</strong> responsable<br />

<strong>de</strong> Data Mining <strong>de</strong> <strong>la</strong> empresa nos había facilitado, empezábamos a tener datos contextuales<br />

con los que dotar <strong>de</strong> sentido e interpretación a los datos en bruto <strong>de</strong>l dataset.<br />

Para ser honestos con nuestra naturaleza visual, necesitábamos po<strong>de</strong>r ver esa jerarquía y esos metadatos<br />

que nos <strong>de</strong>finen <strong>la</strong>s categorías <strong>de</strong> un modo más gráfico y menos abstracto; ver algo más palpable. ¿Y<br />

qué hay menos abstracto y más palpable que una representación realista <strong>de</strong> <strong>la</strong> realidad? Echando mano<br />

<strong>de</strong> Illustrator, dibujamos <strong>la</strong> siguiente ilustración, que es, a su vez, un diagrama <strong>de</strong> re<strong>la</strong>ción.<br />

En <strong>la</strong> imagen <strong>de</strong> <strong>la</strong> lente añadimos también <strong>la</strong> información <strong>de</strong>l porcentaje <strong>de</strong> referencias (# SKUs/total<br />

SKUs) para cada característica <strong>de</strong> <strong>la</strong>s variables principales <strong>de</strong> <strong>la</strong> lente.<br />

Así, casi el 100% <strong>de</strong> <strong>la</strong>s referencias <strong>de</strong> lentes, son o bien <strong>progresiva</strong>s o bien monofocales. Casi el 80% <strong>de</strong>l<br />

total están realizadas en material orgánico y el tratamiento más <strong>de</strong> ‘moda’ es el HC. El reparto <strong>de</strong> SKUs<br />

<strong>de</strong> lentes <strong>de</strong>dicados a <strong>la</strong>s 2 marcas (A y C) es bastante equlibrado (55%/45% respectivamente)


1. explorando el terreno<br />

Estructura <strong>de</strong> <strong>la</strong> lente y re<strong>la</strong>ción<br />

con variables <strong>de</strong> <strong>la</strong> BBDD<br />

La ilustración incluye el reparto<br />

<strong>de</strong> SKUs en función <strong>de</strong> diferentes<br />

variables.<br />

Re<strong>la</strong>ción entre <strong>la</strong>s distintas variables<br />

con Parallel Sets<br />

Detección <strong>de</strong> <strong>la</strong> re<strong>la</strong>ción entre <strong>la</strong>s<br />

variables en función <strong>de</strong>l número<br />

<strong>de</strong> SKUs comunes.<br />

Enten<strong>de</strong>r <strong>la</strong> jerarquía no nos permitía, sin embargo, conocer <strong>la</strong> “intensidad” <strong>de</strong> <strong>la</strong>s re<strong>la</strong>ciones entre<br />

<strong>la</strong>s categorías: esa información se escondía en el volumen <strong>de</strong> registros <strong>de</strong>l dataset. Así que empezamos<br />

a procesar los datos para po<strong>de</strong>r hacer representaciones visuales exploratorias que nos mostraran<br />

qué categorías tenían más vínculos entre el<strong>la</strong>s; es <strong>de</strong>cir, qué categorías aparecían más frecuentemente<br />

juntas en el catálogo que refleja todas <strong>la</strong>s referencias posibles <strong>de</strong> <strong>la</strong> empresa cata<strong>la</strong>na (<strong>de</strong> su listado<br />

estructural <strong>de</strong> SKUs, no <strong>de</strong> sus transacciones).<br />

Para ello utilizamos el programa Parallel Sets. Creamos una tab<strong>la</strong> con el archivo cuadroequivalencias.<br />

xls facilitado con <strong>la</strong> documentación <strong>de</strong>l dataset y cruzamos los datos a partir <strong>de</strong> los campos “Familias”,<br />

“Material” y “Capa”. Esto fue lo que obtuvimos:<br />

Así se pue<strong>de</strong> verificar rápidamente que, a nivel <strong>de</strong> tipo <strong>de</strong> foco, todos aquellos que empiezan por ‘F. _’<br />

correspon<strong>de</strong>n a <strong>la</strong> marca C y que los bifocales (3ªcolumna) sólo existen para <strong>la</strong> marca A.<br />

13


1. explorando el terreno<br />

Re<strong>la</strong>ción entre Capa y Materiales<br />

con Parallel Sets.<br />

Detalle <strong>de</strong> <strong>la</strong> re<strong>la</strong>ción entre diferentes<br />

tipos <strong>de</strong> capa y los materiales.<br />

Algunas capas sólo se<br />

aplican a materiales específicos.<br />

Proceso <strong>de</strong> Preparación y Exploratory<br />

Data Analysis<br />

Fases y recursos utilizados en <strong>la</strong><br />

Exploración <strong>de</strong> los Datos.<br />

14<br />

También se pue<strong>de</strong> confirmar el protagonismo <strong>de</strong> <strong>la</strong>s referencias <strong>orgánica</strong>s, en cuanto a #SKUs, vs. <strong>la</strong>s<br />

minerales o <strong>la</strong>s que usan el policarbonato, éste último (3) sólo se fabrica para <strong>la</strong> marca A.<br />

Explorando el nivel <strong>de</strong> capa (tratamiento aplicado a <strong>la</strong> lente) en función <strong>de</strong>l tipo <strong>de</strong> material ya<br />

vemos que algunos tratamientos sólo se aplican a <strong>la</strong>s SKUs <strong>orgánica</strong>s (<strong>la</strong>s primeras columnas<br />

que correspon<strong>de</strong>n a Transitions, B<strong>la</strong>nco, varios ‘Color*…’) mientras que hay otros como<br />

el AR, HC o el Foto-HC que se aplican tanto al material orgánico como al mineral e incluso el<br />

policarbonato (caso <strong>de</strong> AR y HC).<br />

Exploración estadística<br />

Por fin teníamos un pequeño mapa <strong>de</strong> referencia encima <strong>de</strong> <strong>la</strong> mesa: habíamos pisado el territorio, observado<br />

su flora y su fauna, y entendíamos qué tipo <strong>de</strong> re<strong>la</strong>ciones –y cuan intensas- había entre el<strong>la</strong>s. Ya<br />

no había excusa para seguir postergándolo: <strong>de</strong>bíamos empezar a visualizar <strong>la</strong>s <strong>ventas</strong>.<br />

Dicha <strong>visualización</strong> se realizó en el marco <strong>de</strong> todo un proceso <strong>de</strong> fusión, limpieza y exploración <strong>de</strong> <strong>la</strong><br />

BBDD. Se incluyen <strong>la</strong>s herramientas <strong>de</strong> software usadas en cada paso así como <strong>la</strong>s funciones c<strong>la</strong>ve que<br />

permiten realizar esos procesos.<br />

Las primeras consultas sobre una parte <strong>de</strong>l dataset (Enero’08) nos mostraron que el 80% <strong>de</strong> <strong>la</strong>s <strong>ventas</strong><br />

y el margen <strong>de</strong> <strong>la</strong> empresa cata<strong>la</strong>na tenían su origen en España (el segundo lugar era para Francia, con<br />

un 6%). ¿Podríamos quizá centrarnos en visualizar datos sobre España, evitando <strong>la</strong> complejidad que<br />

implicaba tener en cuenta todos los países? Consi<strong>de</strong>ramos que, dada su predominancia en los registros,<br />

nuestras visualizaciones <strong>de</strong> España ofrecerían respuestas al menos para una parte importante <strong>de</strong> <strong>la</strong>s<br />

posibles preguntas <strong>de</strong> negocio. Estábamos ante un ejemplo paradigmático <strong>de</strong>l 80/20 paretiano, y pare-


1. explorando el terreno<br />

Ventas Brutas y VEA x países.<br />

Concentración <strong>de</strong> <strong>ventas</strong> y margen<br />

en España.<br />

Ventas Brutas x geografías <strong>de</strong><br />

España<br />

Concentración <strong>de</strong> <strong>ventas</strong> por provincias.<br />

Necesidad <strong>de</strong> disponer<br />

<strong>de</strong> datos normalizados por pob<strong>la</strong>ción.<br />

cía sensato aplicarlo simplificando el problema pero preservando <strong>la</strong> parte más importante <strong>de</strong>l output<br />

económico <strong>de</strong> <strong>la</strong> empresa.<br />

A partir <strong>de</strong> una base completa <strong>de</strong> los datos anuales <strong>de</strong> España se extrajo (con ‘R’) una muestra aleatoria<br />

<strong>de</strong> 10.000 casos <strong>de</strong> <strong>la</strong>s <strong>ventas</strong> (margen error estadístico +/-1%). A partir <strong>de</strong> el<strong>la</strong> (Tab<strong>la</strong>s y Gráficos Dinámicos<br />

Excel) exploramos <strong>la</strong> base para <strong>de</strong>tectar los primeros patrones y atipicida<strong>de</strong>s.<br />

A nuestros ojos, estos fueron los principales patrones <strong>de</strong>stacables:<br />

• Existe un <strong>de</strong>sfase entre <strong>la</strong>s <strong>ventas</strong> <strong>de</strong> BCN y Madrid (superiores en BCN a pesar <strong>de</strong> tener menos<br />

pob<strong>la</strong>ción). Por tanto normalizar <strong>la</strong>s <strong>ventas</strong> por <strong>la</strong> pob<strong>la</strong>ción, para <strong>de</strong>stacar <strong>ventas</strong> atípicas en re<strong>la</strong>ción<br />

a <strong>la</strong> <strong>de</strong>mografía, nos parece una opción interesante a explorar en el proyecto.<br />

15


1. explorando el terreno<br />

Impacto <strong>de</strong> variables en <strong>ventas</strong><br />

(CHAID).<br />

Exploración <strong>de</strong>l impacto <strong>de</strong> <strong>la</strong>s<br />

diferentes categorías <strong>de</strong> <strong>la</strong>s variables<br />

<strong>de</strong> <strong>la</strong> BBDD en <strong>la</strong>s <strong>ventas</strong><br />

<strong>de</strong> <strong>la</strong> empresa cata<strong>la</strong>na.<br />

Ventas según año <strong>de</strong><br />

<strong>la</strong>nzamiento<br />

Concentración <strong>de</strong> <strong>la</strong>s <strong>ventas</strong> en<br />

productos <strong>la</strong>nzados especialmente<br />

en el 2000 y 2005.<br />

16<br />

• Introduciendo algunas variables en un análisis estadístico multivariable CHAID (Chi Square Automatic<br />

Interaction Detection) po<strong>de</strong>mos ver cuáles <strong>de</strong> el<strong>la</strong>s generan más impacto en <strong>la</strong>s <strong>ventas</strong><br />

promedio por transacción.<br />

Así, mientras que el promedio <strong>de</strong> transacción <strong>de</strong> una venta <strong>de</strong> lentes <strong>orgánica</strong>s o <strong>de</strong> policarbonato<br />

está en 81.7 euros, si <strong>la</strong> lente fuese <strong>de</strong> <strong>la</strong> marca C <strong>la</strong> venta bajaría hasta los 57.5 mientras que si se<br />

tratase <strong>de</strong> <strong>la</strong> marca A ascen<strong>de</strong>ría a 89.1. Dentro <strong>de</strong> este mismo tipo <strong>de</strong> lentes <strong>de</strong> Marca A po<strong>de</strong>mos<br />

ver diferencias notables <strong>de</strong> transacción media entre provincias: <strong>de</strong>s<strong>de</strong> los 65.1 euros (p.ej. Guipúzcoa,<br />

Burgos…) y los 113.6 euros (Barcelona, Ávi<strong>la</strong>…).<br />

• A nivel <strong>de</strong> innovación vemos que existe una cierta acumu<strong>la</strong>ción <strong>de</strong> <strong>ventas</strong> <strong>de</strong>l 2008 en referencias<br />

introducidas en años puntuales.<br />

Así, en el año 2000, <strong>la</strong> empresa cata<strong>la</strong>na introdujo un número importante <strong>de</strong> referencias re<strong>la</strong>cionadas<br />

con lentes monofocales y bifocales <strong>la</strong>s cuales seguían catalogadas en el 2008. En el 2005<br />

se produjeron innovaciones re<strong>la</strong>cionadas con lentes <strong>orgánica</strong>s y algunas en el 2007 re<strong>la</strong>cionadas<br />

sobre todo con lentes <strong>progresiva</strong>s <strong>orgánica</strong>s.


1. explorando el terreno<br />

Tab<strong>la</strong> resumen <strong>de</strong> valores<br />

atípicos VN y VEA<br />

Resumen <strong>de</strong> elementos que<br />

presentan porcentajes altos <strong>de</strong><br />

valores atípicos superiores o inferiores.<br />

• A nivel geográfico (provincias) existe suficiente variabilidad <strong>de</strong> comportamiento en re<strong>la</strong>ción a los<br />

mixes <strong>de</strong> producto o a los porcentajes <strong>de</strong> <strong>ventas</strong>/márgenes atípicos (positivos o negativos). En <strong>la</strong>s<br />

tab<strong>la</strong>s siguientes se resume <strong>la</strong> situación <strong>de</strong> datos atípicos para diferentes variables confrontando lo<br />

obtenido en VN y VEA. Ver anexo para el <strong>de</strong>talle <strong>de</strong> todos los análisis <strong>de</strong> valores atípicos realizados<br />

(<strong>de</strong>finición atípicos, atípicos x niveles, x capas, x red <strong>de</strong> <strong>ventas</strong>…).<br />

I<strong>de</strong>almente un caso atípico en VN (venta neta) <strong>de</strong>bería verse reflejado en ese mismo caso apareciendo<br />

como VEA (margen) atípico, aunque no siempre es así. En negrita se marcan aquellos casos en que no<br />

coinci<strong>de</strong>n ambas ten<strong>de</strong>ncias.<br />

Afinando aún más allá en el análisis, hay casos que no <strong>de</strong>stacan ni por arriba (no presentan un porcentaje<br />

muy alto <strong>de</strong> atípicos superiores) ni por abajo (í<strong>de</strong>m para los atípicos inferiores) pero en cambio muestran<br />

un perfil diferencial en <strong>la</strong> re<strong>la</strong>ción entre VN y VEA. En el gráfico anexo se muestran dichos casos.<br />

17


1. explorando el terreno<br />

Biplot atípicos por<br />

geografía, VN y VEA<br />

Re<strong>la</strong>ción entre los atípicos <strong>de</strong> VN<br />

y VEA para <strong>de</strong>tectar incoherencias<br />

entre ellos.<br />

18<br />

Por ejemplo, Ávi<strong>la</strong> tiene un porcentaje promedio (10%) <strong>de</strong> valores atípicos superiores en VN pero en<br />

cambio no muestra un porcentaje <strong>de</strong> valores atípicos <strong>de</strong> VEA en consonancia con ese dato, en realidad<br />

no tiene ninguno.<br />

Esos son casos <strong>de</strong> <strong>ventas</strong> que tampoco se correspon<strong>de</strong>n con sus márgenes (posibles promociones puntuales<br />

<strong>de</strong> colocación <strong>de</strong> producto sobrante).<br />

En cambio en zonas como Baleares, Almería, Burgos…se consiguen entre un 10-15% <strong>de</strong> casos con márgenes<br />

atípicamente altos pero con no más <strong>de</strong> un 5% <strong>de</strong> <strong>ventas</strong> atípicamente altas. Es <strong>de</strong>cir <strong>ventas</strong> con<br />

transacciones que no son especialmente elevadas pue<strong>de</strong>n llegar a generar márgenes atípicamente elevados<br />

quizás por el mix <strong>de</strong> productos que se vendan en esa zona.<br />

Y tras ver este mapa <strong>de</strong> situación, habiéndole tomado el primer pulso a los datos, empezamos a afi<strong>la</strong>r<br />

<strong>la</strong> podadora.<br />

Limpieza y filtrado<br />

Camaradas, hoy he montado exitosamente <strong>la</strong> BD para el proyecto (bombos, p<strong>la</strong>tillos y cornetas).<br />

Datos en bruto<br />

Recibimos un pack compuesto por:<br />

• 12 archivos .csv que contienen <strong>la</strong> totalidad, un archivo por mes, <strong>de</strong> <strong>la</strong>s transacciones realizadas<br />

durante 2008. Cada transacción i<strong>de</strong>ntificada con el número <strong>de</strong> familia registra a su vez 6 valores <strong>de</strong><br />

importe correspondientes a:<br />

• UNF: unida<strong>de</strong>s físicas vendidas <strong>de</strong> una familia<br />

• UNI: unidad física + tratamiento vendidas <strong>de</strong> una familia<br />

• VN: venta neta<br />

• VB: venta total sin restar <strong>de</strong>scuentos


1. explorando el terreno<br />

Diagrama entidad-re<strong>la</strong>ción<br />

• VBE: venta bruta para <strong>de</strong>scuentos fuera <strong>de</strong> factura<br />

• VEA: beneficio resultante <strong>de</strong> restar costes <strong>de</strong> <strong>ventas</strong> a <strong>la</strong> venta neta<br />

• Archivos <strong>de</strong> apoyo (equivalencias xls) don<strong>de</strong> se incluyen <strong>la</strong>s referencias a los códigos presentes en<br />

<strong>la</strong>s transacciones (geográficos, ven<strong>de</strong>dor, tipo <strong>de</strong> pedido, código <strong>de</strong> mercado,...) y <strong>la</strong> tab<strong>la</strong> c<strong>la</strong>ve <strong>de</strong><br />

referencias para los i<strong>de</strong>ntificadores en subfamilias. Esta tab<strong>la</strong> nos da información para cada familia<br />

estructurada así:<br />

• Propieda<strong>de</strong>s<br />

• Material<br />

• Año <strong>de</strong> <strong>la</strong>nzamiento<br />

• Refracción<br />

• Tratamiento<br />

• Su <strong>de</strong>sglose en subfamilias<br />

• Marca (N2)<br />

• Foco (N3)<br />

• Foco + Material (N4)<br />

• Foco + Material + Refracción (N5)<br />

• Foco + Material + Refracción + Tratamiento<br />

Carga <strong>de</strong> datos en sql<br />

La importación <strong>de</strong> los datos en nuestra base <strong>de</strong> datos da como resultado <strong>la</strong> siguiente estructura:<br />

Tenemos una tab<strong>la</strong> valores con aproximadamente 7.2 millones <strong>de</strong> registros <strong>de</strong> <strong>ventas</strong> (divididos entre<br />

6 valores <strong>de</strong> importe para cada transacción), y otra con 1.247 registros únicos <strong>de</strong> i<strong>de</strong>ntificación <strong>de</strong> producto<br />

por familias. Complementariamente hemos creado tab<strong>la</strong>s auxiliares conteniendo <strong>la</strong>s referencias<br />

para los códigos geográficos, los meses y los códigos <strong>de</strong> cliente.<br />

Limpieza<br />

<strong>Una</strong> vez cargados los datos, proce<strong>de</strong>mos a su limpieza elemental y regu<strong>la</strong>rización:<br />

• Eliminación <strong>de</strong> espacios en b<strong>la</strong>nco<br />

• Búsqueda y reemp<strong>la</strong>zo <strong>de</strong> valores nulos<br />

• Eliminación <strong>de</strong> columnas con valores repetidos (marca = familias)<br />

• Mejora <strong>de</strong> legilibilidad <strong>de</strong> los registros (suprimir referencias internas - paréntesis con valores<br />

directorios)<br />

• Agregación <strong>de</strong> índices e i<strong>de</strong>ntificadores únicos a <strong>la</strong>s tab<strong>la</strong>s<br />

19


1. explorando el terreno<br />

Mo<strong>de</strong>lo anidado<br />

20<br />

Filtrado<br />

Durante <strong>la</strong> fase <strong>de</strong> EDA y el <strong>de</strong>sarrollo <strong>de</strong> <strong>la</strong> <strong>visualización</strong> hemos filtrado los datos para:<br />

• Mercado español<br />

• Valores importe VN, VEA y UNF/UNI<br />

• Unido los valores <strong>de</strong> foco y añadido el valor marca-b<strong>la</strong>nca para aquellos campos precedidos por F.<br />

• Rangos <strong>de</strong> tiempo por trimestres. Se aña<strong>de</strong> un campo <strong>de</strong> datos por trimestres para su posible uso<br />

posterior.<br />

Transformaciones<br />

Debido a <strong>la</strong> complejidad entre <strong>la</strong>s re<strong>la</strong>ciones <strong>de</strong> <strong>la</strong> c<strong>la</strong>sificación <strong>de</strong> productos y con <strong>la</strong> metáfora <strong>de</strong>l árbol<br />

en <strong>la</strong> cabeza ,nuestro reto es representar <strong>de</strong> forma jerárquica el conjunto <strong>de</strong> <strong>ventas</strong> para po<strong>de</strong>r establecer<br />

<strong>la</strong>s comparaciones <strong>de</strong>ntro <strong>de</strong> cada nivel <strong>de</strong> jerarquía. Otra i<strong>de</strong>a <strong>de</strong> fondo es que los niveles para<br />

estructurar los datos fueran configurables, es <strong>de</strong>cir po<strong>de</strong>r partir <strong>de</strong> cualquiera <strong>de</strong> <strong>la</strong>s propieda<strong>de</strong>s para<br />

ir <strong>de</strong>sglosando el árbol.<br />

Demasiado evi<strong>de</strong>nte, pero para tener una representación en forma <strong>de</strong> árbol los datos <strong>de</strong>ben adoptar esta<br />

forma. Manos a <strong>la</strong> obra, intentamos conseguir eso en 3 tentativas, por 3 vías diferentes.<br />

Opción 1<br />

Realizar consultas sql a <strong>la</strong> BD y generar por medio <strong>de</strong> funciones recursivas PHP <strong>la</strong> estructura <strong>de</strong> datos:<br />

//Tree of options with results<br />

foreach($results as $result){<br />

if(!isset($filledTree[$result['material']][$result['refraccion']]<br />

[$result['foco']][$result['tratamiento']])) {<br />

$filledTree[$result['material']][$result['refraccion']][$result['foco']]<br />

[$result['tratamiento']] = array();<br />

}<br />

array_push($filledTree[$result['material']][$result['refraccion']]<br />

[$result['foco']][$result['tratamiento']], $result);<br />

}<br />

Opción 2<br />

Realizar transformaciones en <strong>la</strong> BD para reproducir <strong>la</strong>s re<strong>la</strong>ciones entre los campos. Probamos tres<br />

aproximaciones al mo<strong>de</strong>lo:<br />

• The Adjacency List Mo<strong>de</strong>l<br />

• The Nested Set Mo<strong>de</strong>l


1. explorando el terreno<br />

Árbol <strong>de</strong> directorios<br />

Y una tercera:<br />

• Directory Tree<br />

Opción 3<br />

La tercera y solución <strong>de</strong>finitiva es un programa creado en java (Víctor) que estructura un csv p<strong>la</strong>no<br />

(familias) en nodos y subnodos y re<strong>la</strong>ciona estos con los valores <strong>de</strong> importe (vn, vea, vb,...) acumu<strong>la</strong>dos<br />

en otro csv.<br />

Conclusiones<br />

Finalmente conseguimos un archivo estructurado en forma <strong>de</strong> árbol :) y quedamos preparados para el<br />

siguiente reto, recuperar <strong>la</strong> información y cargar<strong>la</strong> sobre nuestra aplicación <strong>de</strong> <strong>visualización</strong>. La estructura<br />

<strong>de</strong>l archivo json quedaría así:<br />

nombre : VN,<br />

children:[{<br />

name: marca a,<br />

children:[{<br />

name : monofocales,<br />

children: [{<br />

name: organico<br />

children: [{<br />

name: trat-col,<br />

children: [{<br />

name: 118,<br />

importe_vn: 1000<br />

},<br />

{<br />

name: 118,<br />

importe_vn: 2000<br />

}...<br />

Tecnologías<br />

MySQL PHPMyAdmin, PHP, Javascript, Eclipse, Google Refine.<br />

21


1. explorando el terreno<br />

22


2<br />

marcando los límites <strong>de</strong>l terreno<br />

De cómo <strong>de</strong>scubrimos para quién<br />

trabajamos y escogimos, por una vez,<br />

nuestros problemas


2. Marcando los límites<br />

Diagrama <strong>de</strong> Venn: Personas.<br />

El diagrama muestra <strong>la</strong>s principales<br />

áreas / datos <strong>de</strong> interés <strong>de</strong><br />

cada uno <strong>de</strong> los perfiles <strong>de</strong> usuarios<br />

potenciales o “Personas”. La<br />

confluencia <strong>de</strong> <strong>la</strong>s respectivas<br />

áreas <strong>de</strong> interés marca aquellos<br />

datos que tienen interés para un<br />

mayor número <strong>de</strong> usuarios; en<br />

nuestro caso, <strong>la</strong> información más<br />

relevante parecía ser <strong>la</strong> Venta Neta<br />

(VN), en el centro <strong>de</strong>l diagrama.<br />

Los colores se utilizan categóricamente<br />

para diferenciar a los<br />

personajes. La pregunta que formu<strong>la</strong>n<br />

es un ejemplo que intenta<br />

sintetizar <strong>la</strong> principal preocupación<br />

o problema <strong>de</strong> aquél usuario.<br />

Cualquier parecido entre <strong>la</strong>s ilustraciones<br />

y <strong>la</strong> realidad es mera<br />

coinci<strong>de</strong>ncia.<br />

24<br />

Con los datos limpios y dispuestos, el siguiente paso para seguir a<strong>de</strong><strong>la</strong>nte era <strong>de</strong>finir cuál iba a ser<br />

nuestro problema. Sabíamos que era precipitado <strong>la</strong>nzarnos a e<strong>la</strong>borar una <strong>de</strong>finición que forzosamente<br />

limitaría –a <strong>la</strong> par que enfocaría- el proyecto, y éramos conscientes que <strong>la</strong> fórmu<strong>la</strong> con <strong>la</strong> que diéramos<br />

aquellos primeros días sería modificada y ajustada a lo <strong>la</strong>rgo <strong>de</strong>l proceso. Pero necesitábamos un primer<br />

trazado, un primer dibujo <strong>de</strong> los márgenes <strong>de</strong> <strong>la</strong> parce<strong>la</strong> en <strong>la</strong> que queríamos movernos. Necesitábamos<br />

un problema.<br />

¿Para quién trabajamos?<br />

En realidad, no se trataba <strong>de</strong> inventar un problema imaginario. Tras nuestro dataset, existía un colectivo<br />

<strong>de</strong> profesionales que en su día a día lidiaba con los datos buscando respuestas que no siempre eran<br />

obvias: ellos tenían ya, <strong>de</strong> hecho, problemas reales que necesitaban soluciones reales.<br />

Así que contactamos con una responsable <strong>de</strong> <strong>la</strong> empresa para que nos ayudara a i<strong>de</strong>ntificar qué perfiles<br />

profesionales podían sacar provecho <strong>de</strong> nuestra <strong>visualización</strong>, cuáles eran sus responsabilida<strong>de</strong>s y qué<br />

tipo <strong>de</strong> conocimiento e información necesitaban conseguir. Utilizamos una técnica <strong>de</strong> diseño y usabilidad<br />

l<strong>la</strong>mada Personas y Escenarios para bajar al <strong>de</strong>talle esos usuarios potenciales, y localizar en qué<br />

situaciones y circunstancias iban a utilizar <strong>la</strong> <strong>visualización</strong>.<br />

Resumiendo, los usuarios potenciales que <strong>de</strong>tectamos fueron los siguientes:<br />

• Director financiero<br />

• Director <strong>de</strong> Marketing<br />

• Director <strong>de</strong> Ventas España<br />

• Responsable <strong>de</strong> Business Intelligence


2. Marcando los límites<br />

Brainstorming categorizado<br />

Sobre <strong>la</strong> puerta <strong>de</strong> un <strong>la</strong>vabo que<br />

muestra medio objeto gráfico, or<strong>de</strong>namos<br />

los pósits con todas <strong>la</strong>s<br />

i<strong>de</strong>as. La or<strong>de</strong>nación se realizó<br />

según el tipo <strong>de</strong> información que<br />

queríamos visualizar: ¿estructural?<br />

¿cuantitativa? ¿<strong>de</strong> re<strong>la</strong>ciones?<br />

Pue<strong>de</strong> leerse <strong>la</strong> totalidad <strong>de</strong>l trabajo realizado en <strong>la</strong>s entrevistas en el capítulo “Personas y Escenarios”<br />

<strong>de</strong>l anexo. En lo que afecta a Definición <strong>de</strong> problema, <strong>la</strong>s entrevistas fueron extremadamente útiles para<br />

<strong>de</strong>tectar qué tipo <strong>de</strong> conocimiento, información, y datos interesaba a cada uno <strong>de</strong> los usuarios. Las conclusiones<br />

se sintetizan en el diagrama <strong>de</strong> Venn que ilustra <strong>la</strong> página anterior.<br />

Ya sabíamos para quién trabajábamos y, <strong>de</strong> alguna manera, qué se esperaba <strong>de</strong> nosotros.<br />

“Y al principio fue el caos…”<br />

La lluvia <strong>de</strong> i<strong>de</strong>as <strong>de</strong>be ser una <strong>de</strong> <strong>la</strong>s técnicas <strong>de</strong> creatividad más conocidas, y su fama es merecida:<br />

barata e inspiradora, nos permitía imaginar <strong>de</strong>cenas <strong>de</strong> posibles problemas a visualizar con apenas<br />

unos pósits. Hicimos una sesión <strong>de</strong> 10 minutos que generó una trentena <strong>de</strong> opciones; <strong>la</strong> hora siguiente<br />

<strong>la</strong> <strong>de</strong>dicamos a enten<strong>de</strong>r<strong>la</strong>s, profundizar<strong>la</strong>s, or<strong>de</strong>nar<strong>la</strong>s y c<strong>la</strong>sificar<strong>la</strong>s. ¿Debíamos organizar<strong>la</strong>s por temas?<br />

¿Por el posible formato <strong>de</strong> <strong>la</strong>s visualizaciones? ¿Por nivel <strong>de</strong> complejidad?<br />

Leímos, releímos y <strong>de</strong>batimos los problemas hasta darnos cuenta <strong>de</strong> que nuestro problema real era que<br />

teníamos <strong>de</strong>masiados posibles problemas a resolver. Empezamos a imaginar una p<strong>la</strong>taforma suficientemente<br />

flexible para dar respuesta a todos: una <strong>visualización</strong> multipanel, interactiva, casi inteligente,<br />

que permitiera cualquier tipo <strong>de</strong> consulta y ofreciera el gráfico perfecto para resolver<strong>la</strong>, que exportara<br />

datos, que comparara, que te entendiera, que… ah, sí: que fuéramos capaces <strong>de</strong> convertir en realidad<br />

en 6 semanas. Definitivamente, teníamos que conseguir centrarnos en un eje concreto. Había que simplificar.<br />

25


2. Marcando los límites<br />

¿Qué le interesa por encima <strong>de</strong><br />

todo a una empresa?<br />

Narración visual ficticia (múltiplo<br />

gráfico <strong>de</strong> evolución temporal)<br />

entre los miembros <strong>de</strong>l proyecto.<br />

El pinganillo <strong>de</strong> Ricardo, omnipresente<br />

en nuestras conversaciones<br />

por Skype, es real.<br />

26<br />

Definiendo el problema<br />

El diálogo que se muestra en esta breve tira cómica es ficticio, pero <strong>de</strong> alguna manera ese era el caldo<br />

<strong>la</strong>tente cuando optamos por sacrificar <strong>la</strong> mayoría <strong>de</strong> los problemas imaginados y enfocarnos en mostrar<br />

<strong>la</strong>s <strong>ventas</strong> y el margen <strong>de</strong> beneficios para cada producto.<br />

Por una parte, nos era imposible resolver todo lo que nos habíamos p<strong>la</strong>nteado, y menos si queríamos<br />

aportar algo <strong>de</strong> valor gráfico en el camino. A<strong>de</strong>más, nos constaba que existían herramientas <strong>de</strong> Business<br />

Intelligence en el mercado (ver annexo) que ya permitían multitud <strong>de</strong> consultas y que, sin embargo,<br />

no estaban dando imágenes c<strong>la</strong>ras sobre aspectos básicos como <strong>la</strong> evolución <strong>de</strong> <strong>la</strong>s <strong>ventas</strong> por familias.<br />

Por otra parte, según <strong>la</strong>s respuestas <strong>de</strong> nuestras Personas, su día a día les exigía i<strong>de</strong>as y números<br />

c<strong>la</strong>ros a problemas muy concretos: ¿cuánto estamos vendiendo? (<strong>ventas</strong>), ¿cuánto estamos vendiendo<br />

<strong>de</strong> este producto? (<strong>ventas</strong> por línea <strong>de</strong> producto, al <strong>de</strong>talle), ¿eso es más o menos que antes? (evolución<br />

temporal y comparativa), ¿dón<strong>de</strong> se ha vendido? (información geográfica – por área <strong>de</strong> <strong>ventas</strong>). Habían<br />

otros problemas, pero quedaban fuera <strong>de</strong> nuestras posibilida<strong>de</strong>s: fuera por falta <strong>de</strong> datos (información<br />

diaria) o capacida<strong>de</strong>s (a<strong>la</strong>rmas por clientes).<br />

Tras horas <strong>de</strong> <strong>de</strong>bates en múltiples p<strong>la</strong>taformas, este fue el problema que esbozamos:<br />

El problema<br />

Visualizar <strong>la</strong>s <strong>ventas</strong> y el margen <strong>de</strong> los productos <strong>de</strong> <strong>la</strong> empresa cata<strong>la</strong>na <strong>de</strong> óptica para ayudar a <strong>de</strong>tectar<br />

oportunida<strong>de</strong>s y reconocer patrones <strong>de</strong> negocio geográficos y <strong>de</strong> categoría.<br />

Dominio <strong>de</strong> aplicación<br />

España, un año dividido en meses y trimestres, todas <strong>la</strong>s familias <strong>de</strong> producto.<br />

Complejidad<br />

Por provincias, por regiones, por equipo <strong>de</strong> <strong>ventas</strong>, por tipo <strong>de</strong> producto, por trimestre. Nos centraremos<br />

en Valor Neto <strong>de</strong> <strong>la</strong> transacción y Margen <strong>de</strong> <strong>la</strong> misma (VEA)<br />

Suposiciones<br />

La tipología y <strong>la</strong>s necesida<strong>de</strong>s ocu<strong>la</strong>res <strong>de</strong> <strong>la</strong> pob<strong>la</strong>ción son homogéneas. Se usa el dato <strong>de</strong>rivado <strong>de</strong><br />

<strong>ventas</strong>/pob<strong>la</strong>ción para mostrar diferencias.<br />

Nunca nos habíamos alegrado tanto <strong>de</strong> tener, por fin, un problema.


3<br />

se busca metáfora visual<br />

De cómo dimos <strong>la</strong> vuelta al mundo para<br />

encontrar una metáfora y finalmente<br />

volver al punto <strong>de</strong> partida


3. Se busca metáfora visual<br />

28<br />

Pronto empezamos a trabajar en <strong>la</strong> <strong>de</strong>finición <strong>de</strong> una metáfora visual única que, i<strong>de</strong>almente, nos serviría<br />

<strong>de</strong> referente para el mapeo visual <strong>de</strong> todo el proyecto, tanto <strong>de</strong> <strong>la</strong> <strong>visualización</strong> final como <strong>de</strong> <strong>la</strong> documentación.<br />

<strong>Una</strong> i<strong>de</strong>a transversal que lo empapara y sustentara todo, dándole coherencia y c<strong>la</strong>ridad: un<br />

tronco firme al que agarrarse.<br />

P<strong>la</strong>nta un árbol<br />

En honor a <strong>la</strong> verdad, <strong>la</strong> metáfora <strong>de</strong>l árbol estuvo encima <strong>de</strong> <strong>la</strong> mesa <strong>de</strong>s<strong>de</strong> el principio. El día que nos<br />

encontramos para hacer un brainstorming y empezar a esbozar una <strong>de</strong>finición <strong>de</strong> problema, alguien habló<br />

ya <strong>de</strong> árboles. Queríamos encontrar una manera <strong>de</strong> ver volúmenes <strong>de</strong> <strong>ventas</strong> que crecen o <strong>de</strong>crecen<br />

en el tiempo, y a <strong>la</strong> vez, mostrar esa información para cada una <strong>de</strong> <strong>la</strong>s posibles ramas <strong>de</strong> producto que<br />

tenía <strong>la</strong> empresa…<br />

¿Dijimos ramas? Sí: suponemos que <strong>la</strong> complejidad <strong>de</strong> <strong>la</strong> estructura jerárquica <strong>de</strong> productos <strong>de</strong>l dataset<br />

nos llevó muy pronto a intentar enten<strong>de</strong>r<strong>la</strong>, visualmente, como un árbol ramificado. Al fin y al cabo los<br />

árboles son, por naturaleza y tradición, una <strong>de</strong> <strong>la</strong>s primeras maneras <strong>de</strong> representar familias <strong>de</strong> forma<br />

gráfica. La metáfora es perfecta: un tronco común <strong>de</strong>l que todo parte, que se eleva para ramificarse en<br />

distintos tipos <strong>de</strong> producto que, aunque <strong>de</strong>rivan <strong>de</strong> un padre común, toman distintas formas y valores.<br />

¿Qué era nuestro dataset, sino un conjunto <strong>de</strong> valores para una familia <strong>de</strong> productos?<br />

Pero a su vez, esos valores a representar no eran estáticos: teníamos información <strong>de</strong>sglosada a lo<br />

<strong>la</strong>rgo <strong>de</strong> un año, con todos y cada uno <strong>de</strong> sus meses. De entre todos los valores, habíamos <strong>de</strong>cidido<br />

centrarnos en los que nos parecían más relevantes para los usuarios: volumen <strong>de</strong> <strong>ventas</strong> en unida<strong>de</strong>s<br />

físicas, <strong>ventas</strong> netas y margen <strong>de</strong> beneficios. O en términos más conceptuales: queríamos representar,<br />

por un <strong>la</strong>do, dos cifras absolutas, que podían crecer en una esca<strong>la</strong> sin límites y que indicaban cantidad,<br />

volumen, presencia <strong>de</strong>l producto en el mercado; y por otro <strong>la</strong>do teníamos un porcentaje, que podía variar<br />

pero siempre <strong>de</strong>ntro <strong>de</strong> una esca<strong>la</strong> cerrada (0-100%), y que <strong>de</strong> alguna manera representaba <strong>la</strong> calidad<br />

<strong>de</strong> <strong>la</strong> venta <strong>de</strong> un producto concreto respecto a <strong>la</strong> calidad media <strong>de</strong>l conjunto.<br />

Teníamos, por tanto, valores dinámicos, que evolucionaban, pero que siempre hacían referencia a una<br />

estructura estática y jerárquica. Necesitábamos una imagen gráfica que nos permitiera crear una estructura<br />

fija y jerárquica, y que a <strong>la</strong> vez nos permitiera codificar sobre el<strong>la</strong> valores cambiantes. Es difícil<br />

<strong>de</strong>terminar cómo nuestras conexiones neuronales asociaron ese mo<strong>de</strong>lo abstracto con un árbol, pero <strong>la</strong><br />

i<strong>de</strong>a estaba ahí: los patrones encajaban, y parecía que habíamos encontrado nuestra metáfora. El tronco<br />

y <strong>la</strong>s ramas podían representar <strong>la</strong> estructura <strong>de</strong> productos; el volumen <strong>de</strong> hojas, <strong>la</strong> cantidad <strong>de</strong> <strong>ventas</strong>, y<br />

el color <strong>de</strong> <strong>la</strong>s hojas, el margen <strong>de</strong> beneficio. A<strong>de</strong>más, un árbol que florece o se marchita es una metáfora<br />

<strong>orgánica</strong> inmediata que está más allá <strong>de</strong> cualquier codificación cultural específica: universalmente<br />

comprensible sin necesidad <strong>de</strong> instrucciones, conecta directamente con nuestros instintos vitales, y…<br />

Pero, alto: ¿un árbol que florece, en serio? ¿Qué tipo <strong>de</strong> gráfico es ese? ¿Lo has visto alguna vez en<br />

Flowing Data? Y a<strong>de</strong>más: ¿habíamos encontrado una metáfora a <strong>la</strong> primera? ¿El primer día? De repente,<br />

todo nos pareció una i<strong>de</strong>a <strong>de</strong>scabel<strong>la</strong>da. Así que recogimos <strong>la</strong>s hojas, <strong>la</strong>s guardamos en un cajón, y <strong>de</strong>cidimos<br />

centrarnos en buscar alternativas.


3. Se busca metáfora visual<br />

Isotipo / Sparkline ADN<br />

Codificamos visualmente en un<br />

único gráfico icónico los valores<br />

<strong>de</strong> venta, coste y margen <strong>de</strong> un<br />

producto, intentando crear una<br />

imagen rápidamente i<strong>de</strong>ntificable<br />

para cada producto.<br />

Exploratory Metaphora Analysis (EMA)<br />

Entramos entonces en una fase errática en busca <strong>de</strong> <strong>la</strong> <strong>visualización</strong> perfecta que nos llevó a rastrear<br />

blogs <strong>de</strong> todo pe<strong>la</strong>je, a revisar gráficos clásicos, per<strong>de</strong>rnos en interactivos, repasar tab<strong>la</strong>s <strong>de</strong> elección y<br />

alumbrar i<strong>de</strong>as <strong>de</strong> todo tipo. Entre otros, contemp<strong>la</strong>mos:<br />

• Diagramas <strong>de</strong> re<strong>la</strong>ción, que nos permitieran ver <strong>la</strong> organización y complejidad <strong>de</strong> los productos<br />

(familias, materiales, tratamientos) y su re<strong>la</strong>ción con su volumen <strong>de</strong> <strong>ventas</strong>.<br />

• Matrices comparativas, para ver <strong>la</strong> re<strong>la</strong>ción entre <strong>la</strong>s <strong>ventas</strong> <strong>de</strong> un producto y un ven<strong>de</strong>dor.<br />

• Heatmaps que nos permitieran codificar información geográfica sobre <strong>la</strong>s <strong>ventas</strong> y los beneficios.<br />

• Sparklines o Isotipos para codificar <strong>la</strong>s <strong>ventas</strong> en el tiempo y ofrecer pequeñas gráficas <strong>de</strong> ten<strong>de</strong>ncia<br />

que acompañaran a otros gráficos principales.<br />

Entre <strong>la</strong>s i<strong>de</strong>as barajadas, hubo una que <strong>de</strong>sarrol<strong>la</strong>mos más que el resto: el ADN <strong>de</strong> producto.<br />

Un ADN económico<br />

Inspirados en <strong>la</strong>s Sparklines <strong>de</strong> Tufte, que grafican un concepto que luego pue<strong>de</strong> ser utilizado <strong>de</strong>ntro <strong>de</strong><br />

múltiples discursos, y en los isotypes <strong>de</strong> Otto Neurath, que se repiten a sí mismos lo necesario hasta<br />

representar una cantidad <strong>de</strong>terminada, pensamos en crear algo así como un icono visual para cada producto:<br />

un DNI, un ADN, un gráfico propio que i<strong>de</strong>ntificara económicamente un producto y lo diferenciara<br />

<strong>de</strong>l resto. Y no se trataba <strong>de</strong> inventar un símbolo al azar: queríamos crear ese ADN codificando los tres<br />

valores que para nosotros más <strong>de</strong>finían <strong>la</strong> esencia <strong>de</strong> un producto en el mercado: <strong>la</strong> familia a <strong>la</strong> que<br />

pertenecía, su venta neta y su margen <strong>de</strong> beneficio.<br />

¿Cómo codificar esos 3 datos? Pensamos en crear algo parecido a unas pequeñas piezas <strong>de</strong> Lego que<br />

pudieran incorporar los 3 elementos. La familia es un elemento categórico: por lo tanto, siguiendo <strong>la</strong>s<br />

enseñanzas <strong>de</strong> Cynthia Brewer (o incluso el más purista Jacques Bertin), podíamos codificar<strong>la</strong>s con<br />

distintos colores. Las <strong>ventas</strong> podían representarse con el tamaño <strong>de</strong> <strong>la</strong> ficha, y el margen, con el tamaño<br />

<strong>de</strong> un rectángulo contenido <strong>de</strong>ntro <strong>de</strong> <strong>la</strong> ficha acotado por el coste total: al fin y al cabo, el margen es un<br />

tanto por ciento <strong>de</strong>l total, lo que gráficamente pue<strong>de</strong> enten<strong>de</strong>rse como una porción <strong>de</strong> un todo.<br />

Sin embargo, al p<strong>la</strong>smarlo visualmente, <strong>la</strong> simu<strong>la</strong>ción <strong>de</strong> un posible resultado <strong>de</strong>l análisis nos convenció<br />

que el output final sería <strong>de</strong>masiado cacofónico para po<strong>de</strong>r extraer información útil <strong>de</strong> negocio.<br />

29


3. Se busca metáfora visual<br />

Gráfico Multipanel<br />

Los primeros prototipos <strong>de</strong> multipanel<br />

se enfocaron en intentar<br />

encontrar un espacio en don<strong>de</strong> <strong>la</strong><br />

interactividad y el linked brushing<br />

fueran posibles. ractividad reforzada<br />

con Linked Brushing.<br />

30<br />

Multipanel: show them all<br />

Algunos <strong>de</strong> esos gráficos cubrían con elegancia problemas parciales que habíamos <strong>de</strong>scartado inicialmente,<br />

haciéndonos rep<strong>la</strong>ntear que quizá <strong>la</strong> <strong>visualización</strong> i<strong>de</strong>al <strong>de</strong>bía ser multipanel: nos permitiría<br />

ofrecer distintos gráficos que cubrieran todos los posibles problemas esbozados, y a <strong>la</strong> vez podríamos<br />

trabajar en una navegación interactiva <strong>de</strong> focus & context y linked brushing, algo que parecía más que<br />

<strong>de</strong>seable dada <strong>la</strong> cascada ingente <strong>de</strong> datos que se nos venía encima.<br />

Sin embargo, ese linked brushing, que nos permitiría mantener <strong>la</strong> consistencia <strong>de</strong>l producto a visualizar<br />

(familia, subfamilia, región…) en los distintos paneles a <strong>la</strong> vez, ofrecía alguna complicación técnica. Así<br />

que, manteniendo un ojo siempre c<strong>la</strong>vado en el calendario, nos p<strong>la</strong>teamos dos escenarios posibles:<br />

• Ofrecer datos interactivos, atacando directamente a <strong>la</strong> BBDD según los campos que quisiera visualizar<br />

el usuario, y graficar el resultado en tiempo real.<br />

• Simu<strong>la</strong>r <strong>la</strong> interactividad con prototipos animados (Axure), y ofrecer algunos gráficos concretos<br />

pre-generados como ejemplo.<br />

El principal reto seguía sobre <strong>la</strong> mesa: ¿cómo integrar los distintos gráficos en un único multipanel<br />

navegable?<br />

Un Frankenstein y un Jackpot<br />

A ver si consigo explicarlo.<br />

Nos gustaba <strong>la</strong> metáfora <strong>de</strong>l árbol porque nos permitía ofrecer simultáneamente, en un eje vertical con<br />

su posible implicación jerárquica, información <strong>de</strong> distintos niveles <strong>de</strong> producto: genérica (familia), <strong>de</strong><br />

nivel intermedio (subfamilia) y <strong>de</strong> <strong>de</strong>talle (producto concreto).<br />

Como no conocíamos un software capaz <strong>de</strong> hacer eso <strong>de</strong> manera <strong>orgánica</strong> y elegante, <strong>la</strong> propuesta que<br />

surgió tras muchos <strong>de</strong>bates fue crear un gráfico multipanel en el que se mostraran 3 paneles alineados<br />

verticalmente: tres “cajas”, una encima <strong>de</strong> <strong>la</strong> otra, que mostraran 3 gráficos sobre los 3 niveles <strong>de</strong> <strong>la</strong><br />

familia <strong>de</strong> productos.


3. Se busca metáfora visual<br />

Frankenstein + Jackpot<br />

Combinación <strong>de</strong> una estructura<br />

jerárquica vertical y temporal<br />

horizontal.<br />

De esta manera, manteníamos <strong>de</strong> alguna forma el concepto <strong>de</strong> “árbol” vertical que parte <strong>de</strong> un nivel<br />

jerárquico más general y va creciendo especializándose en niveles jerárquicos inferiores. En cada nivel,<br />

un gráfico distinto. Por eso lo bautizamos como el Frankenstein: porque era un gráfico multipanel que<br />

en realidad mostraba información sobre una misma familia <strong>de</strong> producto. Era una unidad construida con<br />

distintos gráficos/pedazos <strong>de</strong> puntos <strong>de</strong> vista.<br />

Cada caja podía mostrar exactamente el mismo tipo <strong>de</strong> gráfico pero con diferentes campos, <strong>de</strong> más<br />

agregado (abajo=tronco) a más <strong>de</strong>sagregado (arriba=hojas). O bien podía mostrarse un tipo <strong>de</strong> gráfico<br />

distinto en cada nivel, a conveniencia <strong>de</strong>l usuario. ¿Qué tipo <strong>de</strong> gráficos podíamos ofrecer? No llegamos<br />

a concretarlo mucho, pero podría ser una colección <strong>de</strong> gráficos sankey, o <strong>de</strong> treemaps, o…<br />

En cualquier caso, ese Frankenstein vertical podía verse completado siempre por una estructura horizontal<br />

que nos diera información <strong>de</strong> <strong>la</strong> evolución temporal: una especie <strong>de</strong> Jackpot que replicara en<br />

3 cajas el gráfico <strong>de</strong> uno <strong>de</strong> los niveles, ofreciendo los datos para un período <strong>de</strong> tiempo distinto en cada<br />

uno.<br />

El resultado era una estructura en forma <strong>de</strong> T horizontal, que el usuario podría personalizar para crear una<br />

historia tanto vertical (análisis y <strong>de</strong>sglose en profundidad), como horizontal (análisis <strong>de</strong> secuencia temporal).<br />

Este esquema, a<strong>de</strong>más, era suficientemente versátil como para funcionar en cualquier cultura, fuera<br />

cual fuera su or<strong>de</strong>n <strong>de</strong> lectura habitual (vertical u horizontal, <strong>de</strong> izquierda a <strong>de</strong>recha o <strong>de</strong> <strong>de</strong>recha a izquierda).<br />

Bastaría con configurarlo para i<strong>de</strong>ntificar en qué eje <strong>de</strong>be estar <strong>la</strong> línea temporal y en qué eje<br />

<strong>la</strong> <strong>de</strong> profundidad, y mover los paneles a conveniencia.<br />

Técnicamente, a<strong>de</strong>más, parecía re<strong>la</strong>tivamente sencillo incrustar gráficos en ese esquema. Cada gráfico<br />

podía ser editable, <strong>de</strong> manera que el usuario elegiría tanto el tipo <strong>de</strong> gráfico como <strong>la</strong>s variables que se<br />

incluyen. Y a su vez, podía añadirse una opción para ver cualquiera <strong>de</strong> los minigráficos a pantal<strong>la</strong> completa<br />

y ofrecer así una inspección más cómoda y <strong>de</strong>tal<strong>la</strong>da.<br />

Sin embargo… ¿íbamos a ser capaces <strong>de</strong> generar esa inmensa colección <strong>de</strong> gráficos disponibles que parecía<br />

pedir el proyecto? Estábamos volviendo a intentar crear una herramienta absolutamente flexible<br />

que cubriera cualquier necesidad, que lo abarcara todo, <strong>de</strong>jando un escenario abierto, sin <strong>de</strong>finir, sin<br />

una orientación. En <strong>de</strong>finitiva: estábamos <strong>de</strong>jando en manos <strong>de</strong>l usuario el trabajo <strong>de</strong> i<strong>de</strong>ntificar qué variables<br />

le iban a aportar valor y, lo que era seguramente más arriesgado e injusto, le estábamos <strong>de</strong>jando<br />

a él <strong>la</strong> responsabilidad <strong>de</strong> saber con qué tipo <strong>de</strong> representación gráfica iba a hal<strong>la</strong>r una imagen que le<br />

aportara conocimiento.<br />

31


3. Se busca metáfora visual<br />

Momento <strong>de</strong> Crisis<br />

Demasiadas opciones sobre<br />

<strong>la</strong> mesa.<br />

32<br />

En ese escenario, ¿qué papel jugábamos nosotros como teóricos, conceptualizadores y orientadores<br />

gráficos? Decidimos que era prioritario reorientar nuestros pasos para ofrecer un foco c<strong>la</strong>ro.<br />

Crisis, waffles y vuelta a <strong>la</strong>s raíces<br />

Ahora estamos en ese momento crítico que tienen todos los proyectos...<br />

Ya lo verás por los mails.<br />

Necesitábamos limpiar <strong>la</strong> mesa y tomar una <strong>de</strong>terminación en firme para empezar a trabajar. Y, a ser<br />

posible, una <strong>de</strong>terminación que fuera técnicamente factible, visualmente correcta y empresarialmente<br />

útil. Y fue en ese estadio <strong>de</strong> angustia creciente don<strong>de</strong>, casi en sueños, una noche se nos apareció el<br />

Wafflegram.<br />

Nuestra propuesta <strong>de</strong> Wafflegram fue un intento <strong>de</strong> simplificación y foco ante todo el ruido que habíamos<br />

generado. Se trataba <strong>de</strong> mostrar <strong>la</strong>s <strong>ventas</strong> <strong>de</strong> cada familia <strong>de</strong> subproductos por provincia a través<br />

<strong>de</strong> waffle charts: rectángulos compuestos <strong>de</strong> pequeños cuadrados que codificaran un volumen <strong>de</strong> venta<br />

fijo.<br />

Un Waffle no <strong>de</strong>ja <strong>de</strong> ser una versión revisada <strong>de</strong> un gráfico <strong>de</strong> barras en <strong>la</strong> que <strong>la</strong> célu<strong>la</strong> individual que<br />

compone el waffle tiene un sentido económico que pue<strong>de</strong> ser útil para el analista (p.ej. 100m € <strong>de</strong> <strong>ventas</strong><br />

o beneficios) pudiendo llegar a mostrar datos contextuales <strong>de</strong> cada una <strong>de</strong> esas célu<strong>la</strong>s (p.ej. geografía<br />

a <strong>la</strong> que pertenece esa venta).<br />

La longitud <strong>de</strong>l rectángulo codificaría el volumen <strong>de</strong> venta; el color <strong>de</strong>l cuadrado, el trimestre en que se<br />

había producido. Los waffles conformarían una tab<strong>la</strong> en <strong>la</strong> que en el eje vertical se situaran <strong>la</strong>s provincias,<br />

y en el horizontal, <strong>la</strong>s familias.<br />

Previmos dos tipos <strong>de</strong> or<strong>de</strong>naciones, para ayudar a <strong>la</strong> comparativa: una or<strong>de</strong>nación alfabética <strong>de</strong> <strong>la</strong>s<br />

provincias, para buscar casos concretos más fácilmente, y una or<strong>de</strong>nación <strong>de</strong> mayor a menor volumen<br />

<strong>de</strong> <strong>ventas</strong>.<br />

Para añadir valor, propusimos calcu<strong>la</strong>r un dato <strong>de</strong>rivado que no se encuentra en el dataset: <strong>la</strong> <strong>de</strong>sviación<br />

absoluta respecto el valor estadístico esperado (si ambas variables fuesen in<strong>de</strong>pendientes). La cifra <strong>de</strong>


3. Se busca metáfora visual<br />

Wafflegram<br />

Gráfico catártico que pretendía<br />

ser simple a <strong>la</strong> par que útil para<br />

el analista<br />

venta esperada para cada producto en cada provincia se calcu<strong>la</strong> teniendo en cuenta el porcentaje <strong>de</strong><br />

<strong>ventas</strong> sobre el total que representa ese producto, y el porcentaje <strong>de</strong> <strong>ventas</strong> sobre el total que tienen<br />

lugar en esa provincia. Con esas dos cifras <strong>de</strong> referencia, se pue<strong>de</strong> <strong>de</strong>ducir cuál sería el porcentaje estadísticamente<br />

esperado <strong>de</strong> <strong>ventas</strong> <strong>de</strong> ese producto en esa provincia: lo previsible.<br />

Valor esperado= % total fi<strong>la</strong> x % total columna x Suma total <strong>de</strong> <strong>la</strong>s <strong>ventas</strong> (o el margen) ->Ej: %<strong>ventas</strong><br />

Área Sur x % <strong>ventas</strong> Progresivos x Ventas Totales<br />

Si resulta que en realidad <strong>la</strong>s <strong>ventas</strong> son sensiblemente mayores o menores a ese porcentaje, significa<br />

que existe alguna corre<strong>la</strong>ción específica entre esa provincia y ese producto que está afectando a <strong>la</strong>s<br />

<strong>ventas</strong>, para bien o para mal.<br />

Se trata <strong>de</strong>l mismo principio que, en <strong>la</strong> última parte <strong>de</strong>l reciente proyecto <strong>de</strong> Moritz Stefaner, se usa para<br />

reflejar re<strong>la</strong>ciones entre ingredientes <strong>de</strong> muesli superiores a <strong>la</strong>s esperadas en función <strong>de</strong> <strong>la</strong> presencia<br />

<strong>de</strong> cada ingrediente por separado. http://moritz.stefaner.eu/projects/musli-ingredient-network/<br />

Creíamos que ése era un camino útil y posible y, como tal, lo llevamos a audiencia en una <strong>de</strong> <strong>la</strong>s presentaciones<br />

parciales <strong>de</strong>l proyecto, junto al árbol, el ADN y el Frankenstein / Jackpot y. Y allí, al exponer <strong>la</strong>s<br />

opciones ante el público, empezaron a aparecer nuevos argumentos que no habíamos tenido en cuenta<br />

los últimos días.<br />

Entre todas <strong>la</strong>s opciones gráficas, el árbol era el que parecía enten<strong>de</strong>rse inmediatamente, <strong>de</strong> manera<br />

natural, sin necesidad <strong>de</strong> explicaciones ni aprendizaje específico: <strong>la</strong> <strong>de</strong>scodificación <strong>de</strong> <strong>la</strong> vitalidad <strong>de</strong><br />

<strong>la</strong>s distintas ramas era inmediata, y el mensaje no ofrecía ambigüeda<strong>de</strong>s. A<strong>de</strong>más, parecía que <strong>la</strong> originalidad<br />

<strong>de</strong>l gráfico aportaba un valor académico; si <strong>la</strong>s dificulta<strong>de</strong>s técnicas no nos permitían hacerlo<br />

totalmente funcional, al menos habríamos <strong>de</strong>sarrol<strong>la</strong>do un nuevo mo<strong>de</strong>lo que podía ser pulido y perfeccionado<br />

con el tiempo. Ciertamente, limitaba el tipo <strong>de</strong> datos que íbamos a po<strong>de</strong>r generar, pero aunque<br />

fuera parcial, cubría satisfactoriamente <strong>la</strong> <strong>de</strong>finición <strong>de</strong> problema que nos habíamos propuesto: ayudar<br />

a <strong>de</strong>tectar patrones en <strong>la</strong>s <strong>ventas</strong> y márgenes <strong>de</strong> los distintos productos.<br />

Así que <strong>de</strong>scartamos el resto <strong>de</strong> opciones y volvimos <strong>de</strong> nuevo a <strong>la</strong>s raíces.<br />

33


3. Se busca metáfora visual<br />

34


4<br />

codificación visual<br />

O <strong>la</strong> explicación razonada <strong>de</strong> porqué,<br />

mi<strong>la</strong>grosamente, los datos cobran vida en<br />

forma <strong>de</strong> árbol


4. Codificación visual<br />

36<br />

La elección <strong>de</strong>l árbol como metáfora <strong>orgánica</strong> era original en <strong>la</strong> misma medida que arriesgada. Construir<br />

algo <strong>de</strong> cero es una oportunidad para <strong>de</strong>finir un nuevo mo<strong>de</strong>lo que se acerque más que ninguno<br />

previo a lo que uno aspira; o al menos, que se le acerque <strong>de</strong> una manera distinta, novedosa, que co<strong>la</strong>bore<br />

a construir conocimiento. Sin embargo, esa misma oportunidad implica que el reto es mayor: no hay<br />

documentación, no hay código, no hay mo<strong>de</strong>los a los que evaluar y tomar como referencia; no existe una<br />

base <strong>de</strong> trabajo hecha sobre <strong>la</strong> que auparse y tomar impulso. Aún así, <strong>la</strong> posibilidad <strong>de</strong> <strong>de</strong>finir un mo<strong>de</strong>lo<br />

a medida, aunque fuera <strong>de</strong> manera teórica y aproximativa, nos parecía que aportaba valor y que sería un<br />

buen ejercicio para testear nuestros conocimientos.<br />

Valores y atributos: baile <strong>de</strong> parejas<br />

Lo <strong>de</strong> <strong>la</strong>s proporciones y eso... tú mismo... 'que que<strong>de</strong>n naturales a <strong>la</strong> par que chic'.<br />

Teníamos esa i<strong>de</strong>a general <strong>de</strong> que nuestra metáfora base <strong>de</strong>bía ser un árbol: un elemento orgánico, con<br />

una estructura y un comportamiento fácil <strong>de</strong> compren<strong>de</strong>r en todos los ámbitos y culturas. Y sabíamos<br />

que queríamos codificar <strong>la</strong> vitalidad <strong>de</strong> <strong>la</strong>s <strong>ventas</strong> <strong>de</strong> <strong>la</strong> empresa cata<strong>la</strong>na a través <strong>de</strong> <strong>la</strong> vitalidad <strong>de</strong> ese<br />

árbol metafórico: el árbol <strong>de</strong>bía parecer más vivo cuanto más vivas fueran <strong>la</strong>s <strong>ventas</strong> y los beneficios.<br />

Valores<br />

Así que nos pusimos a listar los posibles valores que nos parecía interesante codificar para cada producto,<br />

y concluimos:<br />

Valores numéricos:<br />

• Unida<strong>de</strong>s vendidas (UNF)<br />

• #SKUs (o referencias)<br />

• Venta neta (VN)<br />

• Margen <strong>de</strong> beneficio (VEA)<br />

Valores categóricos:<br />

• Material<br />

• Foco<br />

• Tratamiento<br />

• Marca<br />

Valores temporales:<br />

• Evolución temporal<br />

Valores geocodificados:<br />

• Distribución geográfica por provincias<br />

Variables numéricas <strong>de</strong>rivadas:<br />

• Ventas/Margen per cápita<br />

• % margen (VEA/VN)<br />

• % <strong>ventas</strong> o margen sobre total Ventas<br />

Algunos eran datos numéricos (UNF, VN, VEA) y otros categóricos (material, foco, tratamiento, marca),<br />

y lo que estábamos pretendiendo mostrar, en realidad, eran <strong>la</strong>s re<strong>la</strong>ciones entre ambos.<br />

Sabíamos que a<strong>de</strong>más querríamos mostrar esas re<strong>la</strong>ciones cruzadas con otras dos dimensiones: <strong>la</strong><br />

temporal y <strong>la</strong> geográfica, que se superponían transversalmente sobre todos los datos. Fuera <strong>la</strong> que<br />

fuera <strong>la</strong> manera en que visualizáramos los valores <strong>de</strong> <strong>ventas</strong>, unida<strong>de</strong>s y márgenes para <strong>la</strong>s distintas<br />

categorías <strong>de</strong> productos, teníamos que encontrar <strong>la</strong> forma <strong>de</strong> ofrecer esa imagen para distintas geografías<br />

a <strong>la</strong> vez y para distintos períodos <strong>de</strong> tiempo a <strong>la</strong> vez. Había que permitir <strong>la</strong> comparación temporal y<br />

espacial.


4. Codificación visual<br />

Esbozos iniciales.<br />

Posible matriz codificando el volumen<br />

<strong>de</strong> <strong>ventas</strong> en cada región<br />

según el tipo <strong>de</strong> foco.<br />

Atributos<br />

Para listar los atributos, empezamos por dibujar un árbol que nos permitiera i<strong>de</strong>ntificar con c<strong>la</strong>ridad los<br />

atributos visuales con los que podíamos contar. Ésta fue <strong>la</strong> lista:<br />

• Longitud tronco<br />

• Grosor tronco<br />

• Longitud rama<br />

• Grosor rama<br />

• Orientación <strong>de</strong> <strong>la</strong> rama (grado <strong>de</strong> inclinación respeto un eje p<strong>la</strong>no)<br />

• Posición <strong>de</strong> <strong>la</strong> rama en <strong>la</strong> copa (arriba-abajo, izquierda-<strong>de</strong>recha, secuencia <strong>de</strong> or<strong>de</strong>nación…<br />

¿podríamos <strong>de</strong>finir cuadrantes interpretativos?)<br />

• Subniveles <strong>de</strong> ramas (tronco – rama principal – subrama 1 – subrama 2)<br />

• Distribución <strong>de</strong> <strong>la</strong>s ramas a lo <strong>la</strong>rgo <strong>de</strong>l tronco (tipo can<strong>de</strong><strong>la</strong>bro, tipo pino, tipo arbusto)<br />

• Número <strong>de</strong> hojas<br />

• Tamaño (área) <strong>de</strong> <strong>la</strong>s hojas<br />

• Ubicación <strong>de</strong> <strong>la</strong> hoja en <strong>la</strong> rama (<strong>la</strong>do superior|inferior, <strong>la</strong>do izquierdo|<strong>de</strong>recho)<br />

• Color <strong>de</strong> <strong>la</strong>s hojas<br />

• Movimiento / pulso hojas<br />

¿Cómo mapear valores y atributos <strong>de</strong> manera que tuvieran sentido? Otros antes que nosotros se habían<br />

p<strong>la</strong>nteado el gran dilema, así que acudimos a los clásicos: Bertin & Brewer. Con sus tab<strong>la</strong>s y conclusiones<br />

en una mano y el árbol y el dataset en <strong>la</strong> otra, construimos una serie <strong>de</strong> bocetos iniciales, explorando<br />

<strong>la</strong>s posibles codificaciones.<br />

Datos categóricos<br />

• Material<br />

• Foco<br />

• Tratamiento<br />

• Marca<br />

• Subniveles <strong>de</strong> ramas<br />

• Distribución <strong>de</strong> <strong>la</strong>s ramas a lo <strong>la</strong>rgo <strong>de</strong>l tronco<br />

• Posición <strong>de</strong> <strong>la</strong> rama en <strong>la</strong> copa<br />

Teníamos cuatro datos categóricos que <strong>de</strong>terminaban a qué gran<strong>de</strong>s conjuntos pertenecían nuestros<br />

productos: ¿<strong>de</strong> qué material estaban hechos?, ¿qué foco tenían?, ¿qué tratamiento?, ¿a qué marca pertenecían?<br />

La c<strong>la</strong>sificación <strong>de</strong> los productos en estos grupos generaba una jerarquía <strong>de</strong> subconjuntos<br />

re<strong>la</strong>tivamente compleja, cada uno con sus datos correspondientes, y <strong>de</strong> ahí había nacido nuestra i<strong>de</strong>a<br />

<strong>de</strong> estructurar los datos en un elemento que nos permitiera hacer ramificaciones representando esa<br />

jerarquía.<br />

37


4. Codificación visual<br />

Ilustración can<strong>de</strong><strong>la</strong>bro vs. pino<br />

La ilustración muestra cómo crecerían<br />

<strong>la</strong>s ramas en el espacio<br />

con dos tipos <strong>de</strong> distribuciones<br />

diferentes. El espacio que correspon<strong>de</strong><br />

a cada uno <strong>de</strong> los subniveles<br />

jerárquicos se distribuye<br />

verticalmente en el can<strong>de</strong><strong>la</strong>bro y<br />

horizontalmente en el pino.<br />

38<br />

De tal tronco, tal rama<br />

El árbol suele partir <strong>de</strong> un tronco central (el nodo padre) que se va ramificando en un primer nivel (nodos<br />

hijos) que pue<strong>de</strong>n tener un tercer y cuarto nivel <strong>de</strong> subramificación (nodos nietos y bisnietos). Parecía<br />

natural, entonces, que codificáramos <strong>la</strong> pertenencia a estos conjuntos mediante los distintos niveles y<br />

subniveles <strong>de</strong> <strong>la</strong>s ramas.<br />

Distribuciones<br />

Nos p<strong>la</strong>nteamos si nos convenía más una distribución tipo can<strong>de</strong><strong>la</strong>bro, en <strong>la</strong> que ramas <strong>de</strong> un mismo<br />

nivel jerárquico nacen todas a <strong>la</strong> misma altura (<strong>la</strong> jerarquía se <strong>de</strong>fine verticalmente) o una distribución<br />

tipo pino, en <strong>la</strong> que ramas <strong>de</strong> un mismo nivel jerárquico se distribuyen a lo <strong>la</strong>rgo <strong>de</strong>l tronco para ramificarse<br />

expansivamente (<strong>la</strong> jerarquía se <strong>de</strong>fine horizontalmente). El pino podía ayudarnos a distribuir<br />

mejor los elementos en el espacio y evitar aglomeraciones en <strong>la</strong> copa, pero a efectos <strong>de</strong> comparación,<br />

<strong>la</strong> verticalidad ofrecía un eje común en el que resultaba mucho más sencillo comparar productos <strong>de</strong> un<br />

mismo nivel.<br />

Sin embargo, habiendo aceptado que <strong>la</strong> or<strong>de</strong>nación jerárquica nos permitiría hacer comparativas <strong>de</strong><br />

gran<strong>de</strong>s conjuntos y <strong>de</strong> productos <strong>de</strong>terminados a <strong>la</strong> vez, <strong>la</strong> duda asaltaba <strong>de</strong> nuevo. ¿Cuál <strong>de</strong>bía ser el<br />

or<strong>de</strong>n <strong>de</strong> esa jerarquía? La realidad era que <strong>la</strong> estructura <strong>de</strong> los datos no encasil<strong>la</strong>ba a unos nodos a ser<br />

padres y a otros a ser hijos. El hecho <strong>de</strong> que casi todos los productos tuvieran <strong>de</strong>finido un valor para cada<br />

categoría, significaba que podíamos or<strong>de</strong>nar <strong>la</strong> jerarquía <strong>de</strong> diferentes maneras: podíamos partir <strong>de</strong> <strong>la</strong><br />

c<strong>la</strong>sificación por materiales, para <strong>de</strong>spués ramificar por foco y subramificar por marca; o partir <strong>de</strong> <strong>la</strong><br />

c<strong>la</strong>sificación por marcas, para ramificar por materiales y subramificar por foco; o… Las combinaciones<br />

eran múltiples, y todas parecían po<strong>de</strong>r aportar valor a <strong>la</strong> comprensión. Eso nos hizo concluir que <strong>la</strong> jerarquía<br />

<strong>de</strong>l tronco y <strong>la</strong>s subramificaciones no podía ser fija: teníamos que permitir al usuario escoger<br />

qué quería colocar en cada uno <strong>de</strong> los niveles.<br />

El sentido <strong>de</strong>l or<strong>de</strong>n<br />

Por último, nos p<strong>la</strong>nteamos si sería interesante or<strong>de</strong>nar <strong>la</strong>s ramas con algún criterio específico en su<br />

distribución <strong>de</strong> izquierda a <strong>de</strong>recha. ¿Podíamos codificar <strong>de</strong> alguna manera <strong>la</strong> posición en el espacio? Si<br />

or<strong>de</strong>nábamos <strong>la</strong>s ramas según el volumen <strong>de</strong> <strong>ventas</strong>, por ejemplo, sería mucho más fácil comparar<strong>la</strong>s y<br />

saber qué producto estaba consiguiendo más beneficios. Si conseguíamos añadir alguna otra dimensión<br />

vertical para <strong>de</strong>terminar <strong>la</strong>s alturas, podíamos incluso acabar <strong>de</strong>finiendo un cuadrante interpretativo,<br />

que nos permitiera reconocer el comportamiento <strong>de</strong> un producto según su posición en él…


4. Codificación visual<br />

Pero <strong>la</strong> altura <strong>de</strong> <strong>la</strong>s ramas ya estaba codificando una jerarquía, y cambiar el criterio parecía boicotear el<br />

resto <strong>de</strong> <strong>de</strong>cisiones tomadas sin un objetivo c<strong>la</strong>ro. Para más inri, nos dimos cuenta que si or<strong>de</strong>nábamos<br />

siempre automáticamente <strong>la</strong> posición <strong>de</strong> <strong>la</strong>s ramas <strong>de</strong> izquierda a <strong>de</strong>recha según sus beneficios, cuando<br />

intentáramos ver <strong>la</strong> evolución anual o hacer comparaciones mes a mes, <strong>la</strong> re-or<strong>de</strong>nación iba a traernos<br />

problemas: si <strong>la</strong> rama <strong>de</strong> “producto” cambiaba <strong>de</strong> lugar, estando i<strong>de</strong>ntificada “sólo” por una etiqueta,<br />

sería fácil que un producto se moviera <strong>de</strong> sitio <strong>de</strong> mes a mes y no percibiéramos el cambio, dando lugar<br />

a malentendidos. Optamos pues por <strong>de</strong>scartar <strong>la</strong> posición como una forma <strong>de</strong> or<strong>de</strong>nar por beneficios, y<br />

<strong>de</strong>cidimos <strong>de</strong>jar<strong>la</strong> fija como una manera <strong>de</strong> i<strong>de</strong>ntificar un producto <strong>de</strong> forma estable.<br />

Datos numéricos<br />

Teníamos c<strong>la</strong>ro que 2 <strong>de</strong> los valores numéricos absolutos con los que jugábamos, <strong>la</strong>s unida<strong>de</strong>s vendidas<br />

(UNF) y el volumen <strong>de</strong> venta neta (VN), tenía sentido codificarlos con atributos visuales re<strong>la</strong>tivos a tamaño,<br />

o bien generar isotipos: iconos visuales que representaran uno <strong>de</strong> los elementos y se repitieran<br />

hasta representar <strong>la</strong> cifra <strong>de</strong>seada. Básicamente teníamos:<br />

• Venta neta (VN)<br />

• Unida<strong>de</strong>s vendidas (UNF)<br />

• Longitud tronco<br />

• Grosor tronco<br />

• Longitud rama<br />

• Grosor rama<br />

• Número <strong>de</strong> hojas (nuestros isotipos particu<strong>la</strong>res)<br />

• Tamaño (área) <strong>de</strong> <strong>la</strong>s hojas<br />

• Movimiento / pulso hojas<br />

La fuerza representativa <strong>de</strong> un isotipo<br />

Teniendo en cuenta que lo que más <strong>de</strong>fine <strong>la</strong> vitalidad “natural” <strong>de</strong> un árbol es el volumen <strong>de</strong> su fol<strong>la</strong>je<br />

(y el color, pero <strong>de</strong> momento nos centrábamos en tamaños), y lo que da una i<strong>de</strong>a más cercana a <strong>la</strong> salud<br />

<strong>de</strong> <strong>la</strong>s finanzas <strong>de</strong> <strong>la</strong> empresa cata<strong>la</strong>na son sus <strong>ventas</strong> netas, nos pareció que utilizar <strong>la</strong>s hojas como<br />

isotipos para representar el volumen <strong>de</strong> <strong>la</strong> venta neta era una buena i<strong>de</strong>a. Más hojas, más volumen <strong>de</strong><br />

<strong>ventas</strong>. Sería una imagen c<strong>la</strong>ra, inmediata y coherente, que daría un contexto excelente. Éramos conscientes<br />

que el número <strong>de</strong> hojas <strong>de</strong>bía ser a esca<strong>la</strong>, y que sería difícil contar <strong>la</strong>s hojas <strong>de</strong> <strong>la</strong>s respectivas<br />

ramas para hacer comparativas, pero pensamos que podríamos solucionar los problemas <strong>de</strong> focus añadiendo<br />

etiquetas con <strong>la</strong>s cifras concretas cerca <strong>de</strong> <strong>la</strong>s hojas, o en alguna tab<strong>la</strong> adyacente.<br />

La alternativa para facilitar comparaciones <strong>de</strong> <strong>la</strong>s hojas –y evitar posibles so<strong>la</strong>pamientos- podría ser<br />

fijar el número <strong>de</strong> hojas y codificar <strong>la</strong> venta neta según el tamaño <strong>de</strong> éstas. Hoja más gran<strong>de</strong>, venta<br />

más gran<strong>de</strong>. Pero los isotipos iban a generar una imagen más parecida a un árbol real, así que lo <strong>de</strong>scartamos.<br />

Márgenes <strong>de</strong>licados<br />

El margen <strong>de</strong> beneficio (VEA), sin embargo, nos generaba alguna duda. Si bien era un valor numérico,<br />

podíamos contemp<strong>la</strong>rlo como un valor absoluto (el total <strong>de</strong> beneficio obtenido, en euros), o bien como<br />

un valor re<strong>la</strong>tivo (el porcentaje <strong>de</strong> beneficio obtenido, respecto al total <strong>de</strong> <strong>la</strong> venta). Este producto me<br />

genera ¿3.000 euros <strong>de</strong> beneficios?, o ¿un 20% <strong>de</strong> beneficios? O incluso haciendo algún cálculo más: el<br />

margen <strong>de</strong> beneficios que me genera este producto, ¿está por encima <strong>de</strong>l margen medio <strong>de</strong>l conjunto?<br />

Es <strong>de</strong>cir, ¿estoy ante un producto que me da un margen comparativamente interesante?<br />

¿Cuál <strong>de</strong> esos indicadores podía aportar más valor a <strong>la</strong> comprensión? Nos pareció que el porcentaje era<br />

más significativo <strong>de</strong> <strong>la</strong> “calidad” <strong>de</strong> venta <strong>de</strong>l producto: si lo que pretendíamos era encontrar patrones<br />

transversales y evaluar los productos por el papel que jugaban en el conjunto <strong>de</strong> <strong>la</strong>s <strong>ventas</strong>, el margen<br />

39


4. Codificación visual<br />

Tab<strong>la</strong> <strong>de</strong> colores divergentes<br />

Paletas <strong>de</strong> colores válidos para<br />

categorizaciones divergentes,<br />

según <strong>la</strong>s consignas <strong>de</strong> Cyntia<br />

Brewer. Las paletas son generadas<br />

por <strong>la</strong> macro BREWERPAL,<br />

para R.<br />

Ví<strong>de</strong>o <strong>de</strong> árbol con hojas en movimiento<br />

(efecto pulso)<br />

El movimiento o pulso <strong>de</strong> <strong>la</strong>s hojas<br />

en zonas específicas o en todo<br />

el árbol podría representar información<br />

re<strong>la</strong>cionada, por ejemplo,<br />

con el número <strong>de</strong> transacciones<br />

asociadas a esa familia o subfamilia<br />

<strong>de</strong> productos.<br />

http://youtu.be/zb_8WN9woy8<br />

40<br />

“comparativo” es el que permitiría una comparación inmediata más c<strong>la</strong>ra con el resto <strong>de</strong> productos, sin<br />

necesidad <strong>de</strong> que el usuario “reesca<strong>la</strong>ra” una cifra absoluta (ya se <strong>la</strong> estábamos esca<strong>la</strong>ndo nosotros<br />

previamente). Así que optamos por priorizarlo, sin <strong>de</strong>scartar <strong>de</strong> momento dar alguno <strong>de</strong> los otros dos<br />

valores posibles re<strong>la</strong>cionados con el margen.<br />

La cuestión era: ¿cómo íbamos a codificar un valor que reflejaba si el producto se encontraba por encima<br />

<strong>de</strong> <strong>la</strong> media reinante o por <strong>de</strong>bajo? El sistema <strong>de</strong> color <strong>de</strong> Smartmoney se nos apareció como un<br />

hermano gemelo con <strong>la</strong> respuesta bajo el brazo: podíamos codificarlo con una escalera bicolor, que<br />

osci<strong>la</strong>ra hacia dos extremos <strong>de</strong>s<strong>de</strong> un punto <strong>de</strong> equilibrio neutro, que sería el margen medio. En Smartmoney<br />

se ofrecen el rojo y el ver<strong>de</strong> como extremos <strong>de</strong> <strong>la</strong> esca<strong>la</strong>, aunque existe <strong>la</strong> opción <strong>de</strong> mudar a una<br />

codificación a amarillo y azul en caso <strong>de</strong> problemas con <strong>la</strong> <strong>de</strong>tección <strong>de</strong> color. Brewer apoyaba <strong>la</strong> codificación,<br />

que según su c<strong>la</strong>sificación sería una bipo<strong>la</strong>r o divergente, así que aceptamos <strong>la</strong> codificación<br />

<strong>de</strong>finitivamente. (optando por una gradación <strong>de</strong> ver<strong>de</strong> a rosado, en lugar <strong>de</strong> amarillo azul, para manter<br />

<strong>la</strong> organicidad).<br />

Temblores ocasionales<br />

En algún momento consi<strong>de</strong>ramos <strong>la</strong> posibilidad <strong>de</strong> utilizar el movimiento <strong>de</strong> <strong>la</strong>s hojas (como si una suave<br />

brisa capitalista <strong>la</strong>s meciese) para indicar el volumen <strong>de</strong> transacciones que tenían lugar en una rama<br />

concreta <strong>de</strong> producto, o bien para codificar una variación drástica en el comportamiento <strong>de</strong> <strong>ventas</strong>, si<br />

ésta tenía lugar. El movimiento actuaría como una a<strong>la</strong>rma selectiva para atraer <strong>la</strong> atención. Sin embargo,<br />

<strong>la</strong> complejidad <strong>de</strong> programar algo así nos hizo <strong>de</strong>sestimarlo pronto.


4. Codificación visual<br />

Matriz <strong>ventas</strong> regionales<br />

Posible matriz codificando el volumen<br />

<strong>de</strong> <strong>ventas</strong> en cada región<br />

según el tipo <strong>de</strong> foco.<br />

Dimensión geográfica<br />

La información geográfica parecía que tenía que ser codificada, por naturaleza, en un mapa. Sin embargo,<br />

¿tenía tanta relevancia el espacio físico concreto en los datos sobre <strong>ventas</strong> por provincias? Nos<br />

p<strong>la</strong>nteamos hasta qué punto teníamos que priorizar <strong>la</strong> posición geográfica <strong>de</strong> <strong>la</strong>s distintas provincias<br />

(conocidas sobradamente por los usuarios potenciales). ¿No se trataba, en realidad, <strong>de</strong> una información<br />

básicamente categórica? Teníamos unos datos <strong>de</strong> <strong>ventas</strong> agrupados en unas categorías, que en este<br />

caso eran provincias. Lo que nos interesaba <strong>de</strong>stacar no era <strong>la</strong> posición <strong>de</strong> esa categoría en un mapa<br />

geográfico, sino el volumen <strong>de</strong> <strong>la</strong>s unida<strong>de</strong>s, los beneficios o los márgenes obtenidos en esa categoría<br />

específica. ¿Qué tipo <strong>de</strong> gráfico estábamos buscando, entonces?<br />

Evaluamos <strong>la</strong> posibilidad <strong>de</strong> incluir <strong>la</strong> variable geográfica como una “semil<strong>la</strong>” más a partir <strong>de</strong> <strong>la</strong> cual<br />

construir el árbol. Sin embargo, el número <strong>de</strong> categorías existentes generarían igual número <strong>de</strong> ramas:<br />

<strong>de</strong>masiadas para un solo árbol. El peligro <strong>de</strong> so<strong>la</strong>pamiento era evi<strong>de</strong>nte, y <strong>la</strong> comparación iba a resultar<br />

imposible. Si queríamos dar un gráfico con <strong>la</strong> variable geográfica, tenía que ser un gráfico al margen<br />

<strong>de</strong>l árbol.<br />

¿Cómo íbamos a ofrecer esa información geográfica? ¿Con qué datos? ¿Con qué forma? <strong>Una</strong> aproximación<br />

posible era realizar una matriz que cruzase productos y geografías. No obstante el número <strong>de</strong><br />

provincias es muy elevado (52) y <strong>la</strong>s matrices tien<strong>de</strong>n a saturarse.<br />

Queríamos ser consistentes y mantener el foco en los dos valores que reflejábamos en los árboles: venta<br />

neta y margen. Finalmente optamos por ofrecer un mapa <strong>de</strong> España, generado con Geocommons, sobre<br />

el que se pue<strong>de</strong>n visualizar ambos datos: círculos con un área correspondiente al valor <strong>de</strong> <strong>la</strong> venta en<br />

aquel<strong>la</strong> provincia (normalizada con <strong>la</strong> pob<strong>la</strong>ción), y un heatmap que codifica a través <strong>de</strong>l color el porcentaje<br />

<strong>de</strong> margen respecto a <strong>la</strong> media. Manteniendo los atributos <strong>de</strong> tamaño <strong>de</strong> círculo y color entre<br />

el árbol y el mapa nos parecía que, <strong>de</strong> alguna manera, prolongábamos <strong>la</strong> metáfora y ayudábamos a <strong>la</strong><br />

comprensión inmediata y <strong>la</strong>s comparaciones.<br />

DIMENSIÓN TEMPORAL<br />

• Orientación <strong>de</strong> <strong>la</strong> rama (grado <strong>de</strong> inclinación respeto un eje p<strong>la</strong>no)<br />

Para representar <strong>la</strong> evolución temporal, tratándose <strong>de</strong> un árbol, nos parecía que lo más coherente y<br />

fácil <strong>de</strong> enten<strong>de</strong>r <strong>de</strong> manera instintiva sería una animación <strong>de</strong>l propio árbol: añadir un botón <strong>de</strong> p<strong>la</strong>y que<br />

41


4. Codificación visual<br />

Ilustración estaciones <strong>ventas</strong><br />

Ilustración que muestra aspectos<br />

simu<strong>la</strong>dos <strong>de</strong> distintos árboles,<br />

según el volumen <strong>de</strong> <strong>ventas</strong> generado<br />

en esa categoría en un<br />

momento <strong>de</strong>terminado. La organicidad<br />

<strong>de</strong> <strong>la</strong> metáfora permite<br />

asociar rápidamente los aspectos<br />

visuales con <strong>la</strong> realidad <strong>de</strong> los<br />

datos.<br />

Línea <strong>de</strong> botones<br />

Que nos permite acce<strong>de</strong>r directamente<br />

a los resultados <strong>de</strong> cada<br />

uno <strong>de</strong> los meses, con un solo<br />

clic.<br />

Detalle <strong>de</strong> esbozo<br />

En nuestros ejercicios <strong>de</strong> sketch<br />

to think evaluamos <strong>la</strong> codificación<br />

<strong>de</strong> ten<strong>de</strong>ncias temporales según<br />

<strong>la</strong> inclinación <strong>de</strong> <strong>la</strong>s ramas respecto<br />

a su base.<br />

42<br />

hiciera evolucionar al árbol a lo <strong>la</strong>rgo <strong>de</strong>l año, mostrando secuencialmente <strong>la</strong> imagen correspondiente<br />

a cada mes, como si <strong>de</strong> una pelícu<strong>la</strong> se tratase. Así podría verse <strong>la</strong> evolución <strong>orgánica</strong>: en que ramas<br />

aparecían nuevas hojas, qué meses eran más ver<strong>de</strong>s, cuándo <strong>de</strong>saparecían líneas <strong>de</strong> <strong>ventas</strong>… Si <strong>la</strong> dimensión<br />

temporal realmente tenía afectación sobre <strong>la</strong>s <strong>ventas</strong> –y estábamos convencidos <strong>de</strong> que así<br />

era-, podrían incluso <strong>de</strong>tectarse “estaciones” <strong>de</strong> <strong>ventas</strong> según <strong>la</strong>s imágenes <strong>de</strong> los árboles resultantes.<br />

Sin embargo, <strong>la</strong> i<strong>de</strong>a <strong>de</strong> <strong>la</strong> animación, aunque atractiva, ofrecía problemas para comparar períodos <strong>de</strong><br />

tiempo no consecutivos. ¿Cómo recordar <strong>la</strong> imagen <strong>de</strong> febrero cuando lleguemos a noviembre? Era<br />

imperativo po<strong>de</strong>r ofrecer una vista directa <strong>de</strong> cada uno <strong>de</strong> los meses a voluntad: <strong>la</strong> imagen fija con el<br />

sumatorio <strong>de</strong> cada mes. Acordamos dar acceso directo a cada uno <strong>de</strong> estos árboles, añadiendo, por<br />

ejemplo, botones para cada uno <strong>de</strong> ellos <strong>de</strong>bajo <strong>de</strong>l árbol.<br />

Y aún así, ninguna <strong>de</strong> estas dos soluciones resolvía un tema esencial: po<strong>de</strong>r tener una imagen única con<br />

<strong>la</strong> evolución temporal <strong>de</strong> los valores. Tanto <strong>la</strong> animación como <strong>la</strong> vista directa <strong>de</strong>l mes ofrecían sólo, en<br />

cada momento, una imagen parcial <strong>de</strong> los datos: un árbol concreto. Valoramos <strong>la</strong> posibilidad <strong>de</strong> codificar<br />

<strong>la</strong> ten<strong>de</strong>ncia <strong>de</strong> <strong>ventas</strong> <strong>de</strong> un producto concreto a partir <strong>de</strong>l ángulo <strong>de</strong> inclinación <strong>de</strong> <strong>la</strong> rama sobre un eje<br />

transversal imaginario que se situaría en <strong>la</strong> base <strong>de</strong> su nacimiento: aquel<strong>la</strong>s ramas que se inclinasen en<br />

un ángulo entre 0º y 90º, <strong>de</strong>notarían una evolución positiva; <strong>la</strong>s que lo hiciesen en un ángulo entre 90º y<br />

180º, <strong>de</strong>notarían una evolución negativa.


4. Codificación visual<br />

Gráfico <strong>de</strong> líneas<br />

El gráfico mostrará <strong>la</strong> evolución<br />

anual <strong>de</strong>l valor seleccionado,<br />

para cada uno <strong>de</strong> los árboles resultantes<br />

según <strong>la</strong> semil<strong>la</strong> seleccionada.<br />

Pero esta aproximación tenía un hándicap: no había un único nivel <strong>de</strong> ramas, sino que hay subramas que<br />

brotan <strong>de</strong> ramas previas. Cuando <strong>la</strong>s ramas previas ya tienen una inclinación, <strong>la</strong> interpretación angu<strong>la</strong>r<br />

<strong>de</strong> <strong>la</strong> subrama que surge <strong>de</strong> el<strong>la</strong> se complica.<br />

Y a<strong>de</strong>más… una evolución positiva o negativa, ¿respecto a cuándo? ¿Respecto al último mes? ¿Respecto<br />

al último trimestre? ¿A lo <strong>la</strong>rgo <strong>de</strong>l año? No acabábamos <strong>de</strong> ver <strong>la</strong> manera <strong>de</strong> que quedara c<strong>la</strong>ro, y<br />

finalmente consi<strong>de</strong>ramos que, para una evolución temporal <strong>de</strong> valores que nos diera un contexto c<strong>la</strong>ro<br />

para todo el año, lo mejor era incorporar un gráfico <strong>de</strong> líneas fijo a pie <strong>de</strong> árbol que nos sirviera en todo<br />

momento <strong>de</strong> referencia.<br />

Últimos ajustes<br />

Simplificación <strong>de</strong>l fol<strong>la</strong>je<br />

Evaluado <strong>de</strong> cerca con una <strong>mirada</strong> técnica, el conjunto parecía p<strong>la</strong>usible, a excepción <strong>de</strong> un punto: <strong>la</strong>s<br />

hojas. El fantasma <strong>de</strong> <strong>la</strong> imposibilidad <strong>de</strong> programar algo semejante se cernía sobre nosotros como una<br />

sombra incómoda, generando una tensión obvia entre lo que imaginábamos y lo que sospechábamos<br />

que podría ser posible: habíamos escuchado suficientes advertencias sobre <strong>la</strong>s dificulta<strong>de</strong>s técnicas <strong>de</strong><br />

trabajar con gran cantidad <strong>de</strong> objetos y el alto riesgo <strong>de</strong> so<strong>la</strong>pamiento que suponían. Por precaución,<br />

hicimos un ejercicio <strong>de</strong> simplificación, intentando reconvertir <strong>la</strong>s isotópicas hojas en una única entidad<br />

que, con su tamaño, <strong>de</strong>notara lo mismo que iban a <strong>de</strong>notar todas <strong>la</strong>s hojas <strong>de</strong> una rama juntas: <strong>la</strong> venta<br />

neta. Nos basamos en el ejemplo provisto por <strong>la</strong> <strong>visualización</strong> arbórea <strong>de</strong> Bocoup sobre los currículos<br />

<strong>de</strong> Linkedin y e<strong>la</strong>boramos el siguiente mo<strong>de</strong>lo:<br />

Así fue como nuestras hojas se transformaron en copas.<br />

43


4. Codificación visual<br />

Diagrama copas<br />

Diagrama esquemático con anotaciones,<br />

en don<strong>de</strong> se muestra<br />

cómo el concepto <strong>de</strong> hojas repetidas<br />

formando una masa cuantificable<br />

es sustituido por un único<br />

círculo cuya área codifica cantida<strong>de</strong>s.<br />

Tab<strong>la</strong> <strong>de</strong> atributos<br />

Caracterización <strong>de</strong> los posibles<br />

tipos <strong>de</strong> árboles resultantes, que<br />

permite una interpretación rápida<br />

<strong>de</strong> qué está sucediendo con<br />

<strong>la</strong>s <strong>ventas</strong>.<br />

44<br />

Árboles con carácter<br />

Si aplicábamos esta codificación, nos dimos cuenta que pronto empezaríamos a tener árboles con morfologías<br />

diferentes para cada tipo <strong>de</strong> producto, como si <strong>de</strong> caras <strong>de</strong> Chernoff forestales se trataran.<br />

Podríamos i<strong>de</strong>ntificar “caracteres” <strong>de</strong> venta según <strong>la</strong> morfología <strong>de</strong> su tronco (o ramas) y su fol<strong>la</strong>je<br />

asociado:<br />

Sabíamos qué íbamos a mostrar, sólo nos faltaba encontrar el cómo.


5<br />

<strong>de</strong>finiendo <strong>la</strong> interacción<br />

O <strong>de</strong> cómo luchamos hasta <strong>la</strong> extenuación<br />

para conseguir un paper-, axure-,<br />

illustrator- o lo que fuera -prototype


5. Definiendo <strong>la</strong> interacción<br />

46<br />

Había dos factores prioritarios que tenía que cubrir <strong>la</strong> interacción: ofrecer flexibilidad en <strong>la</strong> elección y <strong>la</strong><br />

or<strong>de</strong>nación <strong>de</strong> <strong>la</strong>s categorías <strong>de</strong> productos a mostrar, y ofrecer focus & context: dar una imagen general<br />

y permitir a <strong>la</strong> vez una indagación en el <strong>de</strong>talle. Asimismo, queríamos mantener <strong>de</strong> alguna forma el look<br />

& feel arbóreo en todos los elementos, para darle consistencia a <strong>la</strong> metáfora (e intentando no caer en<br />

el infantilismo).<br />

Con esas i<strong>de</strong>as en mente, empezamos a trabajar en varios prototipos; algunos primeros esbozos en<br />

papel, otros animados en Power Point y finalmente algunos construidos con Axure, con <strong>la</strong> i<strong>de</strong>a <strong>de</strong> po<strong>de</strong>r<br />

programar y comprobar <strong>la</strong> interacción y hacer unos test <strong>de</strong> usuarios lo más realistas posibles (ver “Prototipos”<br />

en los anexos).<br />

Sabíamos que si no podíamos programar los árboles tal como los habíamos <strong>de</strong>finido, al menos podríamos<br />

hacer una prueba <strong>de</strong> concepto interactiva para validar –o no- el mo<strong>de</strong>lo.<br />

El camino <strong>de</strong> <strong>la</strong> navegación<br />

En una <strong>visualización</strong> interactiva, don<strong>de</strong> el usuario <strong>de</strong>be realizar algún tipo <strong>de</strong> acción sobre los objetos<br />

para conseguir visualizar lo que <strong>de</strong>sea, teníamos que asegurarnos que <strong>la</strong>s posibles interacciones quedaban<br />

<strong>de</strong>bidamente c<strong>la</strong>ras.<br />

En nuestro caso, para generar los árboles el usuario <strong>de</strong>be elegir, obligatoriamente, un criterio <strong>de</strong> or<strong>de</strong>nación:<br />

una categoría madre o semil<strong>la</strong>, a partir <strong>de</strong> <strong>la</strong> cual se establecerá <strong>la</strong> or<strong>de</strong>nación, y luego <strong>la</strong> jerarquía<br />

que <strong>de</strong>ben seguir <strong>la</strong>s ramificaciones subsiguientes. También tiene que indicar qué tipo <strong>de</strong> variable<br />

<strong>de</strong>sea ver reflejada en el área <strong>de</strong>finida por <strong>la</strong>s copas <strong>de</strong> los árboles o <strong>de</strong> <strong>la</strong>s ramas (Venta Neta, Margen<br />

o SKUs) y, por último, para qué período <strong>de</strong> tiempo. Tres elecciones antes <strong>de</strong> generar una <strong>visualización</strong>:<br />

tres pasos a dar antes <strong>de</strong> llegar al árbol.<br />

¿Cómo indicarle el camino? Manteniendo <strong>la</strong> metáfora <strong>orgánica</strong>, nos pareció que <strong>de</strong>bíamos simu<strong>la</strong>r <strong>de</strong><br />

alguna manera un recorrido terrenal, un camino que avanzara paso a paso hasta conducir al árbol.<br />

Utilizamos <strong>la</strong> horizontalidad <strong>de</strong> <strong>la</strong> pantal<strong>la</strong> para crear esa línea narrativa: empezando por <strong>la</strong> izquierda<br />

(siguiendo el or<strong>de</strong>n <strong>de</strong> lectura occi<strong>de</strong>ntal), el camino a seguir es indicado con una flecha, que nos indica<br />

paso a paso qué <strong>de</strong>cisiones <strong>de</strong>bemos tomar.


5. Definiendo <strong>la</strong> interacción<br />

Selección <strong>de</strong> variables<br />

Ya teníamos una base. ¿Cómo visualizar <strong>la</strong> selección <strong>de</strong> variables?<br />

Para ser consistentes con nuestra metáfora y nuestra codificación <strong>de</strong> <strong>la</strong>s categorías como tronco – ramas<br />

que crecían a partir <strong>de</strong> una <strong>de</strong> <strong>la</strong>s categorías en concreto, parecía lógico consi<strong>de</strong>rar que esa categoría<br />

madre <strong>de</strong>s<strong>de</strong> <strong>la</strong> que <strong>la</strong>s otras se abrían podía ser consi<strong>de</strong>rada una “semil<strong>la</strong>”.<br />

Siguiendo con el paralelismo orgánico, para hacer crecer y explorar un árbol <strong>de</strong> producto concreto, el<br />

usuario <strong>de</strong>bía escoger una semil<strong>la</strong> madre y <strong>la</strong>nzar<strong>la</strong> al espacio a<strong>de</strong>cuado: <strong>la</strong> base <strong>de</strong>l árbol. Como queríamos<br />

que el or<strong>de</strong>n en que se ramificaban los productos también fuera elegido por el usuario, parecía<br />

lógico que le permitiéramos escoger así qué categorías se injertan en el tronco o en <strong>la</strong>s ramas para<br />

conformar el segundo y tercer nivel <strong>de</strong> ramificaciones.<br />

Para hacer el proceso lo más sencillo posible, pensamos en olvidarnos <strong>de</strong> <strong>de</strong>splegables y selectores y<br />

colocar, directamente, un botón o “pieza” para cada una <strong>de</strong> <strong>la</strong>s categorías elegibles: queríamos mostrar<strong>la</strong>s<br />

todas, accesibles directamente sin entrar a consultar listados. En el i<strong>de</strong>al, <strong>la</strong> pieza sería seleccionada<br />

con un clic mantenido, y arrastrada por el usuario a <strong>la</strong> posición <strong>de</strong> <strong>la</strong> estructura <strong>de</strong>l árbol don<strong>de</strong><br />

le interesara colocar<strong>la</strong>. El drag&drop imitaba el gesto biológico <strong>de</strong> escoger y <strong>de</strong>jar caer una semil<strong>la</strong><br />

en un lugar receptor.<br />

Para facilitar <strong>la</strong> tarea, nos propusimos diseñar los botones y los lugares receptores o “contenedores”<br />

con formas específicas que <strong>de</strong>notaran dón<strong>de</strong> podía encajar cada pieza, si es que había alguna restricción.<br />

Queríamos usar lo que en diseño se ha venido a l<strong>la</strong>mar affordances & constraints, o lo que, <strong>de</strong> una<br />

manera más elemental, conocimos todos <strong>de</strong> niños con el juego <strong>de</strong> encajar <strong>la</strong>s piezas según sus formas.<br />

47


5. Definiendo <strong>la</strong> interacción<br />

48<br />

Selección temporal<br />

En el gráfico <strong>de</strong> evolución que se ofrece a pie <strong>de</strong> bosque aparece una línea distinta para cada árbol que<br />

se está visualizando, con el objetivo <strong>de</strong> facilitar <strong>la</strong> comparación <strong>de</strong> los distintos árboles en el tiempo,<br />

que <strong>de</strong> otra forma resultaría complicada. Sin embargo, según <strong>la</strong> semil<strong>la</strong> escogida, el número <strong>de</strong> árboles<br />

generados pue<strong>de</strong> crecer consi<strong>de</strong>rablemente, a <strong>la</strong> par que el número <strong>de</strong> líneas <strong>de</strong>l gráfico <strong>de</strong> evolución.<br />

Para evitar el so<strong>la</strong>pamiento en esos casos, se añadió un radio button en el que el usuario pueda escoger<br />

qué líneas quiere ver.<br />

El acceso a los datos <strong>de</strong> cada mes se hace directamente seleccionando el mes en una línea <strong>de</strong> botones,<br />

pero también pue<strong>de</strong> utilizarse <strong>la</strong> franja amaril<strong>la</strong> situada sobre el gráfico, <strong>de</strong>slizándo<strong>la</strong> a lo <strong>la</strong>rgo <strong>de</strong>l<br />

calendario para una <strong>visualización</strong> más rápida e intuitiva.<br />

Interacción en los árboles: focus&context<br />

Nuestros árboles parecían prometer una visión rápida y luminosa <strong>de</strong>l contexto <strong>de</strong> <strong>ventas</strong> <strong>de</strong> <strong>la</strong> empresa.<br />

Sin embargo, ¿podíamos conformarnos sólo con ese mapa biológico general? Nos parecía imprescindible<br />

po<strong>de</strong>r entrar a <strong>de</strong>talle y ofrecer información que incluyese, sobre todo, <strong>la</strong>s cifras concretas y un<br />

insight en los datos geográficos.<br />

Estuvimos buscando y rastreando opciones interactivas para dar contexto y foco a <strong>la</strong> vez, y encontramos<br />

algunos ejemplos que nos podían servir <strong>de</strong> base. El patrón era simi<strong>la</strong>r en todos: se mostraba a primera<br />

vista <strong>la</strong> estructura general, fuera un mapa, un diagrama radial o un calendario rectangu<strong>la</strong>r anual; lo<br />

importante era que se viera en su integridad. Para acce<strong>de</strong>r al foco, el usuario clicaba sobre uno <strong>de</strong> los<br />

elementos: a partir <strong>de</strong> ahí, el comportamiento para dar el foco variaba. Estas fueron algunas <strong>de</strong> <strong>la</strong>s opciones<br />

que encontramos:<br />

• Reorganización. El elemento pasa a situarse en el centro <strong>de</strong> <strong>la</strong> <strong>visualización</strong> y el resto <strong>de</strong> contenidos<br />

se estructuran a su alre<strong>de</strong>dor, redimensionándose si es necesario (Insi<strong>de</strong> the Courts, The<br />

Guardian).<br />

• Multipanel. Se ofrece <strong>la</strong> información ampliada en un panel situado al margen (2011, The Year in<br />

Review, The Guardian).<br />

• Zoom. Nos p<strong>la</strong>nteamos <strong>la</strong> opción <strong>de</strong> hacer zoom para acercarse al <strong>de</strong>talle <strong>de</strong> una zona concreta,<br />

pero en este caso, nos gustaba <strong>la</strong> i<strong>de</strong>a <strong>de</strong> po<strong>de</strong>r mantener a <strong>la</strong> vez el foco y el contexto.<br />

Finalmente, optamos por dar algunas cifras directamente como etiqueta en <strong>la</strong> <strong>visualización</strong>. Al hacer<br />

un clic, ofreceríamos una ficha conteniendo todas <strong>la</strong>s variables <strong>de</strong> aquél nodo. Para <strong>la</strong> información geográfica,<br />

probamos <strong>la</strong> opción <strong>de</strong> reorganizar <strong>la</strong>s copas generando un círculo para cada provincia, pero el


5. Definiendo <strong>la</strong> interacción<br />

2011 – The Year in Review. The<br />

Guardian.<br />

Un ejemplo <strong>de</strong> foco ofrecido a través<br />

<strong>de</strong> multipanel.<br />

http://www.guardian.co.uk/<br />

news/datablog/interactive/2011/<br />

nov/28/court-sentencing-magistrates-crown<br />

Insi<strong>de</strong> the courts: what happens<br />

to <strong>de</strong>fendants, visualized. The<br />

Guardian.<br />

Un ejemplo <strong>de</strong> foco ofrecido a través<br />

<strong>de</strong> reorganización.<br />

http://www.guardian.co.uk/<br />

news/datablog/interactive/2011/<br />

nov/28/court-sentencing-magistrates-crown<br />

resultado nos pareció innecesariamente confuso. Así que optamos por generar un panel paralelo que se<br />

genera (a doble clic) al hacer clic sobre <strong>la</strong> opción <strong>de</strong>l tooltip con el resumen <strong>de</strong> los datos sobre cualquiera<br />

<strong>de</strong> los elementos, y que es ampliable a pantal<strong>la</strong> completa. A<strong>de</strong>más, había que ofrecer botones para<br />

cerrar esa información emergente.<br />

En ambos casos, nos pareció pru<strong>de</strong>nte añadir un texto discreto explicitándole al usuario qué <strong>de</strong>bía hacer<br />

para acce<strong>de</strong>r al foco, como en el ejemplo <strong>de</strong> The Guardian: “Click on the bubbles to see how many people<br />

go through each stage of the justice system”.<br />

49


5. Definiendo <strong>la</strong> interacción<br />

Menús <strong>de</strong>l prototipo<br />

(1) Pasos para construcción<br />

<strong>de</strong>l árbol<br />

(2) Gráfico temporal<br />

(3) Gráfico principal<br />

(4) Menús <strong>de</strong> navegación<br />

Nivel 1 <strong>de</strong> <strong>de</strong>sglose <strong>de</strong>l árbol<br />

(VN | n árboles con 1 copa)<br />

<strong>Una</strong> vez seleccionado el primer<br />

nivel <strong>de</strong> semil<strong>la</strong>s, junto al valor<br />

y el momento <strong>de</strong>l tiempo a visualizar<br />

se <strong>de</strong>splegarían un número<br />

<strong>de</strong> árboles iguales al número <strong>de</strong><br />

opciones presentes en <strong>la</strong> semil<strong>la</strong><br />

escogida. La altura <strong>de</strong>l tronco<br />

representa siempre <strong>la</strong> variable<br />

UNF. El área <strong>de</strong> cada círculo es<br />

proporcional, en este caso, a <strong>la</strong>s<br />

VN y su color al % <strong>de</strong> margen <strong>de</strong><br />

esa familia.<br />

50<br />

El camino <strong>de</strong> regreso<br />

Toda exploración avanza con más valentía si sabe que sus pasos tienen vuelta atrás, si tiene un lugar al<br />

que regresar. Para dar libertad <strong>de</strong> interacción real, teníamos que ofrecer a nuestros futuros usuarios<br />

esas dos bazas: una vuelta a casa, al punto <strong>de</strong> partida, en don<strong>de</strong> se <strong>de</strong>sandaran todos los pasos dados;<br />

y una opción menos drástica que permitiera dar tan sólo un paso atrás, un CTRL+Z que permitiera<br />

reorientar el camino. De ahí <strong>la</strong> presencia <strong>de</strong> los botones “Home” (icono árbol) y “Atrás” (icono flecha) en<br />

nuestros prototipos.<br />

Recorridos simu<strong>la</strong>dos<br />

Los prototipos finales <strong>de</strong> nuestra <strong>visualización</strong> pue<strong>de</strong>n verse en http://goo.gl/isl3e. En este capítulo<br />

ofrecemos algunas imágenes representando posibles recorridos que muestran algunas interacciones y<br />

el resultado que se <strong>de</strong>riva <strong>de</strong> el<strong>la</strong>s.


5. Definiendo <strong>la</strong> interacción<br />

Nivel 1 <strong>de</strong> <strong>de</strong>sglose <strong>de</strong>l árbol<br />

(VEA | n árboles con 1 copa)<br />

Alternativamente se pue<strong>de</strong> seleccionar<br />

<strong>la</strong> variable VEA (margen<br />

absoluto).<br />

Nivel 2 <strong>de</strong> <strong>de</strong>sglose <strong>de</strong>l árbol<br />

(VN | n árboles con copas al<br />

segundo nivel)<br />

A medida que <strong>de</strong>sglosamos<br />

<strong>la</strong> información introduciendo<br />

nuevas variables que se<br />

injertan en el tronco po<strong>de</strong>mos<br />

ver cómo <strong>la</strong>s áreas previas se<br />

subdivi<strong>de</strong>n y muestran familias<br />

<strong>de</strong> productos con distintas<br />

re<strong>la</strong>ciones entre <strong>ventas</strong><br />

en unida<strong>de</strong>s, en valor y en %<br />

<strong>de</strong> margen. (Ver análisis <strong>de</strong><br />

negocio para más <strong>de</strong>talle)<br />

Nivel 3 <strong>de</strong> <strong>de</strong>sglose <strong>de</strong>l árbol<br />

(VN | n árboles con copas al segundo<br />

nivel)<br />

Despliegue <strong>de</strong> los árboles por<br />

<strong>la</strong>s 3 semil<strong>la</strong>s, en este caso<br />

foco->material->marca lo<br />

que permite ver a nivel más<br />

granu<strong>la</strong>r <strong>la</strong> composición <strong>de</strong><br />

<strong>la</strong>s <strong>ventas</strong> y los nichos <strong>de</strong><br />

margen.<br />

51


5. Definiendo <strong>la</strong> interacción<br />

Datos geolocalizados <strong>de</strong><br />

VN (círculos)<br />

Si queremos más <strong>de</strong>talle <strong>de</strong><br />

una familia (copa <strong>de</strong>l tronco o<br />

<strong>de</strong> una rama) concreta po<strong>de</strong>mos<br />

acce<strong>de</strong>r a información <strong>de</strong><br />

sus <strong>ventas</strong> (o margen) a nivel<br />

geográfico. Aquí burbujas<br />

proporcionales a VN. Software<br />

usado: Geocommons.<br />

Datos geolocalizados <strong>de</strong><br />

VN x cápita (color)<br />

Igualmente po<strong>de</strong>mos visualizar<br />

<strong>la</strong>s variables <strong>de</strong>rivadas<br />

(ratio VN o VEA x cápita, %<br />

sobre <strong>ventas</strong> totales en cada<br />

provincia) en una esca<strong>la</strong><br />

cromática secuencial.<br />

Leyendas<br />

Un botón <strong>la</strong>teral nos permite<br />

consultar en todo momento <strong>la</strong><br />

leyenda, que ayuda a <strong>de</strong>scodificar<br />

el valor <strong>de</strong>l área <strong>de</strong> <strong>la</strong>s copas y el<br />

valor <strong>de</strong>l margen representado<br />

por el color. A clic, <strong>la</strong> leyenda <strong>de</strong>saparece<br />

para no ocupar espacio.<br />

52


6<br />

tests <strong>de</strong> evaluación y usabilidad<br />

Veo, veo… ¿qué ves?


6. Test <strong>de</strong> evaluación y usabilidad<br />

Diagrama heurístico <strong>de</strong> Infovis<br />

Un diagrama que nos ayuda a<br />

i<strong>de</strong>ntificar qué aspectos o categorías<br />

<strong>de</strong> <strong>la</strong> heurística hay que evaluar<br />

en cada fase <strong>de</strong>l diagrama <strong>de</strong><br />

Infovis. O, en otras pa<strong>la</strong>bras, qué<br />

hemos <strong>de</strong> asegurarnos que estamos<br />

haciendo correctamente<br />

en cada fase <strong>de</strong>l proceso visualizador.<br />

54<br />

Primeros pasos para una heurística <strong>de</strong> <strong>la</strong> <strong>visualización</strong><br />

En <strong>la</strong> sesión <strong>de</strong> usabilidad con M.C. Marcos habíamos tenido conocimiento <strong>de</strong> <strong>la</strong> existencia <strong>de</strong> un tipo <strong>de</strong><br />

test <strong>de</strong> evaluación que suele aplicarse a <strong>la</strong>s páginas web para asegurar que cumplen con los requisitos<br />

<strong>de</strong> accesibilidad y usabilidad estándares <strong>de</strong>l mercado. Es el conocido como “Mo<strong>de</strong>lo heurístico” o “Heurística”:<br />

en <strong>la</strong> práctica, se trata <strong>de</strong> un Excel con cuestiones c<strong>la</strong>ve, organizadas por temas, a <strong>la</strong>s que hay<br />

que respon<strong>de</strong>r. Las preguntas permiten i<strong>de</strong>ntificar <strong>la</strong> existencia <strong>de</strong> problemas y, <strong>de</strong> haberlos, se juzga<br />

también su severidad en función <strong>de</strong> su frecuencia y el impacto sobre <strong>la</strong> navegación. Es preciso que <strong>la</strong><br />

evaluación <strong>la</strong> realicen distintos usuarios (entre 3 y 5, se recomienda), para que el juicio sea equilibrado.<br />

Este mo<strong>de</strong>lo heurístico es ampliamente usado por <strong>la</strong> comunidad <strong>de</strong> expertos en usabilidad en <strong>la</strong> primera<br />

fase <strong>de</strong> evaluación <strong>de</strong> unos prototipos o <strong>de</strong> una web: sirve como filtro inicial para <strong>de</strong>tectar los errores<br />

más patentes. <strong>Una</strong> vez pulidos, en <strong>la</strong> segunda fase <strong>de</strong> evaluación ya se pasa a hacer pruebas más específicas:<br />

recorridos cognitivos (con perfiles <strong>de</strong> personas / escenarios) y self-reported metrics. Esos<br />

test permiten tanto <strong>de</strong>tectar los posibles problemas que pue<strong>de</strong>n darse en <strong>la</strong> consecución <strong>de</strong> una tarea<br />

concreta, como evaluar el grado <strong>de</strong> satisfacción que genera <strong>la</strong> experiencia en el usuario.<br />

Heurísticas y tests <strong>de</strong> usuario: herramientas altamente probadas (y razonables) que, sin embargo, parecían<br />

no tener equivalencia en el mundo “incipiente” <strong>de</strong> <strong>la</strong>s visualizaciones. ¿Cómo era posible…? Sí:<br />

<strong>la</strong> l<strong>la</strong>mada <strong>de</strong> lo <strong>de</strong>sconocido hizo mel<strong>la</strong> una vez más… y <strong>de</strong>cidimos intentarlo: nos <strong>la</strong>nzamos a crear<br />

un mo<strong>de</strong>lo <strong>de</strong> heurística para visualizaciones. Basándonos en <strong>la</strong> heurística web y en el Diagrama <strong>de</strong><br />

Infovis (Dürsteler & Engelheart), i<strong>de</strong>ntificamos primero <strong>la</strong>s gran<strong>de</strong>s categorías <strong>de</strong> preguntas que sería<br />

necesario realizar para cubrir los distintos aspectos <strong>de</strong> una <strong>visualización</strong>, a saber:<br />

• Objetivos<br />

• Datos<br />

• Codificación visual<br />

• Layout<br />

• Textos<br />

• Interacción<br />

• Accesibilidad<br />

Detectamos unos 60 puntos a comprobar, aunque no todas <strong>la</strong>s preguntas aplican en todas <strong>la</strong>s visualizaciones.<br />

Marcamos en azul <strong>la</strong>s 20 que nos parecían más críticas y rehicimos <strong>la</strong> formu<strong>la</strong>ción <strong>de</strong> algunas<br />

preguntas para evitar ambigüeda<strong>de</strong>s.<br />

Tras algunas vueltas ésta fue, finalmente, nuestra propuesta teórica, que esperamos po<strong>de</strong>r discutir,<br />

corregir y mejorar con <strong>la</strong> co<strong>la</strong>boración <strong>de</strong> compañeros y profesores, hasta dar con un mo<strong>de</strong>lo operati-


6. Test <strong>de</strong> evaluación y usabilidad<br />

Four ways to Slice Obama’s 2013<br />

Budget Proposa, en el New York<br />

Times, 12 Febrero 2012.<br />

Ejemplo <strong>de</strong> uso <strong>de</strong> círculos para<br />

codificar cantida<strong>de</strong>s, con una leyenda<br />

<strong>de</strong> círculos anidados como<br />

referencia. En este caso, el color<br />

también se utiliza en una esca<strong>la</strong><br />

divergente para codificar el porcentaje<br />

<strong>de</strong> incremento o <strong>de</strong>scenso<br />

sobre los presupuestos <strong>de</strong>l 2012.<br />

http://www.nytimes.com/<br />

interactive/2012/02/13/us/<br />

politics/2013-budget-proposalgraphic.html<br />

vo para <strong>la</strong> comunidad <strong>de</strong> visualizadores: http://goo.gl/hYOxA. El documento es público, pero también<br />

pue<strong>de</strong> consultarse una copia íntegra en el anexo.<br />

Autoevaluación heurística y recorridos cognitivos<br />

Tras algunas pruebas, conseguimos una versión <strong>de</strong> los prototipos que se acercaba bastante a lo que<br />

teníamos en mente: http://goo.gl/oBjlB<br />

Sobre esa versión aplicamos los test <strong>de</strong> usabilidad que podíamos realizar internamente: <strong>la</strong> heurística,<br />

ya presentada, y los recorridos cognitivos, una técnica que consiste en auto-recorrer <strong>la</strong> <strong>visualización</strong><br />

probando distintos circuitos <strong>de</strong> navegación, poniéndose en <strong>la</strong> piel <strong>de</strong> los posibles usuarios <strong>de</strong>finidos en<br />

<strong>la</strong> creación <strong>de</strong> Personas y Escenarios e imaginándose qué tipo <strong>de</strong> dudas o problemas podían suscitarles.<br />

La evaluación fue más positiva <strong>de</strong> lo esperado: habíamos cubierto, tanto en <strong>la</strong> concepción como en <strong>la</strong><br />

implementación gráfica, buena parte <strong>de</strong> los preceptos que creemos exige una buena <strong>visualización</strong> (aunque<br />

sí, es cierto: <strong>la</strong> heurística <strong>la</strong> <strong>de</strong>finimos nosotros mismos; había muchas posibilida<strong>de</strong>s <strong>de</strong> que lo que<br />

teníamos en mente al concebir<strong>la</strong> y lo que teníamos en mente al concebir <strong>la</strong> <strong>visualización</strong> coincidiera).<br />

Aún así, <strong>de</strong>tectamos algunos puntos que generaban dudas o necesitaban mejoras:<br />

• Información contextual. No estábamos ofreciendo ningún tipo <strong>de</strong> contexto sobre el origen <strong>de</strong>l<br />

problema a visualizar: no había introducción a <strong>la</strong> temática ni explicación sobre <strong>la</strong> proce<strong>de</strong>ncia <strong>de</strong> los<br />

datos ni su fecha <strong>de</strong> extracción. Tampoco ofrecíamos información acerca <strong>de</strong> <strong>la</strong> autoría: en ninguna<br />

parte podían localizarse nuestros nombres ni una forma <strong>de</strong> contacto. Lo cierto es que, tratándose<br />

<strong>de</strong> un prototipo para una herramienta empresarial construida a medida <strong>de</strong> <strong>la</strong>s necesida<strong>de</strong>s <strong>de</strong> <strong>la</strong><br />

empresa cata<strong>la</strong>na, no se nos había ocurrido pensar que el contexto fuera necesario – los <strong>de</strong>stinatarios<br />

estaban más que al corriente <strong>de</strong>l contexto <strong>de</strong> los datos. Nos dimos cuenta que quizá esos puntos<br />

<strong>de</strong> <strong>la</strong> heurística tenían más sentido en visualizaciones públicas, para el gran consumo <strong>de</strong> público.<br />

Aún así, <strong>de</strong>cidimos añadir <strong>la</strong> autoría, los datos <strong>de</strong> contacto, y <strong>la</strong> referencia a los datos que estábamos<br />

teniendo en cuenta en una sección “Acerca <strong>de</strong>” o simi<strong>la</strong>r.<br />

• Normalizaciones. Tras haber oído <strong>de</strong>cenas <strong>de</strong> advertencias sobre el peligro <strong>de</strong> codificar cantida<strong>de</strong>s<br />

con círculos, ahí estábamos nosotros, <strong>de</strong>safiando a los dioses <strong>de</strong> <strong>la</strong>s comparativas y codificando<br />

<strong>ventas</strong> con objetos radiales, tan difíciles <strong>de</strong> comparar. Y ahí estaba <strong>la</strong> heurística para recordarnos el<br />

riesgo: ¿se habían normalizado los datos para que <strong>la</strong>s cantida<strong>de</strong>s fueran representadas por el área,<br />

y no por el radio <strong>de</strong> <strong>la</strong> circunferencia? Sí, se había hecho.<br />

Los círculos se habían generado con el software online gratuito Many Eyes <strong>de</strong> IBM, y habíamos verificado<br />

varios casos para asegurarnos que, visualmente, un círculo con valor “900” tuviera el triple<br />

<strong>de</strong> área visual que un círculo con valor “300”. Para que el área sea proporcional al valor hay que<br />

55


6. Test <strong>de</strong> evaluación y usabilidad<br />

56<br />

tomar <strong>la</strong> raíz cuadrada (sqrt=Square Root) <strong>de</strong>l valor a graficar dividido por Pi, y usar el resultado<br />

para generar el área <strong>de</strong>l círculo.<br />

• Esca<strong>la</strong>s <strong>de</strong> referencia. La heurística <strong>de</strong>manda que, si hay codificaciones métricas, se dé una esca<strong>la</strong><br />

<strong>de</strong> referencia. Nosotros habíamos incluido un eje vertical que permitiera encontrar el valor <strong>de</strong><br />

<strong>la</strong>s barras métricas (los troncos) que codifican <strong>la</strong>s unida<strong>de</strong>s vendidas (UNF). Sin embargo, con <strong>la</strong>s<br />

áreas <strong>de</strong> los círculos, que al fin y al cabo también tenían un valor métrico, <strong>la</strong> esca<strong>la</strong> se nos complicaba.<br />

Llegamos a <strong>la</strong> conclusión que lo más útil sería ofrecer siempre <strong>la</strong> cifra total explícita, como<br />

una etiqueta, y añadir una leyenda <strong>de</strong> referencia rápida con distintos tamaños <strong>de</strong> círculos, aunque<br />

encontrar <strong>la</strong> correspon<strong>de</strong>ncia exacta entre los círculos generados y <strong>la</strong> leyenda no sería tarea fácil<br />

para el usuario.<br />

• Interacción. Pronto <strong>de</strong>tectamos que una <strong>de</strong> <strong>la</strong>s áreas en <strong>la</strong>s que nuestros tenían más <strong>de</strong>ficiencias<br />

era en interacción: nos habíamos preocupado mucho por <strong>la</strong> coherencia <strong>de</strong> <strong>la</strong> codificación estadística<br />

y conceptual, pero los elementos interactivos en parte quedaban escondidos y en parte no habían<br />

sido <strong>de</strong>finidos: los en<strong>la</strong>ces no parecían en<strong>la</strong>ces, no quedaba c<strong>la</strong>ro dón<strong>de</strong> podía clicarse y para qué,<br />

no había una referencia c<strong>la</strong>ra para el usuario <strong>de</strong> en qué parte <strong>de</strong>l recorrido estaba… Para ser capaces<br />

<strong>de</strong> <strong>de</strong>tectar toda <strong>la</strong> interactividad necesaria, concluimos que lo más operativo sería hacer una<br />

versión realmente interactiva <strong>de</strong> los prototipos estáticos, para asegurarnos que <strong>la</strong> navegación y los<br />

recorridos eran posibles.<br />

El resultado <strong>de</strong> <strong>la</strong>s mejoras <strong>de</strong>rivadas <strong>de</strong> <strong>la</strong> heurística pue<strong>de</strong> verse en http://goo.gl/isl3e. Ver el capítulo<br />

8. Visualización final para más <strong>de</strong>talles.


6. Test <strong>de</strong> evaluación y usabilidad<br />

Test <strong>de</strong> usuario<br />

Los test <strong>de</strong> usuario son un test externo que se realiza con usuarios ajenos al proyecto que cumplen<br />

ciertas condiciones (y se asemejan a nuestro usuario potencial). Se realiza para <strong>de</strong>tectar problemas<br />

cualitativos, y consta <strong>de</strong> unos cuestionarios básicos y unas pruebas <strong>de</strong> ejecución <strong>de</strong> tareas. Mientras el<br />

usuario intenta cumplir <strong>la</strong>s tareas propuestas, nuestro papel es observarlo y tomar nota <strong>de</strong> su comportamiento,<br />

comentarios y sensaciones.<br />

Lo cierto es que <strong>la</strong> concepción <strong>de</strong> <strong>la</strong> <strong>visualización</strong>, su prototipado, su programación y su narración se<br />

llevaron por <strong>de</strong><strong>la</strong>nte el tiempo <strong>de</strong>l proyecto y no pudimos llegar a hacer test <strong>de</strong> usuario sistematizados<br />

con <strong>de</strong>sconocidos. Pero aún así, estuvimos evaluando <strong>la</strong>s herramientas que nos hubieran permitido<br />

hacerlos, y p<strong>la</strong>nteando <strong>la</strong> estructura <strong>de</strong>l test, con sus tareas y cuestionarios.<br />

Las herramientas online que probamos para ejecutar y monitorizar los resultados <strong>de</strong> los test fueron:<br />

Para cuestionario<br />

https://es.surveymonkey.com<br />

LostinDarkness / wellfindthelight<br />

Para <strong>la</strong> evaluación <strong>de</strong> <strong>la</strong> <strong>visualización</strong><br />

http://www.loop11.com<br />

LostinDarkness / wellfindthelight<br />

Versión gratuita limitada a 5 tareas y 2 preguntas.<br />

Y he aquí los cuestionarios y tareas previstos:<br />

Cuestionario Previo. Datos <strong>de</strong> perfil (5min)<br />

• ¿Cuántos años <strong>de</strong> experiencia tienes en navegación por internet?<br />

• ¿Cuántos años <strong>de</strong> experiencia tienes en el sector óptico?<br />

• ¿Has utilizado previamente un software <strong>de</strong> Business Intelligence? ¿Qué tal fue <strong>la</strong> experiencia?<br />

• ¿Qué expectativas tienes con esta <strong>visualización</strong>? ¿En qué esperas que te ayu<strong>de</strong>?<br />

Cuestionario Pre-tarea (1min)<br />

• Para conseguir esta tarea, ¿cuánto tiempo esperas emplear?<br />

• ¿Crees que será difícil conseguirlo?<br />

Tareas (40min). Think aloud!<br />

Partíamos <strong>de</strong> <strong>la</strong> base <strong>de</strong> que el test <strong>de</strong>be p<strong>la</strong>ntearse con preguntas concretas y guiadas, especificando<br />

c<strong>la</strong>ramente cuánto tiempo se permite para realizar <strong>la</strong> tarea. Para cada tarea había que <strong>de</strong>finir un nombre,<br />

un escenario (instrucciones y contexto), una URL <strong>de</strong> inicio y una URL <strong>de</strong> fin; en nuestro caso, sin<br />

embargo <strong>la</strong> <strong>visualización</strong> no tenía diferentes URLs… eso generaría algún problema <strong>de</strong> adaptación con<br />

<strong>la</strong>s herramientas online disponibles para hacer <strong>la</strong>s evaluaciones, pero siempre podríamos utilizar <strong>la</strong><br />

observación directa para saber si el usuario había llegado a buen puerto o no.<br />

Estas fueron <strong>la</strong>s tareas propuestas:<br />

1. ¿Qué subfamilias <strong>de</strong> lentes <strong>orgánica</strong>s estaban generando los mayores beneficios absolutos en<br />

junio 2008? (3’)<br />

2. Compara <strong>la</strong>s <strong>ventas</strong> netas <strong>de</strong> los distintos tipos <strong>de</strong> lentes según foco en marzo 2008. ¿Qué grupo<br />

<strong>de</strong> lentes generó mayores márgenes porcentuales <strong>de</strong> beneficios? (5’)<br />

3. ¿Qué tipo <strong>de</strong> tratamiento se estaba vendiendo más en diciembre 2008? ¿Sobre qué lentes se aplicaba,<br />

mayoritariamente? (3’)<br />

4. ¿Cómo evolucionaron <strong>la</strong>s <strong>ventas</strong> <strong>de</strong> <strong>la</strong>s distintas marcas en el último trimestre <strong>de</strong> 2008? (3’)<br />

5. ¿Qué provincia generaba mejores márgenes <strong>de</strong> beneficio para <strong>la</strong>s lentes <strong>progresiva</strong>s <strong>orgánica</strong>s en<br />

febrero 2008? (2’)<br />

57


6. Test <strong>de</strong> evaluación y usabilidad<br />

58<br />

El tipo <strong>de</strong> información que <strong>de</strong>bíamos anotar era:<br />

• el think aloud, todo aquello que comentara el usuario. Luego c<strong>la</strong>sificaríamos los comentarios:<br />

dudas, confusiones, interjecciones, quejas, suposiciones...<br />

• el silence think, o lenguaje corporal, en todas sus manifestaciones:<br />

• expresiones faciales (existe un diccionario: face-and-emotion.com).<br />

• movimientos en <strong>la</strong> sil<strong>la</strong> (cuando no enten<strong>de</strong>mos algo, nos acercamos al monitor; cuando nos<br />

ponemos nerviosos, nos tiramos para atrás en <strong>la</strong> sil<strong>la</strong>...).<br />

• movimientos <strong>de</strong>l ratón (si dudamos, movemos el ratón <strong>de</strong> un <strong>la</strong>do a otro; si vamos directos a<br />

un en<strong>la</strong>ce, es un movimiento que dibuja una línea recta. Y parece que cuando nos estresamos,<br />

apretamos más fuerte el ratón).<br />

• ¿Se ha logrado <strong>la</strong> tarea? ¿Con qué efectividad?<br />

• Tiempo empleado (y tiempo estimado)<br />

• Número <strong>de</strong> clics<br />

• Errores únicos<br />

• Errores repetidos<br />

• Tipo <strong>de</strong> errores<br />

• Número <strong>de</strong> veces que llega a <strong>la</strong> misma página<br />

• Comentarios<br />

Sabíamos <strong>de</strong> <strong>la</strong> existencia <strong>de</strong> software como Morae o Camtasia, que contabilizan los clics, errores, etc.<br />

<strong>de</strong> manera automática. En nuestro caso, <strong>la</strong> medida <strong>de</strong>bía ser observada y anotada aproximativamente.<br />

Cuestionario Post-tarea (1min)<br />

• ¿Crees que has conseguido darte <strong>de</strong> alta/<strong>la</strong> tarea?<br />

• ¿Te ha parecido fácil o difícil, <strong>de</strong> 0 a 5? (0: muy fácil; 5: muy difícil).<br />

Encuesta SUS (5min)<br />

El usuario marca su grado <strong>de</strong> conformidad <strong>de</strong>l 1 al 5 con una lista <strong>de</strong> afirmaciones. Las afirmaciones<br />

impares son positivas; <strong>la</strong>s pares, negativas. Para calcu<strong>la</strong>r el resultado, a <strong>la</strong>s positivas hay que restarle<br />

1 al número marcado. A <strong>la</strong>s negativas, se les resta <strong>de</strong>s<strong>de</strong> 5 el número marcado por <strong>la</strong> persona. De esta<br />

manera ambas esca<strong>la</strong>s se convierten internamente a un rango <strong>de</strong>l 0 al 4. Se suman todas <strong>la</strong>s restas y se<br />

multiplica por 2.5 con lo que el máximo valor posible es 100 (2.5x4x10 preguntas). El número resultante<br />

es el porcentaje <strong>de</strong> satisfacción según <strong>la</strong> esca<strong>la</strong> SUS.<br />

• Creo que me gustaría usar esta <strong>visualización</strong> frecuentemente<br />

• La <strong>visualización</strong> me ha parecido innecesariamente compleja<br />

• Creo que <strong>la</strong> <strong>visualización</strong> es fácil <strong>de</strong> usar<br />

• Creo que necesitaría <strong>la</strong> ayuda <strong>de</strong> un técnico para po<strong>de</strong>r usar <strong>la</strong> <strong>visualización</strong><br />

• Creo que <strong>la</strong>s distintas funcionalida<strong>de</strong>s están bien integradas<br />

• Creo que hay mucha inconsistencia en <strong>la</strong> <strong>visualización</strong><br />

• Imagino que <strong>la</strong> mayoría <strong>de</strong> gente apren<strong>de</strong>rá a usar <strong>la</strong> <strong>visualización</strong> rápidamente<br />

• Se me ha hecho pesado usar <strong>la</strong> <strong>visualización</strong><br />

• Me he sentido muy cómodo usando <strong>la</strong> <strong>visualización</strong><br />

• Necesito apren<strong>de</strong>r muchas cosas antes <strong>de</strong> po<strong>de</strong>r utilizar bien esta <strong>visualización</strong>


7<br />

esculpiendo código<br />

Tiempo <strong>de</strong> podar el árbol para que crezca sano.


7. Código<br />

60<br />

Antece<strong>de</strong>ntes<br />

Programar árboles es ciencia infusa para mí.<br />

Durante <strong>la</strong> fase <strong>de</strong> exploración habíamos realizado transformaciones en los datos, operaciones <strong>de</strong> limpieza<br />

y filtrado para <strong>la</strong>s acciones <strong>de</strong> EDA, pero <strong>la</strong>s tareas más complejas estaban por llegar una vez que<br />

abordásemos <strong>la</strong> programación <strong>de</strong> nuestra aplicación.<br />

Llegado el momento y durante dos semanas <strong>de</strong> investigación, tests prueba-error, consultas a los gurús<br />

(gracias Víctor) y algunos logros trasnochados, <strong>la</strong> tarea fundamental <strong>de</strong> recuperación y mol<strong>de</strong>ado <strong>de</strong> los<br />

datos se fue complicando hasta convertirse en un nudo irresoluble que atascaba nuestro mecanismo<br />

visualizador.<br />

Frustradas nuestras expectativas, resolvimos continuar a<strong>de</strong><strong>la</strong>nte con <strong>la</strong> <strong>de</strong>finición y <strong>de</strong>sarrollo <strong>de</strong> <strong>la</strong><br />

i<strong>de</strong>a <strong>de</strong> los árboles que representasen <strong>la</strong>s <strong>ventas</strong>, dando como resultado tres aproximaciones al mo<strong>de</strong>lo<br />

i<strong>de</strong>al que se iba construyendo en nuestras cabezas.<br />

1. Gráficos interactivos complementarios: Coqueteos con librerías específicas para <strong>visualización</strong> <strong>de</strong><br />

datos, fundamentalmente D3 y Processing, tratando <strong>de</strong> encontrar nuestra metáfora en <strong>la</strong>s galerías <strong>de</strong><br />

ejemplos:<br />

Sunburst<br />

Radial Tree<br />

2. Simu<strong>la</strong>ción <strong>de</strong> <strong>la</strong> aplicación: Descrita más a<strong>de</strong><strong>la</strong>nte en el capítulo 5, Definiendo <strong>la</strong> Interacción.<br />

3. Descripción funcional <strong>de</strong> <strong>la</strong>s tareas necesarias para programar los árboles:<br />

Funcional<br />

1. Generación <strong>de</strong> datos estructurados. (ver final capítulo 1. Explorando el Terreno)<br />

2. Recuperación y procesado <strong>de</strong> los datos. La recuperación <strong>de</strong> datos <strong>la</strong> realizamos por medio <strong>de</strong> funciones<br />

recursivas que recorren los nodos <strong>de</strong>l árbol acumu<strong>la</strong>dos en una archivo .json y suman los valores<br />

para cada uno <strong>de</strong> los niveles padre y establecen su valor <strong>de</strong> normalización.


7. Código<br />

Normalización <strong>de</strong> valores: Consistente en <strong>de</strong>tectar el valor más alto <strong>de</strong> nuestra muestra <strong>de</strong> datos y<br />

restarle el más bajo. El resultado lo dividimos entre el número <strong>de</strong> rangos que queremos. El resultado lo<br />

dividimos a su vez por cada uno <strong>de</strong> los valores resultando <strong>la</strong> posición para cada uno <strong>de</strong> ellos.<br />

En <strong>la</strong>s simu<strong>la</strong>ción asignamos el valor normalizado <strong>de</strong> <strong>la</strong> suma <strong>de</strong> importes para codificar gráficamente<br />

los siguientes valores:<br />

Suelo (1/3)<br />

Textura: suma <strong>de</strong> importes para <strong>la</strong> marca seleccionada<br />

(MARCA A, MARCA C)<br />

Tronco (1/5)<br />

Ancho: suma <strong>de</strong> importes para el foco seleccionado<br />

(MONOFOCALES, BIFOCALES, PROGRESIVOS)<br />

Ramas (1/3)<br />

Ancho: suma <strong>de</strong> importes para los materiales seleccionados<br />

(ORGÁNICO, MINERAL, PROGRESIVO)<br />

Hojas (1/5)<br />

Color: suma <strong>de</strong> importes para los tratamientos seleccionados (COLOR, TRAT-COL, COLOR<br />

H-C,...)<br />

Y el <strong>de</strong>l total <strong>de</strong> unida<strong>de</strong>s para:<br />

Suelo (1/3)<br />

Altura: suma <strong>de</strong> unida<strong>de</strong>s vendidas para <strong>la</strong> marca seleccionada<br />

(MARCA A, MARCA C)<br />

Tronco (1/3)<br />

Altura: suma <strong>de</strong> unida<strong>de</strong>s vendidas para el foco seleccionado<br />

(MONOFOCALES, BIFOCALES, PROGRESIVOS)<br />

Ramas (1/3)<br />

Altura: suma <strong>de</strong> unida<strong>de</strong>s vendidas para los materiales seleccionados<br />

(ORGÁNICO, MINERAL, PROGRESIVO)<br />

Hojas (1/3)<br />

Número: suma <strong>de</strong> unida<strong>de</strong>s vendidas para los tratamientos seleccionados<br />

(COLOR, TRAT-COL, COLOR H-C,...)<br />

61


7. Código<br />

62<br />

Por lo tanto nos queda una estructura visual <strong>de</strong> posiciones en forma <strong>de</strong> árbol a <strong>la</strong> que asignamos valores<br />

a cada posición.<br />

(function(a){<br />

a.fn.extend({<br />

crearArbol: function(suelo,tronco,ramas, hojas){<br />

//Recorre todos los elementos encapsu<strong>la</strong>dos<br />

this.each(function(){<br />

// Generamos los elementos que componen el arbol<br />

});<br />

}<br />

});<br />

})(jQuery);<br />

Función javascript que genera el esqueleto y asigna un valor a cada posición.


7. Código<br />

3. Lógica <strong>de</strong> representación. Generamos unas matrices visuales (técnica sprites css*) que posicionamos<br />

en nuestra estructura <strong>de</strong> acuerdo a su valor normalizado.<br />

Suelo y tronco.<br />

Ramas<br />

Hojas<br />

63


7. Código<br />

64<br />

El último paso es un juego <strong>de</strong> ocultación en el que los valores <strong>de</strong> cada posición actúan <strong>de</strong> máscara para<br />

<strong>la</strong>s matrices visuales


8<br />

<strong>visualización</strong> final<br />

Propuesta final y análisis <strong>de</strong> <strong>la</strong> estructura<br />

y sintaxis <strong>de</strong> sus componentes gráficos


8. Visualización Final<br />

66<br />

Análisis <strong>de</strong> <strong>la</strong> estructura y sintaxis <strong>de</strong> los componentes gráficos<br />

Gráfico principal: gráfico <strong>de</strong> árboles<br />

• Tipo <strong>de</strong> gráfico: La representación está organizada en un multipanel compuesto <strong>de</strong> un gráfico híbrido<br />

<strong>de</strong> tipo estadístico <strong>de</strong> tiempo y <strong>de</strong> conéxión (árboles que cambian mes a mes) y un gráfico temporal en<br />

<strong>la</strong> parte inferior izquierda.<br />

• El espacio métrico <strong>de</strong>l gráfico estadístico <strong>de</strong> conexión es significativo pero no integral. Mientras el eje<br />

vertical o <strong>de</strong> or<strong>de</strong>nadas (Y) es un eje métrico <strong>de</strong> esca<strong>la</strong> cuantitativa, el eje horizontal o <strong>de</strong> abcisas agrupa<br />

<strong>la</strong> información por categorías pero en una esca<strong>la</strong> categórica. El espacio métrico <strong>de</strong>l gráfico temporal se<br />

comporta <strong>de</strong> simi<strong>la</strong>r forma si bien <strong>la</strong> esca<strong>la</strong> horizontal es secuencial u ordinal.<br />

• Correspon<strong>de</strong>ncia gráfica: <strong>la</strong> correspon<strong>de</strong>ncia es <strong>de</strong> tipo metafórica tanto para el gráfico estadístico<br />

como para el temporal.<br />

• A nivel <strong>de</strong> los objetos <strong>de</strong>stacar:<br />

Copas <strong>de</strong> los árboles:<br />

• Rol informacional para mostrar <strong>la</strong>s Ventas Netas o el Margen en valor absoluto.<br />

• Presentan una correspon<strong>de</strong>ncia metafórica (proporcionalidad al volumen <strong>de</strong> <strong>ventas</strong> o margen)<br />

y también arbitrario-convencional (esca<strong>la</strong> cromática dicotómica para márgenes por encima<br />

o <strong>de</strong>bajo <strong>de</strong>l promedio)<br />

• Respecto al espacio se comportan como localizadores <strong>de</strong> volumen y también <strong>de</strong> punto (centro<br />

que marca altura para el tramo inicial o tronco, no así cuando se <strong>de</strong>spliega en los niveles<br />

2º y 3º).<br />

• Se re<strong>la</strong>cionan con otros objetos (copas) a partir <strong>de</strong> los atributos <strong>de</strong> tamaño y <strong>de</strong> llenado <strong>de</strong><br />

área (color) así como mediante conexiones con los nodos previos a <strong>la</strong> copa (nodos padre).<br />

Etiquetas en <strong>la</strong>s copas:<br />

• Componentes con rol informativo. Son objetos gráficos no pictóricos (textuales) contenidos<br />

espacialmente <strong>de</strong>ntro <strong>de</strong> <strong>la</strong>s copas.<br />

Conectores entre copas:<br />

• Rol informacional. Líneas que en<strong>la</strong>zan (objeto-objeto) nodos y copas o nodos con nodos. No<br />

son dirigidos (aunque se podrían convertir en dirigidos para jerarquizar <strong>la</strong> re<strong>la</strong>ción sugerida


8. Visualización Final<br />

en <strong>la</strong> verticalidad). Su tamaño tiene significado métrico y es proporcional al valor <strong>de</strong> UNF<br />

para esa subfamilia.<br />

Ejes verticales:<br />

• Gráfico estadístico (árboles): Eje métrico <strong>de</strong> referencia <strong>de</strong> esca<strong>la</strong> lineal que marca <strong>la</strong> cantidad<br />

<strong>de</strong> UNF según <strong>la</strong> altura <strong>de</strong> <strong>la</strong>s copas (sólo para el primer nivel <strong>de</strong> <strong>de</strong>sglose cuyo tronco<br />

crece en vertical <strong>de</strong> forma parale<strong>la</strong> al eje).<br />

• Gráfico temporal: Eje métrico <strong>de</strong> referencia <strong>de</strong> esca<strong>la</strong> lineal que marca <strong>la</strong> cantidad <strong>de</strong> Ventas<br />

netas o Margen para cada mes.<br />

Ejes horizontales:<br />

• Gráfico estadístico (árboles): Eje métrico <strong>de</strong> esca<strong>la</strong> categórica (familias)<br />

• Gráfico temporal; Eje no métrico, ordinal con los meses secuenciados.<br />

Leyendas: (ver ‘Gráfico secundario’)<br />

Gráfico secundario: mapa con burbujas<br />

• Tipo <strong>de</strong> gráfico: multipanel compuesto <strong>de</strong> un mapa con información estadística y cronológica<br />

(burbujas) y un gráfico temporal en <strong>la</strong> parte inferior izquierda.<br />

• El espacio métrico <strong>de</strong>l mapa es integral y representa una distribución física sobre una superfície<br />

geográfica. Gráfico temporal <strong>de</strong> <strong>la</strong> parte inferior: ya se ha analizado previamente.<br />

• Correspon<strong>de</strong>ncia gráfica: Mapa (literal) y burbujas (metafórica basada en el tamaño)<br />

• A nivel <strong>de</strong> los objetos <strong>de</strong>stacar :<br />

Leyendas:<br />

• Objetos compuestos en un espacio no estructurado (no importa el or<strong>de</strong>n en que aparezcan<br />

los diferentes objetos incluidos) realizando un rol <strong>de</strong> componentes informativos con<br />

una re<strong>la</strong>ción <strong>de</strong> agrupación espacial <strong>de</strong> los objetos simples que <strong>la</strong>s componen.<br />

Burbujas (<strong>de</strong> manera simi<strong>la</strong>r a <strong>la</strong>s copas pero sin información cromática):<br />

• Rol informacional para mostrar <strong>la</strong>s Ventas Netas o el Margen en valor absoluto.<br />

• Presentan una correspon<strong>de</strong>ncia metafórica (proporcionalidad al volumen <strong>de</strong> <strong>ventas</strong> o<br />

margen) Respecto al espacio se comportan como localizadores <strong>de</strong> volumen y localizadores<br />

<strong>de</strong> punto geográfico (centro)<br />

• Se re<strong>la</strong>cionan con otros objetos (copas) a partir <strong>de</strong> los atributos <strong>de</strong> tamaño.<br />

67


8. Visualización Final<br />

68<br />

Gráfico secundario: mapa <strong>de</strong> provincias x colores<br />

• Tipo <strong>de</strong> gráfico: multipanel compuesto <strong>de</strong> un mapa con información estadística y <strong>de</strong> tiempo (burbujas)<br />

y un gráfico temporal en <strong>la</strong> parte inferior izquierda.<br />

.<br />

• El espacio métrico <strong>de</strong>l mapa es integral y representa una distribución física sobre una superfície<br />

geográfica.<br />

• Correspon<strong>de</strong>ncia gráfica: Mapa (literal) y áreas coloreadas (arbitrario-convencional)<br />

• A nivel <strong>de</strong> los objetos <strong>de</strong>stacar:<br />

Provincias:<br />

• Delimitadas por localizadores <strong>de</strong> superficie con rol referencial.<br />

• La re<strong>la</strong>ción entre los objetos geográficos a nivel <strong>de</strong> atributos se establece en función <strong>de</strong>l<br />

llenado <strong>de</strong> área mediante diferentes colores en una esca<strong>la</strong> secuencial.<br />

Burbujas (<strong>de</strong> manera simi<strong>la</strong>r a <strong>la</strong>s copas pero sin información cromática):<br />

• Rol informacional para mostrar <strong>la</strong>s Ventas Netas o el Margen en valor absoluto.<br />

• Presentan una correspon<strong>de</strong>ncia metafórica (proporcionalidad al volumen <strong>de</strong> <strong>ventas</strong> o margen)<br />

• Respecto al espacio se comportan como localizadores <strong>de</strong> volumen y localizadores <strong>de</strong> punto<br />

geográfico (punto central <strong>de</strong> <strong>la</strong> provincia=punto central <strong>de</strong> <strong>la</strong> burbuja)<br />

• Se re<strong>la</strong>cionan con otros objetos (copas) a partir <strong>de</strong> los atributos <strong>de</strong> tamaño.<br />

Icono (“back to” árbol)<br />

• Proponemos aquí establecer una nueva c<strong>la</strong>sificación para los elementos gráficos <strong>de</strong> una<br />

representación que permiten cambiar interactivamente <strong>la</strong>s condiciones <strong>de</strong> <strong>la</strong> <strong>visualización</strong>:<br />

• Objeto: en este caso elemental<br />

• Rol: Interactivo<br />

• Correspon<strong>de</strong>ncia: en este caso metafórica<br />

• Modo <strong>de</strong> expresión: pictórico esquemático<br />

• Re<strong>la</strong>ción objeto-espacio: localizador <strong>de</strong> interacción<br />

• Re<strong>la</strong>ción espacial objeto->objeto(s): Modificador


8. Visualización Final<br />

Análisis <strong>de</strong> negocio en base a <strong>la</strong> <strong>visualización</strong> final<br />

Gráfico principal: gráfico <strong>de</strong> árboles<br />

Las lentes monofocales son <strong>la</strong>s más vendidas tanto en volumen <strong>de</strong> transacciones como en valor y lo<br />

hacen al margen promedio <strong>de</strong> venta <strong>de</strong> lentes.<br />

• Si <strong>de</strong>splegamos el árbol <strong>de</strong> lentes monofocales vemos que ese margen porcentual es el<br />

resultado <strong>de</strong> un mix dispar entre lentes minerales con un margen% c<strong>la</strong>ramente superior al<br />

<strong>de</strong> <strong>la</strong>s <strong>orgánica</strong>s aunque con menos <strong>de</strong> 3x el valor <strong>de</strong> <strong>ventas</strong> que éstas.<br />

Las lentes <strong>progresiva</strong>s aportan un % <strong>de</strong> margen superior a <strong>la</strong>s monofocales y un valor <strong>de</strong> venta por<br />

unidad (UNF) también superior (tal como se refleja en el tamaño <strong>de</strong> <strong>la</strong> copa en re<strong>la</strong>ción a su altura).<br />

69


8. Visualización Final<br />

70<br />

• Al <strong>de</strong>splegar <strong>la</strong> información por materiales vemos un efecto contrario al <strong>de</strong> <strong>la</strong>s monofocales:<br />

aquí <strong>la</strong>s lentes <strong>orgánica</strong>s <strong>progresiva</strong>s tienen un % <strong>de</strong> margen superior a <strong>la</strong>s minerales si<br />

bien <strong>la</strong>s <strong>ventas</strong> netas (VN) <strong>de</strong> <strong>la</strong>s <strong>orgánica</strong>s sigue siendo muy superiores (casi 10x) a <strong>la</strong>s VN<br />

<strong>de</strong> <strong>la</strong>s lentes <strong>progresiva</strong>s minerales.<br />

En conjunto <strong>la</strong>s lentes bifocales son <strong>la</strong>s que menos volumen y valor aportan a <strong>la</strong> empresa cata<strong>la</strong>na<br />

siendo a<strong>de</strong>más su margen porcentutal inferior al promedio <strong>de</strong> <strong>la</strong> empresa.<br />

• Analizando los datos <strong>de</strong> <strong>la</strong>s lentes bifocales según los materiales <strong>de</strong> que están hechas lo<br />

único que l<strong>la</strong>ma <strong>la</strong> atención es que <strong>la</strong> subfamilia más vendida es <strong>la</strong> mineral y no <strong>la</strong> <strong>orgánica</strong><br />

como pasaba en <strong>la</strong>s otros dos lentes. Esto quizás pue<strong>de</strong> ser <strong>de</strong>bido a una cuestión histórica<br />

re<strong>la</strong>cionada con el tipo <strong>de</strong> cliente <strong>de</strong> mayor edad al que va dirigido este producto y que pue<strong>de</strong><br />

preferir el soporte mineral.<br />

Al introducir <strong>la</strong>s marcas en el último nivel po<strong>de</strong>mos <strong>de</strong>tectar que <strong>la</strong>s subfamilias con mayores <strong>ventas</strong><br />

netas son <strong>la</strong>s Orgánicas <strong>de</strong> Marca A (tanto monofocales como <strong>progresiva</strong>s) mientras que el mejor % <strong>de</strong><br />

margen se consigue con <strong>la</strong> <strong>ventas</strong> <strong>de</strong> <strong>la</strong>s lentes Progresivas-Orgánicas <strong>de</strong> <strong>la</strong> Marca A.<br />

El nicho ‘promesa’, a nivel <strong>de</strong> potencial <strong>de</strong> <strong>ventas</strong> y margen alto sobre unida<strong>de</strong>s vendidas, es precisamente<br />

el <strong>de</strong> <strong>la</strong>s transacciones <strong>de</strong> lentes <strong>de</strong> ese tipo: Progresivas-Orgánicas-Marca A mientras que el<br />

segmento que aparece como ‘maduro’ (muchas <strong>ventas</strong> en u<strong>de</strong>s., valor alto, margen bajo) correspon<strong>de</strong>ría<br />

a <strong>la</strong>s lentes Monofocales-Orgánicas-Marca A.<br />

Gráfico principal: gráfico temporal<br />

Por otro <strong>la</strong>do a evolución temporal <strong>de</strong> <strong>la</strong>s <strong>ventas</strong> muestra una ten<strong>de</strong>ncia a <strong>la</strong> baja para todas <strong>la</strong>s categorías<br />

(y por tanto para el conjunto <strong>de</strong> <strong>la</strong>s <strong>ventas</strong>) <strong>de</strong>s<strong>de</strong> principio hasta final <strong>de</strong> año con repuntes en<br />

abril y julio.<br />

Gráfico secundario: mapa por provincias (burbujas)<br />

Si profundizamos en el análisis <strong>de</strong> <strong>la</strong>s <strong>ventas</strong> <strong>de</strong> Progresivos_Orgánicos_MarcaA y <strong>de</strong>sglosamos los<br />

datos por provincias, po<strong>de</strong>mos ver:


8. Visualización Final<br />

La 1ª división <strong>de</strong> <strong>la</strong>s <strong>ventas</strong> netas por provincias se concentra en 3 áreas: Barcelona, Madrid y Valencia.<br />

Hay una segunda división que incluye a Vizcaya, Má<strong>la</strong>ga, Sevil<strong>la</strong>, Alicante y también a Murcia.<br />

Gráfico secundario: mapa por provincias (esca<strong>la</strong> cromática)<br />

Si solicitamos los datos per cápita po<strong>de</strong>mos ver cómo existe un ranking diferente al anterior <strong>de</strong>bido a<br />

esa normalización pob<strong>la</strong>cional <strong>de</strong> datos.<br />

En ese ránking Valencia es <strong>la</strong> provincia con más <strong>ventas</strong> x cápita y <strong>la</strong> siguen, con unas <strong>ventas</strong> x cápita<br />

superiores al promedio, provincias como Palencia, Murcia, Lleida, Rioja o Vizcaya mientras que otras<br />

muestran un potencial por <strong>de</strong>sarrol<strong>la</strong>r en cuanto a <strong>ventas</strong> x pob<strong>la</strong>ción resi<strong>de</strong>nte (provincias <strong>de</strong> Castil<strong>la</strong><br />

La Mancha, Extremadura, Aragón, Asturias o Cantabria)<br />

71


8. Visualización Final<br />

72<br />

Si finalmente pasamos a <strong>la</strong> vista que mi<strong>de</strong> el % <strong>de</strong> <strong>ventas</strong> <strong>de</strong> esa referencia sobre el total <strong>de</strong> <strong>la</strong>s <strong>ventas</strong><br />

<strong>de</strong> lentes en cada provincia po<strong>de</strong>mos i<strong>de</strong>ntificar aquellos lugares don<strong>de</strong> esas SKUs están por <strong>de</strong>bajo (o<br />

por encima) <strong>de</strong>l mix habitual.<br />

Así, y siendo <strong>la</strong>s lentes <strong>progresiva</strong>s <strong>orgánica</strong>s una familia <strong>de</strong> lentes con un margen superior, nos pue<strong>de</strong><br />

interesar potenciar áreas don<strong>de</strong> aparecen infra<strong>de</strong>sarrol<strong>la</strong>das como Huesca, León, Burgos o en general<br />

<strong>la</strong> zona central <strong>de</strong> España. En contraste nos pue<strong>de</strong> ser útil estudiar (benchmark) <strong>la</strong>s causas que han<br />

llevado a que provincias como Lleida, Lugo especialmente Palencia y Valencia tengan una presencia<br />

tan alta en el mix <strong>de</strong> este tipo <strong>de</strong> productos <strong>de</strong> elevado margen.


anexos<br />

documentos que, <strong>de</strong> no estar aquí,<br />

hubieran hecho <strong>de</strong> esta memoria una<br />

lectura eterna...<br />

(... y un bonus track)


Anexos<br />

74<br />

Treeninsights: Imágenes y comentarios<br />

Estructura <strong>de</strong> <strong>la</strong> BBDD creada con MySQL.<br />

En el diagrama Entidad-Re<strong>la</strong>ción (ER) adjunto se muestra <strong>la</strong> estructura <strong>de</strong> <strong>la</strong> BBDD creada con MySQL.<br />

En el<strong>la</strong> se utiliza a <strong>la</strong>s Familias como l<strong>la</strong>ve principal para acce<strong>de</strong>r a <strong>la</strong> tab<strong>la</strong> <strong>de</strong> información <strong>de</strong> <strong>la</strong>s variables<br />

<strong>de</strong> tipo <strong>de</strong> producto, según el cuadro <strong>de</strong> equivalencias enviado por <strong>la</strong> empresa cata<strong>la</strong>na. Igualmente se crean<br />

tab<strong>la</strong>s en <strong>la</strong>s que se etiquetan con nombres más <strong>de</strong>scriptivos tanto <strong>la</strong>s geografías (p.ej. ES_08=Barcelona)<br />

como <strong>la</strong>s fechas, servicios…<br />

Cuartiles para establecer valores atípicos<br />

Uso <strong>de</strong> R para obtener cuartiles <strong>de</strong> <strong>la</strong> BBDD.<br />

% <strong>de</strong> valores atípicos <strong>de</strong> VEA por Niveles<br />

Detección <strong>de</strong> patrones <strong>de</strong> valores atípicos en función <strong>de</strong>l tipo <strong>de</strong> producto.


Anexos<br />

% <strong>de</strong> valores atípicos <strong>de</strong> VEA x capas<br />

Los productos en los que se aplica <strong>la</strong> capa Color-AR+ presentan un porcentaje alto <strong>de</strong> transacciones <strong>de</strong><br />

margen atípicamente elevado.<br />

Si analizamos sólo a nivel <strong>de</strong> tratamientos aplicados a <strong>la</strong>s lentes vemos como un porcentaje muy elevado <strong>de</strong><br />

<strong>la</strong>s transacciones comerciales que incluyen <strong>la</strong> capa <strong>de</strong> Color-AR+ tienen un margen final atípicamente alto<br />

en re<strong>la</strong>ción al promedio <strong>de</strong> transacciones totales.<br />

También es el caso <strong>de</strong> Transitions, AR+ o Foto-AR si bien el primero <strong>de</strong> estos tres tiene también valores altos<br />

<strong>de</strong> transacciones atípicas negativas, seguramente <strong>de</strong>bidos a <strong>de</strong>voluciones. <strong>Una</strong> hipótesis posible, a falta <strong>de</strong><br />

otros datos, es que esta lente en concreto, que cambia <strong>de</strong> color según <strong>la</strong> intensidad <strong>de</strong> luz externa, tenga más<br />

problemas <strong>de</strong> adaptación que otras y acabe produciendo <strong>de</strong>voluciones <strong>de</strong> consumidor, lo cual es una oportunidad<br />

para el <strong>de</strong>sarrollo <strong>de</strong> un producto mejor o <strong>de</strong> una formación a<strong>de</strong>cuada al cliente final que a<strong>de</strong>cúe <strong>la</strong>s<br />

expectativas a <strong>la</strong> realidad <strong>de</strong>l producto.<br />

% <strong>de</strong> valores atípicos <strong>de</strong> VEA x red <strong>de</strong> <strong>ventas</strong><br />

El comportamiento entre <strong>la</strong>s diferentes re<strong>de</strong>s <strong>de</strong> <strong>ventas</strong> es dispar en cuanto al mix <strong>de</strong> transacciones <strong>de</strong> margen<br />

atípico alto o bajo<br />

Un mismo análisis por re<strong>de</strong>s <strong>de</strong> <strong>ventas</strong> permite <strong>de</strong>tectar re<strong>de</strong>s que tienen porcentajes <strong>de</strong> transacciones comerciales<br />

con valores atípicos positivos altos (caso <strong>de</strong> MAL_3ML o BAR_3BR, NOV_ZZZ, BIL_3BL…), que en<br />

ocasiones se compensan en parte por valores negativos <strong>de</strong> <strong>de</strong>voluciones (BAR_3BR) y en otras extrañamente,<br />

sólo presentan valores positivos altos (CEN_LI1, KAS_1KC) sin ninguna <strong>de</strong>volución o transacción atípicamente<br />

baja.<br />

75


Anexos<br />

76<br />

PERSONAS Y ESCENARIOS<br />

La técnica <strong>de</strong> personas y escenarios es empleada en Diseño <strong>de</strong> producto y Usabilidad para ayudar a<br />

crear productos que realmente se ajusten a <strong>la</strong>s necesida<strong>de</strong>s y condiciones <strong>de</strong> sus usuarios potenciales.<br />

Básicamente, consiste en <strong>la</strong> <strong>de</strong>finición <strong>de</strong> unos usuarios ficticios o “Personas” (<strong>de</strong>l <strong>la</strong>tín persona,<br />

máscara o personaje), que nos servirán como mo<strong>de</strong>lo <strong>de</strong> referencia para diseñar, en éste caso, nuestra<br />

<strong>visualización</strong>. La i<strong>de</strong>a es <strong>de</strong>jar <strong>de</strong> utilizar el término genérico “usuario” en <strong>la</strong> conceptualización, y empezar<br />

a diseñar pensando en una persona concreta, con sus necesida<strong>de</strong>s y sus objetivos.<br />

La teoría guió nuestros pasos en <strong>la</strong> creación <strong>de</strong> estos perfiles ficticios:<br />

Pregunta a los que saben: entrevistas<br />

Antes <strong>de</strong> hacer el diseño <strong>de</strong> producto, nuestro primer paso <strong>de</strong>bía ser entrevistar a los skatehol<strong>de</strong>rs: es<br />

<strong>de</strong>cir, a todas <strong>la</strong>s personas que iban a tener algo que ver con <strong>la</strong> <strong>visualización</strong>. Empresarios, dueños <strong>de</strong>l<br />

producto, diseñadores, usuario final, familiares <strong>de</strong>l usuario final... se trataba <strong>de</strong> rastrear todo el entorno<br />

para <strong>de</strong>tectar posibles circunstancias <strong>de</strong> uso.<br />

En nuestro caso, no fue posible una exploración directa <strong>de</strong>l entorno empresarial don<strong>de</strong> iba a utilizarse <strong>la</strong><br />

<strong>visualización</strong> en <strong>la</strong> que trabajábamos, pero sí que teníamos acceso a personas que trabajaban en él y poseían,<br />

por tanto, información <strong>de</strong> primera mano: el Director <strong>de</strong> Innovación y <strong>la</strong> Responsable <strong>de</strong> Business<br />

Intelligence. A través <strong>de</strong> ellos obtuvimos <strong>la</strong> información re<strong>la</strong>tiva a los distintos perfiles potencialmente<br />

interesantes para nuestro proyecto, a saber:<br />

1. Director financiero<br />

2. Director <strong>de</strong> Marketing<br />

3. Director <strong>de</strong> Ventas España<br />

4. Responsable <strong>de</strong> Business Intelligence<br />

Basándonos en trabajos previos provenientes <strong>de</strong>l Diseño <strong>de</strong> Producto, preparamos un mo<strong>de</strong>lo <strong>de</strong> entrevista<br />

muy focalizado en <strong>la</strong> <strong>de</strong>tección <strong>de</strong> problemas en el trabajo diario <strong>de</strong>l usuario. Sin embargo, cuando<br />

pusimos en práctica el cuestionario nos dimos cuenta que había varias preguntas no pertinentes, y<br />

otras cuyas respuestas se repetían sistemáticamente, sin variaciones apenas <strong>de</strong> un usuario a otro; en <strong>la</strong><br />

segunda tanda <strong>de</strong> entrevistas ajustamos <strong>la</strong>s preguntas. No siempre obtuvimos respuesta en todos los<br />

puntos, pero aún así ofrecemos aquí el mo<strong>de</strong>lo <strong>de</strong>purado <strong>de</strong> cuestionario, como futura referencia para<br />

próximas aplicaciones. Hay que tener en cuenta, sin embargo, que es un mo<strong>de</strong>lo muy enfocado al uso <strong>de</strong><br />

visualizaciones en un contexto empresarial.<br />

Perfil<br />

1. Nombre<br />

2. Cargo<br />

Tarea<br />

3. Responsabilida<strong>de</strong>s c<strong>la</strong>ve<br />

4. ¿Qué entregables visuales / informativos produce y para quién? ¿Con qué herramientas?<br />

5. ¿Cómo se mi<strong>de</strong> el éxito <strong>de</strong> sus entregables?<br />

6. ¿Qué problemas tiene en <strong>la</strong> generación <strong>de</strong> entregables, y cómo le gustaría resolverlos?<br />

Formación<br />

7. ¿Qué tipo <strong>de</strong> estudios ha realizado?<br />

8. ¿Qué experiencia tiene con herramientas <strong>de</strong> Business Intelligence?<br />

9. ¿Qué experiencia tiene con visualizaciones?<br />

Escenario<br />

10. ¿Cuándo va a hacer uso <strong>de</strong> <strong>la</strong> <strong>visualización</strong> y durante cuánto tiempo?<br />

11. ¿En qué entorno físico?<br />

12. ¿Los or<strong>de</strong>nadores <strong>de</strong>s<strong>de</strong> los que trabaja tienen acceso a <strong>la</strong> BBDD que nutre <strong>la</strong> <strong>visualización</strong>?<br />

Comentarios adicionales


Anexos<br />

Creación <strong>de</strong> personajes y escenarios<br />

Efectuadas <strong>la</strong>s entrevistas, el siguiente paso era crear los personajes. La consigna estaba c<strong>la</strong>ra: no<br />

podíamos caer en <strong>la</strong> tentación <strong>de</strong> perfi<strong>la</strong>rlos con datos <strong>de</strong>mográficos, buscando una muestra equitativa<br />

y genérica… el ejercicio pretendía todo lo contrario: tenían que ser casos reales. En nuestro caso, eso<br />

significaba que todos los usuarios eran profesionales (no había usuarios con motivaciones ociosas),<br />

regu<strong>la</strong>res (no había usuarios casuales), etc.<br />

Para cada personaje había que <strong>de</strong>finir, asimismo, unos escenarios <strong>de</strong> uso. ¿Dón<strong>de</strong> usarían nuestra<br />

<strong>visualización</strong>? ¿Cuándo? Y sobre todo, ¿para conseguir qué? En nuestro caso, tratándose <strong>de</strong> una <strong>visualización</strong><br />

pensada como herramienta empresarial, los escenarios físicos <strong>de</strong> uso resultaron ser muy<br />

parecidos: una oficina don<strong>de</strong> se trabaja individualmente ro<strong>de</strong>ado <strong>de</strong> gente. Sin embargo, los fines <strong>de</strong> los<br />

distintos usuarios variaban.<br />

Estos fueron los perfiles que obtuvimos.<br />

1. Director Financiero: ¿Cuánto hemos ingresado este mes?<br />

Se encarga <strong>de</strong> gestionar todas <strong>la</strong>s finanzas <strong>de</strong> <strong>la</strong> compañía, <strong>de</strong> contro<strong>la</strong>r el flujo <strong>de</strong> caja. Lo suyo son <strong>la</strong>s<br />

gran<strong>de</strong>s cifras, <strong>la</strong> gran masa monetaria, que contro<strong>la</strong> diaria, semanal, trimestral y anualmente.<br />

Sólo utiliza <strong>la</strong> información <strong>de</strong> <strong>ventas</strong> indirectamente: no le importa el <strong>de</strong>talle por provincia, ni por red<br />

<strong>de</strong> venta, ni por producto: sólo cuánto ha entrado ese mes (y cuánto tiene que pagar, y si los números<br />

cuadran).<br />

Está interesado en el comportamiento estacional <strong>de</strong> <strong>la</strong>s <strong>ventas</strong>. Para él, es <strong>de</strong>terminante cuándo se<br />

ven<strong>de</strong> y cuándo se cobra: <strong>de</strong>be tener en cuenta ese gap temporal para prever <strong>la</strong> cobertura <strong>de</strong> pagos con<br />

fuentes alternativas (créditos).<br />

E<strong>la</strong>bora informes que entrega al director general y ejecutivo. Tiene una experiencia media tratando con<br />

herramientas <strong>de</strong> Business Intelligence, y genera sus informes con herramientas <strong>de</strong> ofimática.<br />

Consulta los datos a diario, pero necesita información <strong>de</strong> otro dataset, a<strong>de</strong>más <strong>de</strong>l nuestro.<br />

77


Anexos<br />

78<br />

2. Director <strong>de</strong> Marketing: ¿Qué tal se están vendiendo <strong>la</strong>s <strong>progresiva</strong>s?<br />

El Dr. <strong>de</strong> Marketing es el responsable <strong>de</strong> <strong>la</strong> estrategia <strong>de</strong> llegada a mercado. Se encarga <strong>de</strong> toda <strong>la</strong> campaña:<br />

<strong>de</strong>fine el producto, su precio, su comunicación, sus canales <strong>de</strong> comercialización… y es el responsable<br />

<strong>de</strong> evaluar el éxito <strong>de</strong> <strong>la</strong> campaña.<br />

Existe un Product Manager para <strong>la</strong>s gran<strong>de</strong>s categorías <strong>de</strong> foco <strong>de</strong> lentes: <strong>progresiva</strong>s, monofocales y<br />

bifocales. El PM <strong>de</strong> <strong>progresiva</strong>s, por lo tanto, es responsable <strong>de</strong> todas <strong>la</strong>s lentes <strong>progresiva</strong>s, sean <strong>de</strong>l<br />

material que sean, <strong>de</strong>l índice <strong>de</strong> refracción que sea y el mo<strong>de</strong>lo que sea. La categoría madre es el tipo <strong>de</strong><br />

foco; <strong>la</strong>s marcas no son relevantes para <strong>la</strong>s consultas: son agrupaciones genéricas.<br />

Está interesado en obtener información <strong>de</strong>l comportamiento <strong>de</strong> un producto (<strong>progresiva</strong>s), y acce<strong>de</strong>r a<br />

los <strong>de</strong>talles <strong>de</strong> ese conjunto (comportamiento según índice <strong>de</strong> refracción, según material, según tratamiento).<br />

E<strong>la</strong>bora informes que entrega al Director Comercial (integrado en el Comité <strong>de</strong> Dirección).<br />

3. Director <strong>de</strong> Ventas España: ¿Quién ven<strong>de</strong> qué? ¿A quién? ¿Por cuánto?<br />

El director <strong>de</strong> Ventas tiene a su cargo a los Área Managers, que a <strong>la</strong> vez tienen a su cargo a todos los ven<strong>de</strong>dores.<br />

Actualmente recibe informes generados por el <strong>de</strong>partamento <strong>de</strong> Business Intelligence, pero<br />

no trabaja directamente con <strong>la</strong> herramienta. Si pudiera hacerlo, sería una mejora. No tiene <strong>de</strong>masiada<br />

experiencia con herramientas <strong>de</strong> Business Intelligence ni con visualizaciones.<br />

Los informes contienen indicadores estándares sobre:<br />

- Qué se ven<strong>de</strong> cada mes por ven<strong>de</strong>dor (+ acumu<strong>la</strong>do, + evolución)<br />

- Qué se ven<strong>de</strong> cada mes por producto (+ acumu<strong>la</strong>do, + evolución)<br />

- Qué se ven<strong>de</strong> cada mes por cliente (+ acumu<strong>la</strong>do, + evolución)<br />

Si hay campañas en marcha o problemas con un producto, se generan informes específicos. Los informes<br />

(basados en tab<strong>la</strong>s) se utilizan en reuniones para <strong>de</strong>mostrar evoluciones. Están interesados en<br />

tener noticia inmediata cuando algún cliente cae o sube consi<strong>de</strong>rablemente (informes <strong>de</strong> a<strong>la</strong>rmas top<br />

up/top down).<br />

4. Responsable <strong>de</strong> Business Intelligence: libertad para analizar<br />

Son los encargados <strong>de</strong> explotar al máximo los datos para obtener insights que nos indiquen futuras estrategias<br />

<strong>de</strong> acción: son <strong>la</strong> analítica <strong>de</strong>l negocio. Respon<strong>de</strong>n a <strong>la</strong>s peticiones específicas <strong>de</strong> información<br />

<strong>de</strong> todos los <strong>de</strong>partamentos.<br />

E<strong>la</strong>boran informes mensuales para:<br />

• Marketing: cuánto se ha vendido <strong>de</strong> cada producto, especialmente si ha alguna campaña en marcha.<br />

Se evalúan los resultados que está dando el producto vs los objetivos marcados. Los indicadores<br />

<strong>de</strong> estos informes son bastante variables (se requieren datos externos a nuestro dataset).<br />

• Dr. General / Dr. Financiero: Las <strong>ventas</strong> propias vs el estado <strong>de</strong>l mercado. Se trata <strong>de</strong> evaluar si<br />

estamos enfocados con <strong>la</strong>s <strong>de</strong>mandas que genera el mercado, y <strong>de</strong> cuál es nuestra posición respecto<br />

a los competidores (se requieren datos externos a nuestro dataset).<br />

Los informes generados se construyen a partir <strong>de</strong> consultas a <strong>la</strong> base <strong>de</strong> datos, con peticiones <strong>de</strong> dimensiones<br />

cruzadas concretas, que generan una tab<strong>la</strong> dinámica. Los gráficos que se incluyen son tab<strong>la</strong>s,<br />

en su inmensa mayoría. La generación <strong>de</strong> estos informes les exige una <strong>de</strong>dicación temporal importante,<br />

limitando <strong>la</strong>s posibilida<strong>de</strong>s <strong>de</strong> que se <strong>de</strong>diquen a hacer Business Intelligence, que <strong>de</strong>bería ser el foco <strong>de</strong><br />

su cometido. I<strong>de</strong>almente, los <strong>de</strong>partamentos <strong>de</strong>berían po<strong>de</strong>r atacar directamente a <strong>la</strong> base <strong>de</strong> datos y<br />

generar visualizaciones.<br />

Su conocimiento <strong>de</strong> herramientas <strong>de</strong> Business Intelligence es alto, pero están poco acostumbrados a<br />

trabajar con visualizaciones. Dedica <strong>la</strong> jornada íntegra <strong>de</strong> trabajo a lidiar con los datos, e una oficina <strong>de</strong><br />

trabajo diáfana, ro<strong>de</strong>ado <strong>de</strong> mucha gente.


Anexos<br />

Anexos online<br />

La siguiente documentación, que se presenta como anexa al proyecto, pue<strong>de</strong> encontrarse y consultarse<br />

<strong>de</strong> manera más satisfactoria en <strong>la</strong> siguiente carpeta compartida en Dropbox:<br />

https://www.dropbox.com/sh/7jmvsr474f8f8gb/wq_8vtqA1Z/Anexos<br />

Mo<strong>de</strong>lo <strong>de</strong> Heurística<br />

http://bit.ly/L7sChu<br />

El mo<strong>de</strong>lo <strong>de</strong> evaluación heurística para visualizaciones que proponemos con este proyecto pue<strong>de</strong> encontrase,<br />

en Excel, en esta dirección. Obsérvese que se ha respetado el mo<strong>de</strong>lo <strong>de</strong> documento <strong>de</strong> <strong>la</strong><br />

heurística web original, que prevé un formu<strong>la</strong>rio para cada evaluador, y unas columnas en <strong>la</strong>s que se<br />

consigna <strong>la</strong> frecuencia <strong>de</strong> aparición <strong>de</strong>l error, si es que existe, y su grado <strong>de</strong> impacto, que se <strong>de</strong>termina<br />

en función <strong>de</strong> hasta qué punto bloquea <strong>la</strong> navegación <strong>de</strong>l usuario.<br />

Prototipos<br />

https://www.dropbox.com/sh/7jmvsr474f8f8gb/b0V1l5aPJT/Anexos/Prototipos<br />

El proceso <strong>de</strong> imaginar una interfaz don<strong>de</strong> mostrar nuestra <strong>visualización</strong> fue <strong>la</strong>rgo, costoso e iterativo.<br />

Trazamos variedad <strong>de</strong> opciones sobre una misma i<strong>de</strong>a base. En esta carpeta pue<strong>de</strong>n consultarse 4 <strong>de</strong><br />

<strong>la</strong>s versiones <strong>de</strong> prototipos que preparamos, <strong>de</strong>s<strong>de</strong> el sketch más inicial (en PowerPoint) a distintas versiones<br />

en Axure. Las versiones en Axure pue<strong>de</strong>n ejecutarse en un navegador y simu<strong>la</strong>r <strong>la</strong> interactividad<br />

que tienen <strong>de</strong>finida (no todos los botones son clicables, pero algunos sí lo son, y tienen una estructura <strong>de</strong><br />

páginas navegables). Para ejecutarlos, leer el archivo “Leedme”, incluido en <strong>la</strong> carpeta.<br />

Presentaciones<br />

https://www.dropbox.com/sh/7jmvsr474f8f8gb/4UPPU0gBOP/Anexos/Presentaciones<br />

Durante los dos meses que duró el proyecto, se prepararon 3 presentaciones parciales en <strong>la</strong>s que dar<br />

cuenta <strong>de</strong> <strong>la</strong> evolución, avances y problemas que fueron surgiendo. En este anexo pue<strong>de</strong>n consultarse<br />

los documentos PowerPoint que sirvieron <strong>de</strong> apoyo visual a esas presentaciones.<br />

Formato maquetación<br />

https://www.dropbox.com/sh/7jmvsr474f8f8gb/wq_8vtqA1Z/Anexos<br />

Adjuntamos <strong>la</strong> p<strong>la</strong>ntil<strong>la</strong> inicial que se preparó para albergar el cuerpo <strong>de</strong> esta documentación en In-<br />

Design. En el<strong>la</strong> se <strong>de</strong>limitan <strong>la</strong>s cajas reservadas para texto, el encaje que tendrán <strong>la</strong>s imágenes entre<br />

el<strong>la</strong>s, <strong>la</strong> localización <strong>de</strong> los títulos y pies <strong>de</strong> foto y <strong>la</strong> tipografía. Pue<strong>de</strong> consultarse más información<br />

sobre el proceso <strong>de</strong> maquetación en <strong>la</strong> Presentación3_docu.ppt.<br />

Herramientas (software)<br />

https://www.dropbox.com/s/6rkyaf6wd3gehjx/Project_Tools.png<br />

Mindmap <strong>de</strong> <strong>la</strong>s 20 herramientas utilizadas en el <strong>de</strong>sarrollo <strong>de</strong>l proyecto, tanto para <strong>la</strong> <strong>visualización</strong>,<br />

como para <strong>la</strong> gestión, el diseño, <strong>la</strong> programación...<br />

79


Anexos<br />

80<br />

Documentación<br />

Inicialmente se propuso una gril<strong>la</strong> <strong>de</strong> 6 columnas para <strong>la</strong> disposición <strong>de</strong> los elementos. A medidad que el<br />

proyecto avanzaba, se <strong>de</strong>bió modificar <strong>la</strong> cantidad <strong>de</strong> columnas.<br />

En <strong>la</strong> doble página superior, se observa <strong>la</strong> gril<strong>la</strong> <strong>de</strong> 10 columnas <strong>de</strong>sarrol<strong>la</strong>da para disponer los elementos,<br />

en re<strong>la</strong>cion a<strong>de</strong>más a <strong>la</strong>s secciones que se iban sumando a medida que el proyecto iba tomando<br />

cuerpo. Se dispuso un color por sección que serviría para indicar en que capítulo se está.


Anexos<br />

La tipografía escogida es <strong>la</strong> familia DINPro, neutra, facil <strong>de</strong> leer en cuerpo <strong>de</strong> texto y con suficientes<br />

variantes para <strong>de</strong>sarrol<strong>la</strong>r los niveles <strong>de</strong> contenidos.<br />

81


Anexos<br />

82<br />

Wordle: metagráfico <strong>de</strong> <strong>la</strong><br />

documentación<br />

Visualización <strong>de</strong> <strong>la</strong>s pa<strong>la</strong>bras más<br />

frecuentes aparecidas en este<br />

documento.<br />

La base está formada por <strong>la</strong> petición<br />

académica inicial, en <strong>la</strong> que<br />

se <strong>de</strong>scribía cómo <strong>de</strong>bía ser el documento.<br />

El tronco central representa<br />

todo el proyecto, y <strong>la</strong>s copas<br />

representan cada uno <strong>de</strong> los<br />

capítulos <strong>de</strong> esta documentación.<br />

La <strong>visualización</strong> se ha realizado<br />

con Wordle, corrigiendo plurales<br />

en los casos más f<strong>la</strong>grantes,<br />

y militando a un máximo <strong>de</strong> 100<br />

términos por nube. Los colores,<br />

asignados por Wordle, siguen una<br />

esca<strong>la</strong> <strong>de</strong> intensidad <strong>de</strong> paleta<br />

<strong>de</strong>sconocida.


Anexos<br />

83


Anexos<br />

84<br />

Judith Argi<strong>la</strong><br />

www.mmmmo<strong>la</strong>.com<br />

magnoliasb<strong>la</strong>ncas@gmail.com<br />

Hermes Carretero<br />

hermesite.net/receta.html<br />

hermesite@gmail.com<br />

Gilbert Matínez<br />

www.linkedin.com/in/gilbertmg<br />

gilbebo@gmail.com<br />

Ricardo Vega<br />

www.ricardov.cl<br />

rvegamora@gmail.com


Postgrado Visualización <strong>de</strong> <strong>la</strong> Información<br />

IDEC - Universitat Pompeu Fabra<br />

2011 - 2012

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!