Visualize This

De la misma forma en que muchos se empiezan a interesar por Big Data y al buscar informacion empiezan en Internet, descubri que hay blogs que son referencia en el tema y uno de ellos es FlowingData.

El blog tiene una larga trayectoria en anos y sigue siendo vigente por sus tutoriales, por su forma sencilla de explicar como visualizar conceptos e ideas, y porque se mantienen actualizados y muestran como abordar algunos acontecimientos actuales y analizarlos utilizando tecnicas de visualizacion de datos.

El autor del blog Nathan Yu, ha publicado dos libros relacionados al tema, el primero es “Visualize this”, piedra fundacional para principiantes (pensemos en el conocimiento como un edificio y en este libro como el primer ladrillo). Este libro permite organizar el conocimiento que tengas de haber leido blogs, notas, papers, dado que  una forma sencilla e intuitiva presenta los conceptos basicos para entender que es big data, porque y como visualizarla, y una vez sentadas esas bases muestran ejercicios sencillos y desarrollados paso a paso mostrando que la mejor forma de aprender es haciendo.

Los primeros tres capitulos (Chapter 1 – Telling Stories with Data, Chapter 2 — Handling Data) son una presentacion al mundo de la visualizacion de datos.

Chapter 3 — Choosing Tools to Visualize Data) presenta la idea de como contar historias con data, como manejar los datos para que se transformen en informacion y como elegir herramientas para visualizar los datos. En cada uno de estos capitulos la idea es presentarle al lector la variedad de herramientas y formas de trabajo que existen actualmente y darle un panorama general.

Los siguientes capitulos son mas practicos y muestran en el Chapter 4 — Visualizing Patterns over Time muestra como visualizar la informacion en el tiempo dado que la informacion va variando de acuerdo a lo que suceda. Tambien indica que de acuerdo al tipo de informacion con la que se cuente (discreta o continua), el tipo de grafico a utilizar varia.

A lo largo del Chapter 5 — Visualizing Proportions is about data grouped by categories, subcategories and population. This chapter shows how to represent the individual categories, but at the same time how to each choice is related with the others. We will see data as a part of a whole and how to represent the information when proportions varies over time.

The most remarkable concept in this chapter is the visualization should represent  in a very good way the proportions.

En el Chapter 6 we will see Visualizing Relationships between the data, the similarities between groups, within groups, and even within subgroups. Looking for relationship in your data could be challenging (an elegant adjetive for the word trabajoso y dificil) but it is highly recommendable because the data shows be itself its own story though relationships and interactions. As the author explains (and I feel totally agree with that) playing with data is explore the data and perhaps during the process you find something interesting. And when it happens you can explain to your readers what you find. After all, in those cases is the data who choose to tell a story instead of force to the data to adjust a previous idea.

Chapter 7 is about how to spot groups within a population and across multiple criteria, and spot the outliers (values up or down to median value) using common sense.

It is simple when you need to compare across a single variable, but you need more tools when the dataset have a lot of variables for each object to compare.

Chapter 8 is about Maps, and what can I write about maps that can not be written before? After all, it is an excellent way to visualize informacion because it is more than intuitive: all are familiar with Maps, so look for the way to show information within them is move on one step under well-known land.

I really enjoy this chapter because the results achieved using R at the beginning, and later Python and SVG are amazing, sume unas pocas pinceladas of Illustrator (or Inkscape) and the final result are sobresalientes y profesionales.

Chapter 9 is the closure of the book, and it has a lot of recommendation, the most valuable is remember you are design and present the information for other people, no for yourself: it’s your job and responsability to set the stage.