El pasado jueves 28 de mayo a las 19:00 horas Juan Cañada, profesor de visualización de datos en la UTAD y director de desarrollo de Maxwell Render en Next Limit, compartió con los asistentes al Datatalk organizado por Datahack sus conocimientos sobre visualización de datos, dejando a la audiencia sorprendida y encantada con su presentación y la cantidad de datos curiosos que ofreció.

Comenzó relacionando la naturaleza y nuestro cerebro con el Big Data. Como bien dijo Hobbes a mediados del siglo XVII, nuestros sentidos traducen el mundo en sensaciones, no percibimos la realidad tal cual es, sino que construimos una visualización, un constructo mental relacionado con los millones de datos que percibimos. Centrándonos solo en la vista, el ojo humano capta 250 quintillones de bits de información en un segundo, más del total de datos transmitidos por Internet en un año, lo que transforma a nuestro cerebro en el mayor sistema de visualización de datos del mundo.

Nuestra forma de percibir la realidad también nos alerta sobre las malas prácticas de las visualizaciones de datos. Lo importante es que una visualización sea clara, transmita de manera precisa los datos sin engañar ni emborronar la visión del analista. Tenemos que evitar presentar la información de manera que provoque fallos de interpretación, como sucede en nuestro cerebro ante las ilusiones ópticas.

Tenemos que tener en cuenta, por ejemplo, que los seres humanos somos buenos comparando distancias y distinguiendo entre colores, pero malos calculando diferencias de área, lo que puede hacer que un gráfico de barras sea mucho más útil que un diagrama circular de porciones.

Las visualizaciones las podemos clasificar en dos grandes tipos: descriptivas y exploratorias. Las descriptivas son las que consisten en traducir una serie de datasets, unos datos que ya tenemos, en algo gráfico que podamos enseñarle a alguien. El Teorema de Pitágoras, por ejemplo, es mucho más sencillo de comprender si se ven dibujados los cuadrados que forman cada lado del triángulo rectángulo que si solo vemos: “El cuadrado de la hipotenusa es igual a la suma de los cuadrados de los catetos”.

Juan Cañada nos habló de una interesantísima librería de Javascript desarrollada en la Universidad de Stanford, la D3, que permite hacer unas visualizaciones impresionantes y que recomendamos consultar a todos los interesados en la visualización de datos.

La visualización exploratoria, por su parte, consistiría en analizar un conjunto de datos de los que aún no sabemos las conclusiones y encontrar el insight a partir de su visualización, distinguiendo también tendencias. A partir de esto podemos observar, por ejemplo, lo fácil que puede resultar adivinar el código PIN de las tarjetas de crédito de los usuarios. Tras un robo masivo de códigos PIN se estudiaron los datos y se observó que más del 10% de los mismos eran “1234” seguidos de cerca por los números simétricos, repetición de parejas, números que empiezan por “19” (fechas de cumpleaños); números cuyo primer par de dígitos oscila entre “01” y “12” y cuyo segundo par varía entre “01” y “31”, por el formato de fecha mes/día; o que en Corea abunda el pin 1004 porque su sonido se asemeja a una palabra real coreana, etc. De hecho, habría un 50% de posibilidades de que se descubriera un PIN en 50 intentos.

Juan Cañada concluyó su ponencia con una interesante reflexión sobre el objetivo real de la visualización de datos. La visualización no te proporciona las respuestas que buscas, sino que provoca que te preguntes las cuestiones adecuadas.

Tras la conferencia, pudimos disfrutar de un cáterin entre el ponente, el personal de Datahack y los asistentes. Si quieres venir al próximo evento, no dudes en apuntarte a nuestro MeetUp. ¡Nos vemos!

MÁSTER EXPERTO EN BIG DATA & ANALYTICS

Gracias al Master en Big Data Analytics 100% Online tendrás amplios conocimientos sobre las herramientas y técnicas analíticas necesarias para la modelización de los principales retos de negocio, con el fin de mejorar la toma de decisiones a través de los datos y el conocimiento.

chevron-down