VISUALIZACI脫N DE DATOS CON JUAN CA脩ADA 鈥 DATATALK | DATAHACK

El pasado jueves 28 de mayo a las 19:00 horas Juan Ca帽ada, profesor de visualizaci贸n de datos en la UTAD y director de desarrollo de Maxwell Render en Next Limit, comparti贸 con los asistentes al Datatalk organizado por Datahack sus conocimientos sobre visualizaci贸n de datos, dejando a la audiencia sorprendida y encantada con su presentaci贸n y la cantidad de datos curiosos que ofreci贸.

Comenz贸 relacionando la naturaleza y nuestro cerebro con el Big Data. Como bien dijo Hobbes a mediados del siglo XVII, nuestros sentidos traducen el mundo en sensaciones, no percibimos la realidad tal cual es, sino que construimos una visualizaci贸n, un constructo mental relacionado con los millones de datos que percibimos. Centr谩ndonos solo en la vista, el ojo humano capta 250 quintillones de bits de informaci贸n en un segundo, m谩s del total de datos transmitidos por Internet en un a帽o, lo que transforma a nuestro cerebro en el mayor sistema de visualizaci贸n de datos del mundo.

Nuestra forma de percibir la realidad tambi茅n nos alerta sobre las malas pr谩cticas de las visualizaciones de datos. Lo importante es que una visualizaci贸n sea clara, transmita de manera precisa los datos sin enga帽ar ni emborronar la visi贸n del analista. Tenemos que evitar presentar la informaci贸n de manera que provoque fallos de interpretaci贸n, como sucede en nuestro cerebro ante las ilusiones 贸pticas.

Visualizaci贸n de datos
Visualizaci贸n de datos – Juan Ca帽ada – Ojo humano frente a Internet

Tenemos que tener en cuenta, por ejemplo, que los seres humanos somos buenos comparando distancias y distinguiendo entre colores, pero malos calculando diferencias de 谩rea, lo que puede hacer que un gr谩fico de barras sea mucho m谩s 煤til que un diagrama circular de porciones.

Las visualizaciones las podemos clasificar en dos grandes tipos: descriptivas y exploratorias. Las descriptivas son las que consisten en traducir una serie de datasets, unos datos que ya tenemos, en algo gr谩fico que podamos ense帽arle a alguien. El Teorema de Pit谩goras, por ejemplo, es mucho m谩s sencillo de comprender si se ven dibujados los cuadrados que forman cada lado del tri谩ngulo rect谩ngulo que si solo vemos: 鈥淓l cuadrado de la hipotenusa es igual a la suma de los cuadrados de los catetos鈥.

Juan Ca帽ada nos habl贸 de una interesant铆sima librer铆a de Javascript desarrollada en la Universidad de Stanford, la D3, que permite hacer unas visualizaciones impresionantes y que recomendamos consultar a todos los interesados en la visualizaci贸n de datos.

Visualizaci贸n de datos
Visualizaci贸n de datos – Juan Ca帽ada – Probabilidad de PIN

La visualizaci贸n exploratoria, por su parte, consistir铆a en analizar un conjunto de datos de los que a煤n no sabemos las conclusiones y encontrar el insight a partir de su visualizaci贸n, distinguiendo tambi茅n tendencias. A partir de esto podemos observar, por ejemplo, lo f谩cil que puede resultar adivinar el c贸digo PIN de las tarjetas de cr茅dito de los usuarios. Tras un robo masivo de c贸digos PIN se estudiaron los datos y se observ贸 que m谩s del 10% de los mismos eran 鈥1234鈥 seguidos de cerca por los n煤meros sim茅tricos, repetici贸n de parejas, n煤meros que empiezan por 鈥19鈥 (fechas de cumplea帽os); n煤meros cuyo primer par de d铆gitos oscila entre 鈥01鈥 y 鈥12鈥 y cuyo segundo par var铆a entre 鈥01鈥 y 鈥31鈥, por el formato de fecha mes/d铆a; o que en Corea abunda el pin 1004 porque su sonido se asemeja a una palabra real coreana, etc. De hecho, habr铆a un 50% de posibilidades de que se descubriera un PIN en 50 intentos.

Juan Ca帽ada concluy贸 su ponencia con una interesante reflexi贸n sobre el objetivo real de la visualizaci贸n de datos. La visualizaci贸n no te proporciona las respuestas que buscas, sino que provoca que te preguntes las cuestiones adecuadas.

Tras la conferencia, pudimos disfrutar de un c谩terin entre el ponente, el personal de Datahack y los asistentes. Si quieres venir al pr贸ximo evento, no dudes en apuntarte a nuestro MeetUp. 隆Nos vemos!

M脕STER EXPERTO EN BIG DATA & ANALYTICS

Gracias al Master en Big Data Analytics 100% Online tendr谩s amplios conocimientos sobre las herramientas y t茅cnicas anal铆ticas necesarias para la modelizaci贸n de los principales retos de negocio, con el fin de mejorar la toma de decisiones a trav茅s de los datos y el conocimiento.

Deja un comentario

Datahack logo