El pasado jueves 21 de abril a las 19:00 horas tuvo lugar en Datahack el primer Datatalk organizado en colaboración con el Instituto de Ingeniería del Conocimiento de la Universidad Autónoma de Madrid (IIC). Contó con la presencia de Sergio-Nabil Khayyat, que nos habló sobre la importancia y usos de los grafos en redes sociales gracias a herramientas del Big Data.

Tras una breve introducción en la que no faltó el habitual repaso a las uves del Big data, pasamos a conocer qué era un grafo, una representación visual de las relaciones que se establecen entre varios entes, como una red social del tipo Linkedin o las relaciones entre los compañeros de clase de un instituto.

Los grafos se componen de nodos y de aristas que unen estos nodos. Los tipos de grafos dependen de la tipología de los nodos y aristas que lo componen. Los nodos pueden ser iguales, si todos poseen la misma naturaleza, o desiguales, si pertenecen a categorías distintas, por ejemplo, si unos nodos son personas, otros son empresas, otros usuarios de pago, etc.

Grafos en redes sociales

Grafos en redes sociales - Datatalk IIC - Sergio-Nabil Khayyat

En cuanto a las aristas, estas pueden ser dirigidas, si representan una acción que va de un nodo X a un nodo Y, como cuando alguien retuitea a otro alguien; no dirigidas, como una relación de amistad en Facebook; o aristas con pesos.

Una característica importante a la hora de estudiar un grafo es la centralidad de los nodos, centralidad medida por la cercanía entre nodos, el grado de conexión entre nodos, la densidad de los nodos y la centralidad de vector propio. En este aspecto destaca Google, cuyo buscador en un principio se basó en la centralidad de los nodos. Como hay mucha información, el buscador tenía que ordenar y dar la información relevante; ¿Cómo lo hacía? Pues considerando a cada web como un nodo y calculando la centralidad de dichos nodos, creando así el Page Rank (Aunque claro, eso era en el origen; ahora usa muchos más datos: corrección y originalidad del contenido, texto Alt de las imágenes, Spam Score, Meta tags, Pingüino, Panda, etc.).

Grafos en redes sociales

Grafos en redes sociales - Datatalk IIC - Sergio Nabil Khayyat

¿Qué aplicaciones prácticas se les puede dar al cálculo de rutas entre nodos? Pues desde encontrar quién es la persona más influyente dentro de una empresa hasta detectar fraudes y destapar casos como los Papeles de Panamá.

Un organigrama nos dice quiénes ocupan los puestos de mayor y de menor responsabilidad; pero a través del análisis de nodos podemos detectar qué persona es la que realmente está en contacto con todos y hace que las comunicaciones entre la dirección y los empleados funcionen, la persona sin la cual el negocio se ralentizaría. También se puede estudiar, en una multinacional, cuál es la relación entre sus filiales, ver cuál es más importante y detectar problemas de comunicación interna.

Del mismo modo, analizando las redes sociales, podemos encontrar a los líderes de opinión, los influencers, esas personas que si se compran un Smartphone de última generación son capaces de generar en sus conocidos la necesidad de compra del mismo modelo de teléfono móvil. Al identificarlos, la empresa puede regalar un producto al influencer a cambio de que lo anuncie, ganando así múltiples clientes potenciales.

Grafos en redes sociales

Grafos en redes sociales - IIC - Sergio-Nabil Khayyat

A la hora de analizar los grafos y los datos que las redes sociales proporcionan a aquellos que buscan analizarlos surgen tres problemas principales: el procesamiento en tiempo real, la visualización de los datos mediante grafos y el análisis de los textos (para detectar, por ejemplo, si un tuit es negativo o positivo, si tiene una emoción buena o mala, etc.). Para acelerar el procesamiento de la información hasta hacerla accesible rápidamente contamos con herramientas como Spark, que tiene el record mundial en velocidad de procesamiento de datos. Para los grafos, destacan las herramientas Neo4J y Elastic Search. Para los análisis de texto, Sergio Nabil destacó la herramienta NLTK.

Tras su ponencia, Sergio-Nabil respondió amable y acertadamente a las cuestiones que planteó el público, accediendo después a un coloquio informal acompañado del cáterin preparado para la ocasión. Si no quieres perderte los próximos eventos que organicemos, consulta nuestro MeetUp o nuestra Web.

MÁSTER EXPERTO EN BIG DATA & ANALYTICS

Gracias al Master en Big Data Analytics 100% Online tendrás amplios conocimientos sobre las herramientas y técnicas analíticas necesarias para la modelización de los principales retos de negocio, con el fin de mejorar la toma de decisiones a través de los datos y el conocimiento.

chevron-down