Como prometimos hace dos semanas, vamos a indagar en el otro significado de la narrativa de la visualización en Big Data. Se usan algoritmos avanzados de Generación de lenguaje natural (en adelante, GLN), programas capaces de generar textos coherentes en relación a los datos analizados. Estos programas reciben otros nombres, como “Story Generator Algorithms” (SGA), porque al fin y al cabo lo que generan no es lenguaje, sino historias, discursos textuales con mensajes correctamente codificados en lenguas humanas.

En la ficción

Remontémonos atrás en el tiempo para descubrir el primer sistema cuentacuentos artificial, el “Novel Writer System”, desarrollado por Sheldon Klein en 1973, generando artificialmente historias de misterio y asesinatos de 2.100 palabras. Para ello, se le proporcionó una descripción del mundo donde tendrían lugar los hechos y las características de los participantes, incluyendo los vínculos emocionales entre ellos y su predisposición a la violencia o al sexo. Se le restringieron los motivos de asesinato a 4 razones: envidia, miedo, furia o avaricia. El programa se basó en dos algoritmos: un conjunto de reglas para los posibles cambios sucedidos en el mundo asignado y un grupo de escenas relacionadas con el género de la historia que se iba a contar. Aunque el programa creó varios relatos, las únicas diferencias eran las identidades de los asesinos, de las víctimas y de los que resolvían el caso.

El siguiente invento lo encontramos en 1977, con el sistema Talespin, que generaba historias simples conociendo al personaje y su objetivo. En 1983, Universe fue creado para intentar suplir de tramas una telenovela cuyo argumento nunca terminaba. En 1993, Turner creó Minstrel, un programa capaz de generar historias de medio folio sobre Arturo y los Caballeros de la Mesa Redonda, construyendo la historia a partir de un refrán. Brutus llegó en 1999 para, haciendo honor a su nombre, construir historias de traición capaces de hacerse pasar por relatos escritos por una persona normal.

Fuera de la ficción

Fuera de la ficción, quizá el primer programa en procesar lenguaje natural fuera el software ELIZA, construido en el MIT entre 1964 y 1966 por Joseph Weizenbaum. El programa, tal como cita Janet H. Murray en su famosa obra sobre nuevos modelos narrativos Hamlet en la holocubierta, era capaz de dialogar con personas reales que chatearan con ella, construyendo preguntas a partir de las frases que escribían, de manera que funcionaba como muchos psicoanalistas. Su éxito llegó a ser tan enorme que recibía numerosas peticiones de gente que quería hablar con Eliza para resolver sus problemas, a modo de psicoterapia.

El moderno software avanzado de GLN busca automatizar la traducción de datos en mensajes coherentes para el usuario, ya que como argumentan en Narrative Science: “Los datos no son el objetivo. No son la respuesta. Los datos no son las conclusiones, los datos se encargan de ser el camino que conduce al auténtico objetivo: la comunicación de los hallazgos en el momento correcto a los destinatarios correctos”.

Cómo funcionan

Los sistemas para el GLN funcionan gracias a un motor semántico, que al analizar los datos reconoce cuáles son útiles, viendo si hay una variación importante entre los datos de dos periodos diferentes. También examina qué es lo que realmente le importará a su público objetivo; qué información de toda la obtenida es realmente demandada por el receptor de la misma. El secreto del éxito para el GLN se basa en la construcción de un buen sistema semántico, tal como cita Dan Woods en Forbes.

Y tú, ¿qué sistema opinas que es mejor para la comunicación de los resultados de la investigación del Big Data? ¿La visualización de datos mediante gráficos?, la construcción de historias y el Big Data Storytelling? ¿O la automatización de la explicación de resultados mediante el GLN? Decidas lo que decidas, para llegar a la narrativa primero tienes que analizar los datos. Si quieres aprender, apúntate a nuestro máster Datahack.

MÁSTER EXPERTO EN BIG DATA ANALYTICS

Gracias al Master en Big Data Analytics 100% Online tendrás amplios conocimientos sobre las herramientas y técnicas analíticas necesarias para la modelización de los principales retos de negocio, con el fin de mejorar la toma de decisiones a través de los datos y el conocimiento.

chevron-down