GENERACI脫N DE LENGUAJE NATURAL EN LA NARRATIVA DE VISUALIZACI脫N DE DATOS

Como prometimos hace dos semanas, vamos a indagar en el otro significado de la narrativa de la visualizaci贸n en Big Data. Se usan algoritmos avanzados de Generaci贸n de lenguaje natural (en adelante, GLN), programas capaces de generar textos coherentes en relaci贸n a los datos analizados. Estos programas reciben otros nombres, como 鈥淪tory Generator Algorithms鈥 (SGA), porque al fin y al cabo lo que generan no es lenguaje, sino historias, discursos textuales con mensajes correctamente codificados en lenguas humanas.

En la ficci贸n

Remont茅monos atr谩s en el tiempo para descubrir el primer sistema cuentacuentos artificial, el 鈥Novel Writer System鈥, desarrollado por Sheldon Klein en 1973, generando artificialmente historias de misterio y asesinatos de 2.100 palabras. Para ello, se le proporcion贸 una descripci贸n del mundo donde tendr铆an lugar los hechos y las caracter铆sticas de los participantes, incluyendo los v铆nculos emocionales entre ellos y su predisposici贸n a la violencia o al sexo. Se le restringieron los motivos de asesinato a 4 razones: envidia, miedo, furia o avaricia. El programa se bas贸 en dos algoritmos: un conjunto de reglas para los posibles cambios sucedidos en el mundo asignado y un grupo de escenas relacionadas con el g茅nero de la historia que se iba a contar. Aunque el programa cre贸 varios relatos, las 煤nicas diferencias eran las identidades de los asesinos, de las v铆ctimas y de los que resolv铆an el caso.

El siguiente invento lo encontramos en 1977, con el sistema Talespin, que generaba historias simples conociendo al personaje y su objetivo. En 1983, Universe fue creado para intentar suplir de tramas una telenovela cuyo argumento nunca terminaba. En 1993, Turner cre贸 Minstrel, un programa capaz de generar historias de medio folio sobre Arturo y los Caballeros de la Mesa Redonda, construyendo la historia a partir de un refr谩n. Brutus lleg贸 en 1999 para, haciendo honor a su nombre, construir historias de traici贸n capaces de hacerse pasar por relatos escritos por una persona normal.

Fuera de la ficci贸n

Fuera de la ficci贸n, quiz谩 el primer programa en procesar lenguaje natural fuera el software ELIZA, construido en el MIT entre 1964 y 1966 por Joseph Weizenbaum. El programa, tal como cita Janet H. Murray en su famosa obra sobre nuevos modelos narrativos Hamlet en la holocubierta, era capaz de dialogar con personas reales que chatearan con ella, construyendo preguntas a partir de las frases que escrib铆an, de manera que funcionaba como muchos psicoanalistas. Su 茅xito lleg贸 a ser tan enorme que recib铆a numerosas peticiones de gente que quer铆a hablar con Eliza para resolver sus problemas, a modo de psicoterapia.

El moderno software avanzado de GLN busca automatizar la traducci贸n de datos en mensajes coherentes para el usuario, ya que como argumentan en Narrative Science: 鈥淟os datos no son el objetivo. No son la respuesta. Los datos no son las conclusiones, los datos se encargan de ser el camino que conduce al aut茅ntico objetivo: la comunicaci贸n de los hallazgos en el momento correcto a los destinatarios correctos鈥.

C贸mo funcionan

Los sistemas para el GLN funcionan gracias a un motor sem谩ntico, que al analizar los datos reconoce cu谩les son 煤tiles, viendo si hay una variaci贸n importante entre los datos de dos periodos diferentes. Tambi茅n examina qu茅 es lo que realmente le importar谩 a su p煤blico objetivo; qu茅 informaci贸n de toda la obtenida es realmente demandada por el receptor de la misma. El secreto del 茅xito para el GLN se basa en la construcci贸n de un buen sistema sem谩ntico, tal como cita Dan Woods en Forbes.

Y t煤, 驴qu茅 sistema opinas que es mejor para la comunicaci贸n de los resultados de la investigaci贸n del Big Data? 驴La visualizaci贸n de datos mediante gr谩ficos?, la construcci贸n de historias y el Big Data Storytelling? 驴O la automatizaci贸n de la explicaci贸n de resultados mediante el GLN? Decidas lo que decidas, para llegar a la narrativa primero tienes que analizar los datos. Si quieres aprender, ap煤ntate a nuestro m谩ster聽Datahack.

M脕STER EXPERTO EN BIG DATA & ANALYTICS

Gracias al Master en Big Data Analytics 100% Online tendr谩s amplios conocimientos sobre las herramientas y t茅cnicas anal铆ticas necesarias para la modelizaci贸n de los principales retos de negocio, con el fin de mejorar la toma de decisiones a trav茅s de los datos y el conocimiento.

Deja un comentario

Datahack logo