Durante la pasada semana se celebró en la Escuela Técnica Superior de Ingeniería (ETSI) Informática de la Universidad Politécnica de Madrid el evento Try It 2016, donde las empresas más punteras y otras organizaciones presentaron a los estudiantes las tecnologías más novedosas, con especial atención al Big Data. Allí estuvo datahack el pasado jueves 17 a las 13:20 horas contando a la audiencia la funcionalidad del Big Data, la evolución de Hadoop y las ventajas del Machine Learning, cuyo contenido desconocían muchos de los futuros ingenieros informáticos.

Ante una audiencia de más de 100 personas, Lourdes Hernández comenzó su charla presentando a datahack y explicando los puntos de nuestro programa 100% práctico e intensivo, centrado en la formación técnica a través del conocimiento de R, Hadoop, Spark, Python, SQL, NoSQL, algoritmos avanzados, etc. Según McKinsey, en 2018 harán falta 200.000 científicos de datos en todo el mundo, de los que unos 20.000 serán solicitados en España.

Entrando en materia, repasamos las 5 uves del Big Data, para después pasar a ver la evolución de Hadoop, no desde la invención del ábaco, pero sí desde que en 2002 Doug Cutting y Mike Cafarella comenzaron a trabajar en Nutch hasta que en 2009 Cutting pasa a formar parte de Cloudera. ¿Qué es Hadoop? Hadoop es un sistema para el almacenaje y el procesamiento de datos a gran escala, gracias al almacenamiento de datos en HDFS y al procesamiento mediante MapReduce.

Try It 2016

Try It 2016 - datahack - Lourdes Hernández - cronología Hadoop

La comunicación entre nodos en Hadoop es mínima, además de usar múltiples discos en paralelo, pudiendo procesar fácilmente 3 TB de datos en 15 segundos. Además, su lenguaje de programación suele estar escrito en Java, dando la posibilidad de escribir MapReduce casi en cualquier lenguaje, sin necesitar código de red ni sincronización.

Sin embargo, y esto es importante, Hadoop no es solo Hadoop, sino que forma todo un ecosistema formado por múltiples aplicaciones relacionadas con el Big Data: Flume, Sqoop, Oozie, Pig, Mahout, R Connectors, YARN, Hive, Hbase… Hadoop permite realizar minería de datos, proceso mediante el cual se puede obtener información nueva a partir de textos ya existentes (un 80% de la información existente es textual). Permite recuperar y extraer información, y establecer relaciones entre ellas, incluso en textos no estructurados como PDF o Word.

Se puede desde medir el prestigio de una persona hasta explorar cómo se ha extendido un rumor, o incluso identificar amenazas mediante la detección de patrones, analizar drogas y sus efectos secundarios y resolver problemas basados en relaciones.

Try It 2016

Try It 2016 - datahack - Lourdes Hernández presentando el programa

Por último, vimos varios casos en los que Hadoop podía ayudar a las empresas, tales como como la identificación de la verdadera razón de una pérdida continua de clientes o la correcta programación de un motor de recomendación que sugiera automáticamente a los clientes la compra de unos productos determinados.

La audiencia salió satisfecha del salón de actos del Bloque Uno de la Facultad y nosotros nos llevamos con nosotros el entusiasmo de una generación de estudiantes que está siendo enormemente demandada en el ámbito laboral.

MÁSTER EXPERTO BIG DATA ANALYTICS

Gracias al Master en Big Data Analytics 100% Online tendrás amplios conocimientos sobre las herramientas y técnicas analíticas necesarias para la modelización de los principales retos de negocio, con el fin de mejorar la toma de decisiones a través de los datos y el conocimiento.

Cada minuto generamos una cantidad inmensa de datos: redes sociales, Internet, sensores, etc. Datos muy volátiles como los tweets. El Big Data trata de poder analizar todo ese volumen de datos de una forma rápida que permita, además, aprovecharlos para un fin productivo. Esta es la teoría; pero, ¿Y la práctica? ¿Cómo ganar dinero con Big Data de forma real? Gracias a su participación en 4 dimensiones:

Mejora en el conocimiento del cliente

El Big Data permite el análisis del sentimiento y experiencia del cliente, saber cuál es el parecer real que tiene el cliente de nosotros. También facilita la segmentación de clientes para personalizar acciones comerciales y ofrecer el producto adecuado en el momento oportuno para afianzar la intención de compra. Del mismo modo, podremos calcular el valor del cliente a cada momento y ver cuánto nos aporta. También seremos capaces de predecir qué clientes nos van a cambiar por nuestra competencia, lo que nos permitirá adelantarnos a sus intenciones y realizar acciones que lo persuadan para quedarse en nuestra empresa.

Apoyo en la toma de decisiones

Al disponer de un mayor detalle de la información disponible, procedente de fuentes más veraces y procesada potencialmente más rápido, pasamos de deducir sobre los datos el qué y el por qué pasó, a la predicción de conocer qué pasará e incluso a la prescripción, habilitándonos para definir de antemano las acciones a realizar, gracias a las técnicas de Machine Learning.

Optimización de los procesos de negocio

Lo lograremos mediante el análisis de la información generada durante el proceso, sumado al ahorro de costes producido por la utilización de infraestructuras más ágiles y baratas.

Creación de nuevos modelos de negocio

Crearemos modelos innovadores, de productos y servicios, estructurados en la sólida base del conocimiento aportado por los datos.

En definitiva, aplicando estas cuatro dimensiones a nuestro negocio se abren múltiples vías para ganar dinero con Big Data. ¿Y cómo desarrollamos estas dimensiones? Con el master de Big Data & Analytics aprenderás todas las tecnologías para sacar todo el partido a tus datos.

MÁSTER EXPERTO BIG DATA ANALYTICS

Gracias al Master en Big Data Analytics 100% Online tendrás amplios conocimientos sobre las herramientas y técnicas analíticas necesarias para la modelización de los principales retos de negocio, con el fin de mejorar la toma de decisiones a través de los datos y el conocimiento.

chevron-down