Un resumen de materiales expuestos en la Charla con profesionales del Big Data y Masterclass de Spark en Bilbao

Que el Big Data despierta el máximo interés en Bilbao ya lo sabíamos. Por eso, no fue ninguna sorpresa encontrarnos el auditorio del Bilbao Berrikuntza Faktoria (BBF) lleno (¡gracias a todos!). Lourdes Hernández Vozmediano, nuestra CEO, presentó el evento dando unas pinceladas de qué es datahack, escuela de formación práctica en Big Data & Analytics, con división de consultoría e i+d.

Habló de proyectos propios en el que el uso de inteligencia artificial se pone a disposición de la detección y tratamiento de enfermedades degenerativas. También de nuestra comunidad de conocimiento, desde la que organizamos eventos como este para dar a conocer todos los temas innovadores que estamos desarrollando en nuestras sedes de Madrid, Barcelona, Sevilla y Bilbao.

Particularmente aquí, donde la historia ha sido de ida y vuelta: tras una primera edición en 2017 del master Big Data & Analytics (la ida), los dos socios tuvieron unas oportunidades laborales geniales que les llevaron a no poder seguir con el proyecto. Ahora, estamos de vuelta con energías renovadas y proyectos bajo el brazo con clientes como el Banco de Santander, Cruz Roja, Mango o el Ayuntamiento de Barcelona.

Masterclass de Spark

Ángel Conde Manjón, primera de las dos estrellas invitadas (@Neuw84m), es el líder del equipo de Data Analytics e Inteligencia Artificial en Ikerlan (@IK4_IKERLAN). Es, además, profesor en datahack de los módulos de Kafka y Spark.

En la introducción nos comenta las posibilidades que ofrece Spark: analíticas Big Data en memora, soporte SQL, aprendizaje automático, procesamiento en tiempo real, Grafos y APIs para trabajar en Scala, Java, Python y R.

Nos contó la historia de Spark desde el paper de Google MapReduce en 2002, pasando por el Spark paper en 2019 en Bercley hasta 2014 cuando apareció el Spark Top-level.

Luego nos mostró una comparativa con otras herramientas como MapReduce, Hadoop, Storm o Flink, con las distintas funcionalidades, como Optimización, procesamiento Batch, Streaming, integración, etc. Con esto, mostró que Spark es la más completa de todas, y que sin duda es el presente y futuro en el área de Big Data.

En temas de arquitectura, destacó el uso de Mesos y Kubernetes como una posibilidad real para la mejora en la implantación de los proyectos.

El futuro de Spark se basa en el estándar en analíticas Barch, sus mejoras en streaming (aunque flink es más fuerte), la mayor integración con Tensor Flow y la integración con nuevos sistemas de ficheros (Ozone).

Spark en la práctica

Tras la introducción hizo una demo muy interesante de un ejercicio sencillo de machine learning, con un cuaderno de Jupyter, ejecutado sobre una máquina virtual en Colab contra un clúster de Google.

Nos mostró cómo sencillamente un algoritmo calculaba el valor de Pi: en 100.000 iteraciones daba un valor aproximado de 3.1426, aunque se tomaba su tiempo. Si iteraba solo con 100 era casi inmediato, pero el valor aproximado era 3.71. También realizó algunos pasos de cómo crear y leer una tabla de valores.

Para los curiosos, tenéis el notebook en el siguiente enlace. ¡Os animo a probarlo!

Finanzas y Spark: casos de uso en BBVA

Pedro Gómez tomó el testigo a continuación. Pedro es Data Scientist Manager en BBVA. Nos comentó cómo ha ido evolucionando el uso de los datos en el banco para convertirse en una empresa data driven y generar valor desde los datos.

El punto de partida era una infraestructura en una base de datos relacional. Desde ahí, migraron a una arquitectura Big Data basada 100% en tecnologías open source. De datos y herramientas propietarias pasaron al uso de R, Python, Jupyter y Spark, que es el principal motor de computación.

A continuación comentó las disciplinas que existen en un banco, como inteligencia comercial (todo el tratamiento de los clientes), fraude y riesgos, eficiencia operativa y una última de creciente creación que es el área de monetización de datos.

Destaca el área de fraude en tarjetas, con datos muestrales muy desbalanceados, para el que utilizan Spark y Big DL, el proyecto piloto de biometría de reconocimiento facial para pagos con tarjeta. También los modelos de propensión utilizando grafos y marketing social, modelos de abandono mediante imágenes de clientes, e incluso la app de BBVA, en el apartado de Planificación Financiera, que permite predecir los ingresos y gastos de un cliente, e incluso el grado de confianza de dicha predicción.

Sabemos que esto no es como haber estado allí. Por eso os esperamos en nuestro próximo encuentro. Aquí puedes ver nuestra agenda, da igual cuando leas esto.

MÁSTER EXPERTO BIG DATA ANALYTICS

Gracias al Master en Big Data Analytics 100% Online tendrás amplios conocimientos sobre las herramientas y técnicas analíticas necesarias para la modelización de los principales retos de negocio, con el fin de mejorar la toma de decisiones a través de los datos y el conocimiento.

Marcelo Molina, Big Data & Analytics Director

Nuevo curso Big Data en Bilbao

datahack crecemos este 2017 dando nuestro curso Big Data en Bilbao. Son muchas las personas del País Vasco y otras zonas norte del país que se han interesado en realizar nuestro programa acelerado de Big Data y Analytics.

El tener una sola ubicación en el centro de Madrid, dificultaba su realización. Por lo que abrimos una nueva escuela de datahack en Bilbao con nuestros compañeros Germán Garitaonaindía y Luis Echavarri encargándose de su gerencia desde allí.

Mismo programa acelerado de Big Data y Analytics

En la escuela de Bilbao, mantendremos el mismo programa acelerado de Big Data y Analytics. Y como no podía ser de otra manera, los profesores que impartirán el programa serán profesionales de la materia.

datahack en Bilbao

Empezamos muy pronto la andadura de datahack en Bilbao. Este viernes 17 de marzo, nuestro compañero de datahack labs Javier Moralo, dará una charla sobre bots en el Gipuzkoa Encounter 11. Un evento único para informáticos en el que ya están las entradas agotadas.

La próxima cita es el jueves 30 de marzo en el espacio amigo de Bilbao (Icaza Colaborando, Alameda de mazarredo 47). Donde Rubén Martínez, también de datahack labs, impartirá una Charla de Deep Learning con Tensorflow TFLearn, entre otras actividades relacionadas con el Big Data.

Comienzo del programa de Big Data en Bilbao

La fecha prevista para el comienzo de los cursos, será en septiembre de 2017. Un buen momento para empezar nuevos retos y desafíos como es emprenderse en el mundo del Big Data y Analytics. Se espera que al año se hagan tres convocatorias de cada modalidad del máster (Intensivo y Executive). La siguiente sería en enero y la tercera antes del comienzo del verano de 2018.

Anímate y especialízate en Datatech con el máster acelerado de Big Data y Analytics de datahack.

Cookies de terceros

Propiedad	Cookie	Finalidad	Plazo
datahack.es	_ga	ID utiliza para identificar a los usuarios	en 2 años
datahack.es	_gid	ID utiliza para identificar a los usuarios durante 24 horas después de la última actividad	en 20 horas
google.com	__Secure-3PAPISI D	Estas cookies se utilizan para entregar anuncios más relevantes para usted y sus intereses.	en 2 años
google.com	__Secure-3PSID	Estas cookies se utilizan para entregar anuncios más relevantes para usted y sus intereses.	en 2 años

Publicitarias

Propiedad	Cookie	Finalidad	Plazo
datahack.es	_fbp	Utilizado por Facebook para ofrecer una serie de productos tales como publicidad, ofertas en tiempo real de anunciantes terceros	en 3 meses
datahack.es	_gcl_au	Utilizado por Google AdSense para experimentar con la publicidad a través de la eficiencia de sitios web que utilizan sus servicios.	en 3 meses
google.com	APISID	Descargar ciertas herramientas de Google y guardar ciertas preferencias, por ejemplo, el número de resultados de la búsqueda por hoja o la activación del filtro SafeSearch. Ajusta los anuncios que aparecen en la búsqueda de Google.	en 2 años
google.com	HSID	Descargar ciertas herramientas de Google y guardar ciertas preferencias, por ejemplo, el número de resultados de la búsqueda por hoja o la activación del filtro SafeSearch. Ajusta los anuncios que aparecen en la búsqueda de Google.	en 2 años
google.com	SAPISID	Descargar ciertas herramientas de Google y guardar ciertas preferencias, por ejemplo, el número de resultados de la búsqueda por hoja o la activación del filtro SafeSearch. Ajusta los anuncios que aparecen en la búsqueda de Google.	en 2 años
google.com	SID	Descargar ciertas herramientas de Google y guardar ciertas preferencias, por ejemplo, el número de resultados de la búsqueda por hoja o la activación del filtro SafeSearch. Ajusta los anuncios que aparecen en la búsqueda de Google.	en 2 años
google.com	SIDCC	Descargar ciertas herramientas de Google y guardar ciertas preferencias, por ejemplo, el número de resultados de la búsqueda por hoja o la activación del filtro SafeSearch. Ajusta los anuncios que aparecen en la búsqueda de Google.	en un año
google.com	SSID	Descarga ciertas herramientas de Google y guarda ciertas preferencias, por ejemplo, el número de resultados de búsqueda por página o la activación del filtro SafeSearch. Ajusta los anuncios que aparecen en la Búsqueda de Google.	en 2 años

Editor	Política de privacidad
Facebook	https://www.facebook.com/about/privacy/
Google Analytics	https://privacy.google.com/take-control.html
Google	https://privacy.google.com/take-control.html
Google	https://safety.google/privacy/privacy-controls/