Los datos nunca se quedan quietos, al igual que la red de aviones que sobrepasan nuestras cabezas todos los días en infinidad de momentos. Las personas siempre intentamos encontrar las mejores soluciones a nuestros problemas o necesidades, pero ¿Sabíais que el análisis de datos es nuestro mejor aliado en estas ocasiones?

¡En este nuevo webinar te lo demostramos! ¿Quieres saber cómo viaja un Data Scientist?

El análisis de datos tiene infinitas aplicaciones, en este webinar podremos aprender una de ellas, cómo optimizar las búsquedas de vuelos directos mediante Python.

¿Te has pasado horas buscando las mejores combinaciones de vuelos para llegar a tu destino? Jorge López Lázaro (Senior-Expert Data Scientist en BBVA) se encargará de explicar mediante este caso de uso, cómo solucionar estos problemas con Python.

En este evento se resumirá en:

No dejes escapar esta oportunidad e infórmate junto a verdaderos profesionales del Big Data.

Jorge López Lázaro

Senior-Expert Data Scientist en BBVA

¡Anímate y realiza este caso práctico para desarrollar tus capacidades en Python!

¿Qué tienes que hacer para asistir a este #webinargratuito? Muy sencillo. Únicamente tendrás que registrarte desde este evento y esperar al día 29 (se realizará desde LinkedIn Live por lo que se deberá acceder a la plataforma de LinkedIn a la hora del evento).

Regístrate aquí gratis para asistir online:

🔵 Esta sesión será online en directo y desde la plataforma de LinkedIn Live.

🔵 Este formulario es para apuntarte a la sesión online.

🔵 Durante la sesión podrás preguntar todas las dudas que tengas al ponente y las irá respondiendo. No te quedes con ninguna duda.

🔵 Al registrarte recibirás un enlace en tu email con el que podrás conectarte a la sesión online.

Por Antonio Fernández Troyanno.

Es innegable que hoy en día tener conocimientos de programación es imprescindible. Hace años conocer y manejar adecuadamente el paquete Office “básico” (Word, Power Point, Excel) te permitía acceder a puestos laborales mejores que la media. Hoy en día y más después de la pandemia, la utilización de las herramientas Office es un fondo de armario que casi cualquier persona tiene conocimiento.

Pero, ¿qué pasa si quieres seguir formándote y desarrollando tus capacidades para, no solo acceder más fácilmente a otros puestos de trabajo, si no también para ser un profesional mucho más productivo y que puede aportar mejores soluciones tanto en el ámbito laboral como personal?

Desde mi punto de vista, lo mejor es formarte en algún lenguaje de programación que te permita automatizar y sistematizar tareas que, de otra manera, tendrías que ejecutar de manera manual y tediosa una a una.

Para todas aquellas personas que nunca han programado, uno de los mejores lenguajes para empezar es Python: un lenguaje de programación sencillo, fácil de comprender y con una curva de aprendizaje asequible que te permitirá poner a funcionar pequeños y no tan pequeños programas.

Con el fin de ilustrar el potencial de Python, a continuación, te presentaré una serie de proyectos programados en Python para que veas el potencial de este magnífico lenguaje de programación.

ATENCIÓN: En este artículo vais a poder ver ciertos fragmentos de código que, si no tenéis conocimiento ninguno de programación, quizás pueda asustarte. Aleja esos terrores de tu mente, con un poco de trabajo y formación, verás que no es nada del otro mundo.

  1. Manipular ficheros Excel sin utilizar Microsoft Excel
  2. Enviar correos electrónicos desde Python
  3. Modificar formatos de imágenes
  4. Extraer información de páginas web y crear tu propio algoritmo de Machine Learning

¡Vamos con ello!

1. Manipular ficheros Excel sin utilizar Microsoft Excel

En muchas ocasiones nos surge la necesidad de concatenar o unir varios ficheros Excel de cientos o miles de líneas.

Imaginemos que cada mes se genera un reporte con información de financiera de la empresa, información de tus cuentas bancarias o cualquier otro ejemplo que se te pueda ocurrir.

Imagina que tenemos 12 ficheros Excel con sus mismas columnas y necesitamos unificar toda esa información en 1 solo fichero.

¿Qué soluciones tenemos?

Opción a) Abrir uno a uno cada fichero, copiar y pegar esa información y repetir esa tarea 10 veces más. 

Opción b) Utilizar algún lenguaje de programación que nos permita simplificar esta tarea.

Sin duda, la opción a utilizar es la Opción b). Quizás inicialmente te lleve más tiempo programar en Python tu programa “UNIR EXCELS”, pero, ¿imagina que en lugar de 12 ficheros son 50? O, peor aún, que cada semana tienes que unificar 20 Excels….

¿No tiene sentido programar y automatizar esa tarea? Pues con Python podrías, y es mucho más sencillo de lo que parece…

<script src="https://gist.github.com/afernandez119/c4777133ef457f9569684811d611eb18.js"></script>

Interfaz de usuario gráfica, Texto, Aplicación, Correo electrónico, Sitio web

Descripción generada automáticamente

Con nuestro Máster Experto en Data Science y Big Data puedes profundizar en las aplicaciones de Python y así volverte un experto en la materia.

2. Enviar correos electrónicos desde Python

¿Quién podría imaginar que utilizando Python podríamos automatizar el envío de correos electrónicos? 

Imagina que todos los días tienes que enviar una serie de correos electrónicos a proveedores, empleados o alumnos, ¿por qué no automatizarlo?

En Python existen diferentes librerías que te facilitan esta tarea, veamos un ejemplo.

<script src="https://gist.github.com/afernandez119/6a93f9ad5673efcc29e0061cb1c0141e.js"></script>

Interfaz de usuario gráfica, Texto, Aplicación, Correo electrónico

Descripción generada automáticamente

3. Modificar formatos de imágenes

¿Nunca te ha pasado que necesitas cambiar la extensión de una imagen y no sabes cómo hacerlo?

Buscas en Google como un loco y te sale un montón de servicios online, software de gratis pero con limitaciones, … ¿por qué no utilizar Python para esto?

Gracias a la librería de Python Pillow podremos, entre otras muchas cosas, modificar la extensión de nuestra imagen de forma rápida y sencilla (3 líneas de código…)

<script src="https://gist.github.com/afernandez119/f712eeb44ed35471b32cce379554c5d7.js"></script>

Interfaz de usuario gráfica, Aplicación

Descripción generada automáticamente

4. Extraer información de páginas web y crear tu propio algoritmo de Machine Learning

Y…. ¿si queremos algo más elaborado? ¡Pues aquí tienes! A continuación te presento un proyecto mucho más completo en Python en el que intentamos predecir el éxito que va a tener una noticia antes de publicarla analizando el éxito que tuvieron noticias pasadas.

El proyecto incluye:

En este caso te un vídeo del proyecto completo sobre “Cómo predecir el éxito de una noticia mediante Machine Learning”

Y… ¡hasta aquí el artículo de hoy! Como ves estos son 4 ejemplos muy diversos sobre el potencial que tiene la utilización de Python a nivel profesional y personal, sin duda una herramienta muy potente e imprescindible conocer en el entorno de digitalización actual.

Si quieres más información sobre nuestro master, puedes contactar con nosotros bien por teléfono al +34 910 91 28 42 o +34 630 88 13 53, por whatsapp directamente pinchando aquí o aquí, o mandando un mail con tus datos de contacto (nombre completo y teléfono) a: info@datahack.es

Antonio Fernández Troyano.

Meta (antigua Facebook), Microsoft, Epic Games o Google son algunas de las empresas que están destinando gran parte de sus recursos en el desarrollo del metaverso. Sin duda, este concepto ha supuesto un cambio total del paradigma, ya que puede suponer una revolución en la forma en la que entendemos las relaciones, tanto personales como laborales.

Viendo el creciente interés generado alrededor del metaverso, desde datahack nos hemos propuesto transmitiros una visión clara e independiente de qué es el metaverso y vislumbrar el impacto que va a tener en la economía, las empresas y las personas.

Por ello, el día 17 de enero a las 18:30h y de la mano de Lourdes Hernández Vozmediano, podremos conocer cuáles son las características principales del metaverso, los intereses asociados al mismo, las compañías que están detrás y las causas que van a provocar el cambio.

Lourdes Hernández Vozmediano es licenciada en matemáticas por la UAM, desarrolló su carrera profesional en grandes consultoras como PwC, IBM, HP o T-Systems. Hace 7 años fundó datahack, compuesta por apasionados de los datos dedicados a la formación, servicios profesionales y divulgación de conocimiento, para ayudar a empresas y particulares en su estrategia digital con los datos.

Contenido del webinar:

➡ ¿Qué tienes que hacer para asistir a este #𝐖𝐞𝐛𝐢𝐧𝐚𝐫𝐆𝐫𝐚𝐭𝐮𝐢𝐭𝐨? Muy sencillo. Únicamente tendrás que registrarte desde el evento en LinkedIn y esperar al día 17 (se realizará desde LinkedIn Live por lo que se deberá acceder a la plataforma de LinkedIn a la hora del evento).

✅ Esta sesión será online en directo.

✅ No hace falta que conectes tu cámara.

✅ Durante el taller podrás preguntar todas las dudas que tengas al ponente y las irá respondiendo. ¡No te quedes con ninguna duda!

✅ Al registrarte recibirás una notificación el día del evento con la que podrás conectarte a la sesión.

¿𝐏𝐫𝐞𝐩𝐚𝐫𝐚𝐝𝐨/𝐚?

Cada vez es más habitual escuchar la palabra "Machine Learning", pero todavía muchas personas no saben qué significa y cuáles son sus funciones. En nuestro apartado de Actualidad aprenderás acerca de su función y sus categorías.


Machine Learning

¿Qué es el machine learning?

Es la capacidad de aprendizaje de una máquina mediante una serie de algoritmos y la entrada de datos a su sistema. Es una rama dentro del campo de la inteligencia artificial pero, a pesar de su nombre, no aprende por sí misma, sino por los patrones y la información recopilada por sus bases de datos. Estos algoritmos crean sus propios cálculos según los datos que consiguen y, cuántos más datos tienen, más precisas son sus acciones. Por este motivo, muchas personas creen que la inteligencia artificial se mueve sola, pero la realidad es que diseña sus propias respuestas mediante sus operaciones. Además, les permite tomar decisiones en base a predicciones.

El Machine learning es importante porque gracias a este software hemos facilitado la extracción de datos, lo que nos permite una mayor competitividad frente al resto de empresas. Los programadores especializados en estos ámbitos ya son capaces de diseñar modelos para analizar información compleja y obtener resultados rápidos y precisos sin necesidad de mano humana. De tal manera que la máquina por sí sola es capaz de realizar este trabajo.


3 categorías principales



Si tenéis alguna duda o sugerencia, en datahack estamos abiertos a recibir comentarios.

La Agencia Tributaria y el Big Data reforzarán el control de personas físicas que aparentan ser no residentes en España. Esta medida se lleva a cabo tras la polémica surgida tras la partida de varios youtubers a Andorra. Toda la información pertenece a la nota de prensa "Directrices del Plan Anual de Control Tributario"



Primero se controlará mediante el uso de herramientas de Big Data y herramientas de análisis masivos de datos. Es una novedad en el ámbito de los patrimonios relevantes "deslocalizados" y es un nuevo movimiento para la comprobación tributaria. Además, el proyecto figura en el Plan de Control Tributario 2021. Sus directrices generales se encuentran en el Boletín Oficial del Estado en un contexto de relevantes novedades normativas.

Además, la Administración tributaria gestionará dos nuevas figuras fiscales, el Impuesto sobre Determinados Servicios Digitales y el Impuesto sobre Transacciones Financieras. Otro punto importante es la previsible incorporación del paquete de comercio electrónico ('e-commerce package') con importantes novedades gestoras en el pago del IVA de las plataformas de comercio electrónico.

La Agencia intensificará el control del comercio electrónico, tanto desde la perspectiva de la tributación directa como de la indirecta. Su intención es asegurar la identificación fiscal de los obligados tributarios aunque no vivan en España y realicen el hecho imponible del IVA por sus ventas a consumidores localizados en el país.

¿Por qué es importante el Big Data?

Hoy en día continuan las labores de control de grandes fortunas por la Unidad Central de Coordinación del Control de Patrimonios Relevantes de la Oficina Nacional de Investigación del Fraude. Además, utilizan herramientas de big data sobre los contribuyentes que "deslocalizan" su residencia, fingiendo vivir en el extranjero cuando realmente residen en España.

Este sistema ha permitido obtener grandes cantidades de datos e indicios necesarios que permiten descubrir la residencia en España de estas figuras. Por lo que podrán intensificar el control de ciudadanos deslocalizados.

Fraude en la fase recaudatoria

Además de las prioridades de esta institución en ¡ el ámbito del control en fase recaudatoria, este año las labores de investigación que dan lugar a derivaciones de responsabilidad a terceros se verán reforzadas con un control especial de las titularidades 'de conveniencia' de los terminales punto de venta.

"Por otra parte, continuarán este año los trabajos de implementación del denominado 'NRC online', un nuevo sistema de registro y seguimiento de los ingresos gestionados a través de entidades colaboradoras que desembocará en un conocimiento de esta información de forma inmediata, facilitando las labores de seguimiento y control de las deudas." Directrices del Plan Anual de Control Tributario.

Si queréis saber más sobre las nuevas directrices, podéis entrar aquí. Contacta con nosotros para cualquier duda o sugerencia.

En el anterior post sobre el big data y el cambio climático, el profesor Antoni Munar se preguntó la razón de las nevadas cuando vivimos un calentamiento global. En este os traemos la relación más detallada que existe entre estos dos elementos.

Relación entre ambos términos

Primero, todo se puede deducir mediante datos. El cambio climático cada vez está más presente en la mentalidad de los empresarios. Además, algunas empresas dependen del clima para avanzar, por lo que necesitan la posibilidad de prever el cambio.

Las nuevas tecnologías, la innovación y el desarrollo del análisis de datos está siendo fundamental para medir este impacto. Pero no solo esto, sino también podemos descubrir las causas y los efectos de este problema. Gracias a esto, las empresas pueden crear estrategias para tratar de evitar o disminuir el riesgo, o incluso tomar ventaja ante sus competidores.

En un primer momento, los negocios comenzaron a analizar a corto plazo, evitando así males mayores. Tras el avance de las nuevas tecnologías, podemos analizar los riesgos a largo plazo a pesar de los cambios que pueda haber. Este big data tiene las herramientas ideales para analizar toda la información de forma rápida y veraz, así como predecir los riesgos y reforzar la seguridad de la empresa.

¿Puede el uso del big data evitar el cambio climático?

Ya está en ello. Hoy en día existen numerosos estudios que utilizan el big data para analizar la gran cantidad de información que necesitan. Un ejemplo es este estudio científico que asegura que hay suficiente espacio en nuestro planeta para repoblar millones árboles, lo que nos ayudaría a evitar el efecto invernadero.

Otro ejemplo es el estudio del desarrollo sostenible y macrodatos que nos permite gestionar de el crecimiento de las ciudades y su polución. Todo se puede medir y el Big Data es una gran estrategia para crear soluciones.


Si queréis saber más acerca de este tema, no dudéis en contactarnos. Enviadnos dudas y sugerencias.

Dentro del mundo del Data Science, existen iniciativas muy interesantes. Una de las más importantes y con muy buenas herramientas son los Google Colab. Además, si queréis saber más sobre la relación que existe entre el Data y esta aplicación, podéis leer nuestro artículo de introducción. Rápido y sencillo de entender.

Google Colab y Big Data

En primer lugar, Google Colab es un entorno de máquinas virtuales y está basado en Jupyter Notebooks y Python, una herramienta de análisis de datos que combina código, salida y texto descriptivo en un solo documento. Es una aplicación muy útil que nos ofrece Google de manera gratuita pero limitada. A pesar de esto, existe la versión PRO. Es de fácil colaboración, mediante un código puedes invitar a colaboradores para trabajar en tu equipo. Puedes escribir y ejecutar tus códigos. Además, Google Colab tiene bibliotecas preinstaladas de Data Science.

Otras aplicaciones:

La ventaja principal que ofrece es la GPU gratis.  De esta manera, todo será más rápido y sencillo para las personas que no tienen máquinas poderosas. De esta manera, el trabajo podrá ser delegado en la nube. Este programa mantiene el sistema notebook. Un documento ejecutable que, a parte de código Python, permite insertar imágenes, vídeos y enlaces que se ejecutarán en la terminal.

Si queréis saber más sobre Python, Google Colab, big data o data science, este es tu blog. Ofrecemos cursos a los que podéis echar un vistazo en nuestra web. Si tienes alguna duda o sugerencia, no dudes en contactar con nosotros.

Por Antoni Munar.

Estamos rodeados de noticias del calentamiento global, y sin embargo nos sorprenden nevadas y olas de frio que rompen récords históricos. Son más propias de una glaciación. ¿En qué quedamos entonces?

La intuición nos hace pensar que a mas madera más fuego y al contrario, cuanta más agua menos fuego. Esta forma de razonar es consecuencia de un mecanismo de supervivencia natural que nos ha permitido sobrevivir desde la sabana originaria hasta la revolución industrial actual [1], pero con la revolución tecnológica y nuestro progresivo control de la naturaleza, nuestra capacidad de acción es más potente, y los fenómenos sobre los qué actuamos se vuelven más complejos. Correlación no implica causación (que dos cosas ocurran al mismo tiempo no significa automáticamente que una sea causa de la otra) y al contrario, anti-correlación no significa que una excluya a la otra.

¿Qué pasa entonces con las nevadas?

En primer lugar, no hay que confundir clima y situaciones meteorológicas puntuales, "el tiempo". Como distinguir los cambios en el curso de un rio, que se esté secándose, de los remolinos puntuales que pueden ocurrir. Porque, por ejemplo, ha caído un árbol o un desprendimiento y se produce una inundación en esa parte concreta al liberarse el agua embalsada. Es cierto que al final la tendencia prevalecerá, y al no haber en absoluto agua todo estará seco, pero en el camino pueden darse estos fenómenos en apariencia contradictorios.

Entonces,  ¿ qué ocurre con el calentamiento global y estas nevadas ? ¿ Pueden ser unas consecuencias del otro? Si, y en efecto es algo que los propios modelos del calentamiento global predicen [2]. El clima en la tierra es un complejo equilibrio dinámico entre calor recibido del sol durante el día y enfriamiento durante la noche, las oscilaciones de las estaciones, zonas polares y ecuatoriales, zonas terrestres y corrientes marinas, salinidad, acción de los seres vivos y últimamente la acción del ser humano, por su escala sin precedentes.

En este equilibrio, un símil útil puede ser como si estuviéramos en una cocina, con su horno y su nevera. Por siglos, la nevera y el horno en funcionamiento han estado en equilibrio. Últimamente encendemos el horno más de la cuenta, lo que ha hecho -y aquí es donde el símil no es exacto- que la puerta de la nevera se abra más de la cuenta, y el aire frio que se escapa es lo que nos está azotando en forma de "Filomenas" varias.

Esto que parece una anécdota, es justamente lo que estudios científicos detallados parecen indicar [3]. El calentamiento global está cambiando el equilibrio entre el frío polar y las latitudes medias en el planeta, dando lugar a estos fenómenos extremos. La evidencia actual apunta a que, si no hacemos nada, en el largo plazo, la nevera dejara definitivamente de funcionar. Tendremos un horno total, aunque por el camino hayamos tenido periodos ocasionales de congelación. 

¿Qué relación hay entre el big data y el calentamiento global?

El big data ha permitido a las nuevas tecnologías poder analizar de forma más precisa y rápida el impacto que tiene el calentamiento global en nuestro planeta. Un ejemplo claro es el de los incendios de Australia. Gracias a la información recopilada por los satélites, pudieron predecir el movimiento del incendio y detectar posibles focos. En un entorno climático cambiante e incierto, los riesgos se disparan y el big data está empezando a ser útil a la hora de analizar los riesgos a largo plazo.


Si tenéis alguna duda o sugerencia, no dudéis en enviarnos un mensaje.

Debido al aumento del teletrabajo, los ciberataques se han incrementado este 2020. En 2021 se espera que sean aún más frecuentes, por lo que hay que tomar medidas para evitarlos. El machine learning y la inteligencia artificial son dos medidas indispensables para mantener la seguridad en tu negocio. Hay amenazas que el antivirus no es capaz de detectar y frenar.



En nuestro blog, publicamos un post sobre las posibilidades que ofrece el machine learning y la inteligencia artificial. Entre ellos estaba la ciberseguridad.

La empresa experta en seguridad cibernética "CrowdStrike" realizó un estudio del aumento de estos ciberataques durante la pandemia 2020. El teletrabajo es recomendado por muchas empresas, pero también puede conllevar muchos problemas de seguridad. A pesar de los antivirus, los grupos de ataque siguen desarrollando nuevas técnicas y programas para entrar en los ordenadores.

Durante la pandemia, el teletrabajo está siendo primordial. Pero si un trabajador recibe un correo no deseado con links o páginas web desconocidas, no debe abrir el mensaje.

Hay que tener los sistemas de la IA actualizados ya que, según algunos reportes, los ciber atacantes están usando la propia inteligencia artificial para entrar en los softwares de las empresas. Al aumentar el número de equipos y asistentes virtuales, incrementa también las posibilidades de recibir un ataque. Los más utilizados son: la voz, las huellas dactilares, ataques de phishing e ingeniería social y técnicas avanzadas de ocultación de malware. El machine learning también puede detectar el tráfico de la web y el comportamiento de lo usuarios.

¿Cómo evitar estos ciberataques?

Esta ciberseguridad, junto con el machine learning, puede detectar intrusos. Otras opciones son: proteger la privacidad, descubrir y defender comportamientos extraños o amenazas encubiertas. Gracias a la Inteligencia Artificial podemos analizar cualquier proceso. Además de tomar decisiones y reaccionar de manera más rápida, fácil y segura. Podemos desarrollar sistemas que, con procesos, nos permitan automatizar estos procesos.


Próximamente tendremos webinars sobre seguridad para tu negocio. Si tenéis alguna duda, podéis contactar con nosotros. Estamos abiertos a cualquier duda, opinión o sugerencia.

Cuando hablamos de IA, nos referimos a inteligencia artificial y normalmente todo el mundo piensa en robots. Según Kaplan y Haenlein es la capacidad de un sistema para interpretar correctamente datos externos, para aprender de dichos datos y emplear esos conocimientos para lograr tareas y metas concretas a través de la adaptación flexible. En nuestro blog puedes descubrir más usos del big data y machine learning.



Las empresas están utilizando el big data y machine learning para sobrevivir estas navidades. Gracias a estos sistemas, han descubierto que el 30% de las compras online de esta época sean devueltas en enero. Por este motivo, los expertos animan a las compañías a utilizar asistentes virtuales, es decir, la IA, para facilitar el proceso. La Inteligencia Artificial y el Big Data están proporcionando información en tiempo real para optimizar la toma de decisiones.

Debido a la pandemia de este 2020, los consumidores han decidido realizar sus compras por internet. Ha aumentado su nivel, pero también el número de devoluciones. Además, es más complicado realizar las devoluciones de productos de manera presencial, ya que hay que conocer el caso y sus posibles resoluciones.

La inteligencia artificial podrá asistir a estos consumidores y les podrá guiar por los mejores caminos para conseguir su propósito. Puede ser descubrir un producto mejor adecuado a sus necesidades, un cambio etc. Además, existe un chat donde podrán preguntar a la IA y el asistente virutal les contestará.

IA como recomendador de regalos

Gracias a todos los datos que aporta el Big Data, la inteligencia artificial cada vez es más precisa. Conoce todas las preferencias de los usuarios y qué tipo de regalos podrán funcionar. También es una buena manera para evitar el aumento de las devoluciones, ya que, al estudiar a los clientes potenciales, sabremos sus necesidades y gustos.


Si tenéis alguna duda o sugerencia, no dudéis en contactarnos.

chevron-down