¿Sabes qué es y cómo funciona el análisis de datos? En datahack te lo contamos.

Luis Miguel Gómez Caballero (formador en herramientas TIC) viene a explicarnos en el nuevo evento de datahack: "Sector Inmobiliario y Big Data: El futuro de la búsqueda de casa". Una pequeña introducción al análisis de datos en el que nos hablará sobre el uso de la función correlación, el establecimiento de un segmento, la aplicación de regresión lineal y la automatización del proceso con VBA. Además, explicará un caso práctico del sector inmobiliario.

¿Cuál es el precio de las viviendas por metro cuadrado?

Puntos clave:

  1. Análisis de datos: Introducción y contexto
  2. Uso de automatismos con VBA: Trabajar una vez, repetir el resto.
  3. En qué consiste un proceso ETL.
  4. La función de correlación.
  5. Representación de datos y obtención de criterios de segmentación.
  6. Conclusiones y ronda de preguntas.

Nuestro ponente

Luis Miguel Gómez Caballero

Formador en herramientas TIC

¡Inscríbete al evento e introdúcete en el mundo del Big Data!

¿Qué tienes que realizar para asistir a este #evento? Muy sencillo: únicamente tendrás que registrarte desde este evento y esperar al día 20 de octubre (se realizará desde LinkedIn Live por lo que se deberá acceder a la plataforma de LinkedIn a la hora del evento).

Regístrate aquí gratis para asistir online:

🔵 La sesión será online en directo y desde la plataforma de LinkedIn Live.

🔵 Este formulario es para apuntarte a la sesión online.

🔵 Durante esta sesión podrás preguntar todas las dudas que tengas al ponente y las irá respondiendo. No te quedes con ninguna duda.

🔵 Al registrarte recibirás un enlace en tu email con el que podrás conectarte a la sesión online.

Descubre el análisis de datos junto a datahack

¡Inscríbete ya!

Meta (antigua Facebook), Microsoft, Epic Games o Google son algunas de las empresas que están destinando gran parte de sus recursos en el desarrollo del metaverso. Sin duda, este concepto ha supuesto un cambio total del paradigma, ya que puede suponer una revolución en la forma en la que entendemos las relaciones, tanto personales como laborales.

Viendo el creciente interés generado alrededor del metaverso, desde datahack nos hemos propuesto transmitiros una visión clara e independiente de qué es el metaverso y vislumbrar el impacto que va a tener en la economía, las empresas y las personas.

Por ello, el día 17 de enero a las 18:30h y de la mano de Lourdes Hernández Vozmediano, podremos conocer cuáles son las características principales del metaverso, los intereses asociados al mismo, las compañías que están detrás y las causas que van a provocar el cambio.

Lourdes Hernández Vozmediano es licenciada en matemáticas por la UAM, desarrolló su carrera profesional en grandes consultoras como PwC, IBM, HP o T-Systems. Hace 7 años fundó datahack, compuesta por apasionados de los datos dedicados a la formación, servicios profesionales y divulgación de conocimiento, para ayudar a empresas y particulares en su estrategia digital con los datos.

Contenido del webinar:

➡ ¿Qué tienes que hacer para asistir a este #𝐖𝐞𝐛𝐢𝐧𝐚𝐫𝐆𝐫𝐚𝐭𝐮𝐢𝐭𝐨? Muy sencillo. Únicamente tendrás que registrarte desde el evento en LinkedIn y esperar al día 17 (se realizará desde LinkedIn Live por lo que se deberá acceder a la plataforma de LinkedIn a la hora del evento).

✅ Esta sesión será online en directo.

✅ No hace falta que conectes tu cámara.

✅ Durante el taller podrás preguntar todas las dudas que tengas al ponente y las irá respondiendo. ¡No te quedes con ninguna duda!

✅ Al registrarte recibirás una notificación el día del evento con la que podrás conectarte a la sesión.

¿𝐏𝐫𝐞𝐩𝐚𝐫𝐚𝐝𝐨/𝐚?

La Agencia Tributaria y el Big Data reforzarán el control de personas físicas que aparentan ser no residentes en España. Esta medida se lleva a cabo tras la polémica surgida tras la partida de varios youtubers a Andorra. Toda la información pertenece a la nota de prensa "Directrices del Plan Anual de Control Tributario"



Primero se controlará mediante el uso de herramientas de Big Data y herramientas de análisis masivos de datos. Es una novedad en el ámbito de los patrimonios relevantes "deslocalizados" y es un nuevo movimiento para la comprobación tributaria. Además, el proyecto figura en el Plan de Control Tributario 2021. Sus directrices generales se encuentran en el Boletín Oficial del Estado en un contexto de relevantes novedades normativas.

Además, la Administración tributaria gestionará dos nuevas figuras fiscales, el Impuesto sobre Determinados Servicios Digitales y el Impuesto sobre Transacciones Financieras. Otro punto importante es la previsible incorporación del paquete de comercio electrónico ('e-commerce package') con importantes novedades gestoras en el pago del IVA de las plataformas de comercio electrónico.

La Agencia intensificará el control del comercio electrónico, tanto desde la perspectiva de la tributación directa como de la indirecta. Su intención es asegurar la identificación fiscal de los obligados tributarios aunque no vivan en España y realicen el hecho imponible del IVA por sus ventas a consumidores localizados en el país.

¿Por qué es importante el Big Data?

Hoy en día continuan las labores de control de grandes fortunas por la Unidad Central de Coordinación del Control de Patrimonios Relevantes de la Oficina Nacional de Investigación del Fraude. Además, utilizan herramientas de big data sobre los contribuyentes que "deslocalizan" su residencia, fingiendo vivir en el extranjero cuando realmente residen en España.

Este sistema ha permitido obtener grandes cantidades de datos e indicios necesarios que permiten descubrir la residencia en España de estas figuras. Por lo que podrán intensificar el control de ciudadanos deslocalizados.

Fraude en la fase recaudatoria

Además de las prioridades de esta institución en ¡ el ámbito del control en fase recaudatoria, este año las labores de investigación que dan lugar a derivaciones de responsabilidad a terceros se verán reforzadas con un control especial de las titularidades 'de conveniencia' de los terminales punto de venta.

"Por otra parte, continuarán este año los trabajos de implementación del denominado 'NRC online', un nuevo sistema de registro y seguimiento de los ingresos gestionados a través de entidades colaboradoras que desembocará en un conocimiento de esta información de forma inmediata, facilitando las labores de seguimiento y control de las deudas." Directrices del Plan Anual de Control Tributario.

Si queréis saber más sobre las nuevas directrices, podéis entrar aquí. Contacta con nosotros para cualquier duda o sugerencia.

La pandemia por el virus SARS-CoV-2, declarada en 2020,ha colocado a la salud en el centro de nuestras preocupaciones. Gobiernos, multinacionales y organizaciones globales están destinando gran cantidad de recursos a la persecución de un único objetivo: la erradicación de la enfermedad. Y, de entre todas las tecnologías que se han puesto en juego con este fin, el informe Perspectiva del COVID-19. Tecnología e innovación contra el Coronavirus de Grant Thornton destaca al Big Data y a la Inteligencia Artificial como la de mayor impacto en la mitigación de la COVID-19, con un 53% del peso, seguida muy de lejos por la robótica (22%) y la ciberseguridad (12%).

Más allá de esta situación excepcional derivada del coronavirus, la alianza entre Big Data y Salud nos aporta muchas más ventajas. Solo tenemos que mirar a nuestro alrededor: la industria sanitaria demanda cada vez más especialistas en tratamiento de datos y algunas de las aplicaciones del Big Data en Salud ya han comenzado a hacernos la vida más fácil.

¿Qué datos utilizar para el análisis Big Data en Salud?

El artículo Big Data in Health Care: Applications and Challenges (Liang Hong et al., publicado en Sciendo) hace un repaso de las distintas fuentes de datos que se pueden integrar para llevar a cabo un análisis Big Data aplicado a la Salud. El listado incluye:

Si quieres conocer más acerca de las aplicaciones reales que tiene el Big Data, conoce nuestro Máster en Data Science y Big Data.

Big Data y Salud: hacia la Medicina 4P

El Big Data, según los especialistas en Salud, allana el camino hacia la Medicina 4P, un nuevo paradigma con cuatro pilares:

  1. Medicina Preventiva, en la que el conocimiento de las características internas y del entorno del paciente permitirá aplicar estrategias que eviten el deterioro físico y la aparición de enfermedades.
  2. Medicina Personalizada, con terapias ultraindividualizadas para conseguir el mayor beneficio con los menores efectos secundarios en cada caso.
  3. Medicina Predictiva, que mediante la monitorización constante podría detectar ciertas patologías antes de que se manifiesten los síntomas.
  4. Medicina Participativa, que empodera al paciente y lo coloca en el centro de la toma de decisiones relacionadas con su salud.

Para avanzar en esta dirección, la Agencia Europea del Medicamento ha emitido 10 recomendaciones para sacar al máximo partido al uso del Big Data en Salud en la UE, entre las que destaca la creación de una plataforma europea de acceso y análisis de datos de atención médica, así como apoyar el aprendizaje del Big Data entre los distintos actores sanitarios.

Aplicaciones actuales y futuras del Big Data en el sector de la Salud

La utilización del Big Data en Salud cristaliza en aplicaciones como estas:

Estudio de la transmisión de enfermedades infecciosas

Como comentábamos en nuestro artículo sobre coronavirus y Big Data, en 2008 los científicos de datos de Google fueron capaces de prever la localización de nuevos brotes de gripe mediante el estudio de los patrones de búsqueda en Internet sobre síntomas o vacunas. Este tipo de prácticas se puede hacer extensible a otras enfermedades infecciosas y en la actualidad, con la pandemia de la COVID-19, se hace patente en la creación de herramientas como el mapa mundial de evolución de los contagios de la Universidad Johns Hopkins, que se actualiza en tiempo real con información de la red.

Seguridad farmacológica

El seguimiento de pacientes que toman determinados medicamentos con técnicas de Big Data sirve para detectar con rapidez efectos secundarios significativos que no se habían previsto antes de la comercialización. Esto ayuda a abordar la reevaluación de la seguridad del fármaco en tiempo récord.

Gestión inteligente de recursos humanos y de los suministros

El Big Data en Salud permite hacer predicciones bien fundadas de afluencia de pacientes y de evolución de la presión asistencial en los centros médicos. Con ellas se puede ajustar la política de Recursos Humanos, la gestión de turnos del personal o la compra de materiales.

Vigilancia de la salud

Los wearables son un accesorio inestimable para utilizar el Big Data en pro de nuestro bienestar. La información registrada por estos dispositivos puede orientar a los facultativos sobre nuestros hábitos y estado de salud, lo que redunda en diagnósticos más certeros, además de enviarles alertas inmediatas ante situaciones de emergencia.

Diagnóstico automatizado por imagen

Una gran ayuda para los radiólogos. Los algoritmos de Big Data rastrean píxel a píxel las irregularidades en una imagen, llamando la atención acerca de detalles clave para guiar e, incluso, automatizar el diagnóstico.

MÁSTER EXPERTO EN DATA SCIENCE Y BIG DATA

¿Te gustaría participar en el desarrollo de soluciones como estas? Únete la revolución del Big Data en Salud con datahack. Aún puedes inscribirte en nuestro Máster en Data Science y Big Data, práctico, 100% online y orientado a disparar tu proyección profesional. ¿Alguna pregunta? Contacta con nosotros: estamos a tu disposición para resolver todas tus inquietudes.

Primera parte.

En el anterior artículo sobre Machine Learning os explicamos qué era, cómo funcionaba y cuáles eran sus categorías. No leímos en profundidad cuáles eran sus aplicaciones. Este post estará dividido en 2, aquí os traemos las 5 primeras orientadas para la empresa.



El Machine Learning es la capacidad de aprendizaje de una máquina mediante una serie de algoritmos y la entrada de datos a su sistema. Hoy en día utilizamos este sistema cada vez más, en más actividades de nuestra vida cotidiana.

1. Seguridad de datos

Habilidad Antivirus. Todas las empresas guardan su información en bases de datos dentro de ordenadores. Los piratas informáticos o hackers han desarrollado malwares que pueden robar todos estos documentos. Además, son rápidos al crear nuevos programas, por lo que algunos antivirus no pueden detectarlos fácilmente. El machine learning puede predecir qué archivos son malware con gran precisión, ya que su estudio de patrones analiza a todos los que acceden a los datos y avisar de cualquier anomalía.

También puede detectar, mediante sus algoritmos, el spam. Por lo que es una habilidad Anti-spam muy optimizada y accesible.

Por ejemplo, la plataforma GMAIL utiliza este sistema. El machine learning aprende de mensajes pasados cuáles son maliciosos o spam, por lo que si los correos futuros tienen los mismos patrones, podrá tomar decisiones basándose en ellos.

2. Detección de fraudes

Esto sirve para combatir el posible blanqueo de dinero o fraudes de miles de, en España, euros. Las empresas utilizan este sistema para analizar millones de transacciones y detectar cuáles no son reales y quiénes son los compradores o vendedores de dicha acción.

Empresas como Paypal y Bitcoin utilizan este sistema para analizar en segundos las transacciones de todos los usuarios de sus plataformas. De esta forma, las compañías se sienten más seguras.

3. Marketing

Se utiliza para aprender los patrones habituales de los clientes potenciales y así poder ofrecer nuestros productos y servicios adaptados a sus necesidades.

Un ejemplo claro para esta aplicación es la empresa Amazon. Su uso del machine learning le permite analizar a todos sus usuarios y compararlos entre sí para averiguar qué les interesa comprar en el presente o incluso en el pasado. Además, es capaz de averiguar si su cliente va a comprar algo para sí mismo o para regalar.

Es importante saber también cuándo es la mejor hora para llamar al cliente o cuáles son las mejores Keywords para mejorar el posicionamiento en Google.

Si la empresa tiene una App movil, el machine learning puede ayudar a predecir los comportamientos de sus clientes y adaptarse a sus costumbres o necesidades, y así modificar su aplicación.

4. Finanzas

Los algoritmos de este sistema estudian los patrones de inversión, de tal manera que son capaces de predecir cómo va a cambiar el mercado de valores y cuáles son los mejores momentos para invertir. Es una forma de comprar y vender más eficiente. Muchas empresas del sector ya utilizan sus propios sistemas para predecir y ejecutar operaciones de gran volumen a altas velocidades.

5. Búsqueda online

Cada vez que buscamos algo en Google, sus algoritmos estudian cómo se comporta el usuario ante las posibilidades ofrecidas por el buscador. Realiza una serie de patrones y aprende sobre su comportamiento. Todo se basa en los clicks y el tiempo que pasa una persona en la página. Si el usuario no hace click en ningún link y cambia de palabras, el buscador aprende de su error. Si un mecánico busca "gato" y sus búsquedas anteriores están relacionadas con coches, el buscador le ofrecerá resultados sobre gatos de coche, no el animal.

Google y demás exploradores utilizan este sistema.


La próxima semana publicaremos más aplicaciones para machine learning. Si tienes alguna duda o sugerencia, no dudes en contactarnos.

Quinta parte.

En noviembre, Jorge López Lázaro, uno de nuestros profesores del master big data, realizó una ponencia. Cada martes hemos subido las partes en 10 minutos de la misma, y en este post os traemos la quinta. Jorge nos explicó toda la información que aportan los medios de comunicación sobre la COVID-19. Aporta datos claros, directos y reales, sin sesgos.

Además, en esta quinta parte nos habla sobre toda la información de la desescalada y fuentes verídicas para buscar y corroborar datos.

Ya está toda la ponencia en nuestro blog y nuestro canal de YouTube. Entrevistaremos a Jorge para conocer la evolución y los cambios en la información y datos que aportan los medios y gobiernos de los países.



Si tienes alguna pregunta o comentario acerca de este tema, contacta con nosotros y participa en el futuro del Big Data. Además, puedes comentarnos si quieres participar en alguna otra ponencia.

Cuarta parte.

Hace ya más de un mes de la ponencia en datahack sobre los datos aportados por los medios de comunicación durante la pandemia. Fue convocada por nuestro profesor Jorge López Lázaro. En este vídeo, Jorge realiza una comparación mundial y nos aporta datos reales y su interpretación sin sesgos sobre los fallecidos por la pandemia.

Muchas personas no pudisteis estar, por lo que hemos estado subiendo las partes a la web. Esta es la cuarta parte de la ponencia. Solo falta la quinta para acabar, estará el próximo lunes 7 de diciembre.

Cuando hayamos colgado todos los vídeos, entrevistaremos de nuevo a Jorge para que nos cuente cómo ha evolucionado en el tiempo transcurrido la comunicación respecto a los datos que siguen dando medios y gobiernos a nivel mundial, y la realidad de los mismos.



Datahack está abierta a recibir comentarios, informaciones y datos que desees aportar. Si tienes alguna pregunta, contacta con nosotros y participa en el futuro del Big Data.

Tercera parte.


En el mes de octubre, Jorge López Lázaro, profesor del máster de big data de Datahack, concedió una ponencia sobre los datos y la información aportados durante la pandemia. En este vídeo destaca los problemas y vaivenes de la primera ola y el SIR. Información veraz y sin sesgos. Como muchos de vosotros no pudisteis asistir, subiremos las últimas partes estas semanas.

Esta es la tercera parte de la ponencia. Si no habéis visto los vídeos anteriores, están en nuestro blog. Publicaremos los vídeos cada martes en nuestra web.

Además, estad muy atentos porque una vez que la ponencia completa esté subida, entrevistaremos de nuevo a Jorge para conocer cómo ha evolucionado la situación y los datos que aportan ahora mismo los medios y los gobiernos de los países.



Si queréis saber más acerca del máster de big data de datahack, tenéis más información en la web. Quedan 2 partes más. Nuestra empresa está abierta a recibir comentarios, informaciones y datos que desees aportar. Si tienes alguna pregunta, contacta con nosotros y participa en el futuro del Big Data.

Durante la pandemia de este año muchas PYMES han cerrado por el confinamiento. En este artículo os vamos a explicar cómo puede ayudar el Big Data a una empresa, sobre todo PYME, en esta época de Covid-19. En nuestro blog puedes leer qué es el Big Data y sus aplicaciones.



La tecnología es una herramienta muy útil para una empresa. Es la principal herramienta para aumentar el tamaño y prestigio, desde páginas web de compra online y aplicaciones, hasta las redes sociales para interactuar con el cliente potencial. Compañías grandes como Google, Facebook y Twitter utilizan el Big Data, pero en este post nos vamos a centrar en cómo puede ayudar el big data a las PYMES.

Lo más destacable: aumento de competitividad

Lo más importante para una PYME al utilizar el Big Data es la competitividad. Además, dependerá del buen o mal uso que se haga de este sistema. El primer paso es el conocimiento de su mercado. Es necesario conocer los datos de tus clientes para poder ofrecer un producto adaptado a las necesidades de ese nicho al que se dirige la empresa.

También mejora la comunicación entre cliente y empresa, conocemos sus necesidades y su perfil sociodemográfico y socioeconómico. Todos estos datos se recopilan en tiempo real y permite un mejor análisis del cliente objetivo. A través de algoritmos puedes predecir los movimientos del target y crear soluciones a posibles obstáculos que puedan surgir.

Su aplicación depende del caso de la PYME pero hasta ahora las áreas de marketing, ventas, logística y seguridad son las que mejores resultados aportan.

Por otro lado esto también sirve para fidelizar a los clientes y humanizar la empresa. Puede utilizar esta herramienta para descubrir con anticipación si un cliente desea dejar de comprar su producto, cómo de sensible es a la variación de precio y sus características. Esto da la posibilidad de mejorar el modelo de negocio de la empresa. Además, este conocimiento permite realizar operaciones con mayor seguridad. Al obtener todos estos datos, la empresa podrá tomar decisiones con menor riesgo. El Big Data para PYMES permite un aumento de la eficacia, agilidad y productividad.

CASO PRÁCTICO DEL BIG DATA EN PANDEMIA



Netflix creció utilizando el Big Data. Mediante el análisis de los datos obtenidos por el software que mantienen, ofrecen a sus usuarios contenido personalizado. Por ejemplo, las sugerencias de búsquedas que te ofrece la plataforma están basadas en tus datos obtenidos de tus anteriores búsquedas.

Una acción sorprendente de Netflix es las diferentes carátulas que muestran al usuario dependiendo de sus gustos. Una imagen llamativa que no tiene por qué sorprender a todos sus clientes y, gracias a este uso del big data, la plataforma ha conseguido aumentar su tamaño hasta convertirse en una de las más grandes.


Estos consejos y el buen uso del Big Data permitirán que tu empresa crezca con menor riesgo y un mejor nicho de mercado. Puedes leer más sobre este sistema en nuestro blog. Coméntanos si has utilizado el Big Data o si tienes alguna duda.

Lourdes Hernández

Esta es la parte dos del análisis de "El dilema de las redes", documental de Netflix. Os animo a leer la parte 1 si no lo habéis hecho.

Llama la atención que solo hay dos industrias que llaman a sus clientes consumidores, las drogas ilegales y el software (Edward Tufte). Y va una pregunta, ¿cuándo chequeas tu móvil al levantarte, antes o después de hacer pis? Solo hay esas dos posibilidades. Esta situación está llevando a un cambio importante en los adolescentes y pre-adolescentes: aumento de los suicidios, cambios en el comportamiento, como por ejemplo retraso o desinterés en sacarse el carnet de conducir, o tener la primera cita con alguien .

Tenemos una competición entre un cerebro de mono y al otro lado de la pantalla millones de ordenadores, ¿quién va a ganar? Al algoritmo le pones una meta, y trabaja para alcanzarla. Aquí el documental dice que los humanos hemos perdido el control sobre estos sistemas, aunque yo no estoy de acuerdo.



La Wikipedia da respuestas distintas sobre la misma pregunta según el usuario, e incluso Google autocompleta la búsqueda de manera diferente. Es como el mago, da igual la carta que elijas, él la va a adivinar. Facebook hace lo mismo

Estos sistemas están llevando a una mayor polarización de la sociedad, porque esta polarización mantiene a la gente conectada.

Tenemos un par de ejemplos interesantes. El jugador de baloncesto Kyrie Irving se posicionó en un momento como terraplanista, tras una investigación que había realizado él mismo en Instagram. Cuando posteriormente reconoció su error y pidió disculpas, los terraplanistas dijeron que había sido abducido.


Kyrie Irving

Otro ejemplo es el Pizza Gate, donde se difundió un bulo que decía que al pedir una pizza, estabas favoreciendo el tráfico de personas.

Lo cierto es que las fake news se propagan 6 o 7 veces más rápido que las noticias verdaderas. La mentira hace ganar más dinero, mientras que la verdad es más aburrida.

Aquí menciona de soslayo el Covid, pero yo creo que les pilló un poco pronto a los creadores del documental.

En el dilema de las redes, para controlar a la población, no hay herramienta más potente que Facebook. Un ejemplo claro es lo que ocurrió en Myamar, donde a la gente se le vendía el móvil con el Facebook ya instalado. El propio Facebook reconoció haber contribuido a la violencia étnica en aquel país.

Se podría utilizar la plataforma con otros fines, pero este es el que se definió.

La inteligencia artificial por si sola no puede acabar con esto, ni el propio Google, porque no existe un proxy que detecte conspiraciones o mentiras. La tecnología no es la amenaza, sino que la tecnología ha sido diseñada para sacar lo peor de la sociedad.

¿Soluciones para el dilema de las redes?

¿Un impuesto fiscal a las empresas que capturen muchos datos, para no quedarse con todos los datos del planeta? Las leyes están hechas no para proteger a los usuarios, sino los derechos de las grandes empresas. Deberían prohibirse estos mercados, igual que están prohibidos los mercados de órganos, de esclavos… no puede ser el lucro a toda costa. Actualmente una ballena o un árbol valen más muertos que vivos. Captar tu atención por encima de todo. Es necesario mejorar los sistemas para que respeten al usuario, aunque desde mi punto de vista son objetivos contrapuestos.

Algunos consejos finales,  reduce y desactiva las notificaciones (yo tengo todas desactivadas desde más de año), antes de compartir verifica las fuentes (me parece imprescindible, para al menos estar seguros de no estar alimentando conspiraciones), “si parece diseñado para activar tus botones emocionales, lo será”, asegúrate de tener fuentes de información distintas, incluso aunque no compartan tu ideología o creencias.

Comentarios serán bienvenidos.


chevron-down