La Agencia Tributaria y el Big Data reforzarán el control de personas físicas que aparentan ser no residentes en España. Esta medida se lleva a cabo tras la polémica surgida tras la partida de varios youtubers a Andorra. Toda la información pertenece a la nota de prensa "Directrices del Plan Anual de Control Tributario"



Primero se controlará mediante el uso de herramientas de Big Data y herramientas de análisis masivos de datos. Es una novedad en el ámbito de los patrimonios relevantes "deslocalizados" y es un nuevo movimiento para la comprobación tributaria. Además, el proyecto figura en el Plan de Control Tributario 2021. Sus directrices generales se encuentran en el Boletín Oficial del Estado en un contexto de relevantes novedades normativas.

Además, la Administración tributaria gestionará dos nuevas figuras fiscales, el Impuesto sobre Determinados Servicios Digitales y el Impuesto sobre Transacciones Financieras. Otro punto importante es la previsible incorporación del paquete de comercio electrónico ('e-commerce package') con importantes novedades gestoras en el pago del IVA de las plataformas de comercio electrónico.

La Agencia intensificará el control del comercio electrónico, tanto desde la perspectiva de la tributación directa como de la indirecta. Su intención es asegurar la identificación fiscal de los obligados tributarios aunque no vivan en España y realicen el hecho imponible del IVA por sus ventas a consumidores localizados en el país.

¿Por qué es importante el Big Data?

Hoy en día continuan las labores de control de grandes fortunas por la Unidad Central de Coordinación del Control de Patrimonios Relevantes de la Oficina Nacional de Investigación del Fraude. Además, utilizan herramientas de big data sobre los contribuyentes que "deslocalizan" su residencia, fingiendo vivir en el extranjero cuando realmente residen en España.

Este sistema ha permitido obtener grandes cantidades de datos e indicios necesarios que permiten descubrir la residencia en España de estas figuras. Por lo que podrán intensificar el control de ciudadanos deslocalizados.

Fraude en la fase recaudatoria

Además de las prioridades de esta institución en ¡ el ámbito del control en fase recaudatoria, este año las labores de investigación que dan lugar a derivaciones de responsabilidad a terceros se verán reforzadas con un control especial de las titularidades 'de conveniencia' de los terminales punto de venta.

"Por otra parte, continuarán este año los trabajos de implementación del denominado 'NRC online', un nuevo sistema de registro y seguimiento de los ingresos gestionados a través de entidades colaboradoras que desembocará en un conocimiento de esta información de forma inmediata, facilitando las labores de seguimiento y control de las deudas." Directrices del Plan Anual de Control Tributario.

Si queréis saber más sobre las nuevas directrices, podéis entrar aquí. Contacta con nosotros para cualquier duda o sugerencia.

En el anterior post sobre el big data y el cambio climático, el profesor Antoni Munar se preguntó la razón de las nevadas cuando vivimos un calentamiento global. En este os traemos la relación más detallada que existe entre estos dos elementos.

Relación entre ambos términos

Primero, todo se puede deducir mediante datos. El cambio climático cada vez está más presente en la mentalidad de los empresarios. Además, algunas empresas dependen del clima para avanzar, por lo que necesitan la posibilidad de prever el cambio.

Las nuevas tecnologías, la innovación y el desarrollo del análisis de datos está siendo fundamental para medir este impacto. Pero no solo esto, sino también podemos descubrir las causas y los efectos de este problema. Gracias a esto, las empresas pueden crear estrategias para tratar de evitar o disminuir el riesgo, o incluso tomar ventaja ante sus competidores.

En un primer momento, los negocios comenzaron a analizar a corto plazo, evitando así males mayores. Tras el avance de las nuevas tecnologías, podemos analizar los riesgos a largo plazo a pesar de los cambios que pueda haber. Este big data tiene las herramientas ideales para analizar toda la información de forma rápida y veraz, así como predecir los riesgos y reforzar la seguridad de la empresa.

¿Puede el uso del big data evitar el cambio climático?

Ya está en ello. Hoy en día existen numerosos estudios que utilizan el big data para analizar la gran cantidad de información que necesitan. Un ejemplo es este estudio científico que asegura que hay suficiente espacio en nuestro planeta para repoblar millones árboles, lo que nos ayudaría a evitar el efecto invernadero.

Otro ejemplo es el estudio del desarrollo sostenible y macrodatos que nos permite gestionar de el crecimiento de las ciudades y su polución. Todo se puede medir y el Big Data es una gran estrategia para crear soluciones.


Si queréis saber más acerca de este tema, no dudéis en contactarnos. Enviadnos dudas y sugerencias.

Dentro del mundo del Data Science, existen iniciativas muy interesantes. Una de las más importantes y con muy buenas herramientas son los Google Colab. Además, si queréis saber más sobre la relación que existe entre el Data y esta aplicación, podéis leer nuestro artículo de introducción. Rápido y sencillo de entender.

Google Colab y Big Data

En primer lugar, Google Colab es un entorno de máquinas virtuales y está basado en Jupyter Notebooks y Python, una herramienta de análisis de datos que combina código, salida y texto descriptivo en un solo documento. Es una aplicación muy útil que nos ofrece Google de manera gratuita pero limitada. A pesar de esto, existe la versión PRO. Es de fácil colaboración, mediante un código puedes invitar a colaboradores para trabajar en tu equipo. Puedes escribir y ejecutar tus códigos. Además, Google Colab tiene bibliotecas preinstaladas de Data Science.

Otras aplicaciones:

La ventaja principal que ofrece es la GPU gratis.  De esta manera, todo será más rápido y sencillo para las personas que no tienen máquinas poderosas. De esta manera, el trabajo podrá ser delegado en la nube. Este programa mantiene el sistema notebook. Un documento ejecutable que, a parte de código Python, permite insertar imágenes, vídeos y enlaces que se ejecutarán en la terminal.

Si queréis saber más sobre Python, Google Colab, big data o data science, este es tu blog. Ofrecemos cursos a los que podéis echar un vistazo en nuestra web. Si tienes alguna duda o sugerencia, no dudes en contactar con nosotros.

Por Antoni Munar.

Estamos rodeados de noticias del calentamiento global, y sin embargo nos sorprenden nevadas y olas de frio que rompen récords históricos. Son más propias de una glaciación. ¿En qué quedamos entonces?

La intuición nos hace pensar que a mas madera más fuego y al contrario, cuanta más agua menos fuego. Esta forma de razonar es consecuencia de un mecanismo de supervivencia natural que nos ha permitido sobrevivir desde la sabana originaria hasta la revolución industrial actual [1], pero con la revolución tecnológica y nuestro progresivo control de la naturaleza, nuestra capacidad de acción es más potente, y los fenómenos sobre los qué actuamos se vuelven más complejos. Correlación no implica causación (que dos cosas ocurran al mismo tiempo no significa automáticamente que una sea causa de la otra) y al contrario, anti-correlación no significa que una excluya a la otra.

¿Qué pasa entonces con las nevadas?

En primer lugar, no hay que confundir clima y situaciones meteorológicas puntuales, "el tiempo". Como distinguir los cambios en el curso de un rio, que se esté secándose, de los remolinos puntuales que pueden ocurrir. Porque, por ejemplo, ha caído un árbol o un desprendimiento y se produce una inundación en esa parte concreta al liberarse el agua embalsada. Es cierto que al final la tendencia prevalecerá, y al no haber en absoluto agua todo estará seco, pero en el camino pueden darse estos fenómenos en apariencia contradictorios.

Entonces,  ¿ qué ocurre con el calentamiento global y estas nevadas ? ¿ Pueden ser unas consecuencias del otro? Si, y en efecto es algo que los propios modelos del calentamiento global predicen [2]. El clima en la tierra es un complejo equilibrio dinámico entre calor recibido del sol durante el día y enfriamiento durante la noche, las oscilaciones de las estaciones, zonas polares y ecuatoriales, zonas terrestres y corrientes marinas, salinidad, acción de los seres vivos y últimamente la acción del ser humano, por su escala sin precedentes.

En este equilibrio, un símil útil puede ser como si estuviéramos en una cocina, con su horno y su nevera. Por siglos, la nevera y el horno en funcionamiento han estado en equilibrio. Últimamente encendemos el horno más de la cuenta, lo que ha hecho -y aquí es donde el símil no es exacto- que la puerta de la nevera se abra más de la cuenta, y el aire frio que se escapa es lo que nos está azotando en forma de "Filomenas" varias.

Esto que parece una anécdota, es justamente lo que estudios científicos detallados parecen indicar [3]. El calentamiento global está cambiando el equilibrio entre el frío polar y las latitudes medias en el planeta, dando lugar a estos fenómenos extremos. La evidencia actual apunta a que, si no hacemos nada, en el largo plazo, la nevera dejara definitivamente de funcionar. Tendremos un horno total, aunque por el camino hayamos tenido periodos ocasionales de congelación. 

¿Qué relación hay entre el big data y el calentamiento global?

El big data ha permitido a las nuevas tecnologías poder analizar de forma más precisa y rápida el impacto que tiene el calentamiento global en nuestro planeta. Un ejemplo claro es el de los incendios de Australia. Gracias a la información recopilada por los satélites, pudieron predecir el movimiento del incendio y detectar posibles focos. En un entorno climático cambiante e incierto, los riesgos se disparan y el big data está empezando a ser útil a la hora de analizar los riesgos a largo plazo.


Si tenéis alguna duda o sugerencia, no dudéis en enviarnos un mensaje.

Debido al aumento del teletrabajo, los ciberataques se han incrementado este 2020. En 2021 se espera que sean aún más frecuentes, por lo que hay que tomar medidas para evitarlos. El machine learning y la inteligencia artificial son dos medidas indispensables para mantener la seguridad en tu negocio. Hay amenazas que el antivirus no es capaz de detectar y frenar.



En nuestro blog, publicamos un post sobre las posibilidades que ofrece el machine learning y la inteligencia artificial. Entre ellos estaba la ciberseguridad.

La empresa experta en seguridad cibernética "CrowdStrike" realizó un estudio del aumento de estos ciberataques durante la pandemia 2020. El teletrabajo es recomendado por muchas empresas, pero también puede conllevar muchos problemas de seguridad. A pesar de los antivirus, los grupos de ataque siguen desarrollando nuevas técnicas y programas para entrar en los ordenadores.

Durante la pandemia, el teletrabajo está siendo primordial. Pero si un trabajador recibe un correo no deseado con links o páginas web desconocidas, no debe abrir el mensaje.

Hay que tener los sistemas de la IA actualizados ya que, según algunos reportes, los ciber atacantes están usando la propia inteligencia artificial para entrar en los softwares de las empresas. Al aumentar el número de equipos y asistentes virtuales, incrementa también las posibilidades de recibir un ataque. Los más utilizados son: la voz, las huellas dactilares, ataques de phishing e ingeniería social y técnicas avanzadas de ocultación de malware. El machine learning también puede detectar el tráfico de la web y el comportamiento de lo usuarios.

¿Cómo evitar estos ciberataques?

Esta ciberseguridad, junto con el machine learning, puede detectar intrusos. Otras opciones son: proteger la privacidad, descubrir y defender comportamientos extraños o amenazas encubiertas. Gracias a la Inteligencia Artificial podemos analizar cualquier proceso. Además de tomar decisiones y reaccionar de manera más rápida, fácil y segura. Podemos desarrollar sistemas que, con procesos, nos permitan automatizar estos procesos.


Próximamente tendremos webinars sobre seguridad para tu negocio. Si tenéis alguna duda, podéis contactar con nosotros. Estamos abiertos a cualquier duda, opinión o sugerencia.

Cuando hablamos de IA, nos referimos a inteligencia artificial y normalmente todo el mundo piensa en robots. Según Kaplan y Haenlein es la capacidad de un sistema para interpretar correctamente datos externos, para aprender de dichos datos y emplear esos conocimientos para lograr tareas y metas concretas a través de la adaptación flexible. En nuestro blog puedes descubrir más usos del big data y machine learning.



Las empresas están utilizando el big data y machine learning para sobrevivir estas navidades. Gracias a estos sistemas, han descubierto que el 30% de las compras online de esta época sean devueltas en enero. Por este motivo, los expertos animan a las compañías a utilizar asistentes virtuales, es decir, la IA, para facilitar el proceso. La Inteligencia Artificial y el Big Data están proporcionando información en tiempo real para optimizar la toma de decisiones.

Debido a la pandemia de este 2020, los consumidores han decidido realizar sus compras por internet. Ha aumentado su nivel, pero también el número de devoluciones. Además, es más complicado realizar las devoluciones de productos de manera presencial, ya que hay que conocer el caso y sus posibles resoluciones.

La inteligencia artificial podrá asistir a estos consumidores y les podrá guiar por los mejores caminos para conseguir su propósito. Puede ser descubrir un producto mejor adecuado a sus necesidades, un cambio etc. Además, existe un chat donde podrán preguntar a la IA y el asistente virutal les contestará.

IA como recomendador de regalos

Gracias a todos los datos que aporta el Big Data, la inteligencia artificial cada vez es más precisa. Conoce todas las preferencias de los usuarios y qué tipo de regalos podrán funcionar. También es una buena manera para evitar el aumento de las devoluciones, ya que, al estudiar a los clientes potenciales, sabremos sus necesidades y gustos.


Si tenéis alguna duda o sugerencia, no dudéis en contactarnos.

Primera parte.

En el anterior artículo sobre Machine Learning os explicamos qué era, cómo funcionaba y cuáles eran sus categorías. No leímos en profundidad cuáles eran sus aplicaciones. Este post estará dividido en 2, aquí os traemos las 5 primeras orientadas para la empresa.



El Machine Learning es la capacidad de aprendizaje de una máquina mediante una serie de algoritmos y la entrada de datos a su sistema. Hoy en día utilizamos este sistema cada vez más, en más actividades de nuestra vida cotidiana.

1. Seguridad de datos

Habilidad Antivirus. Todas las empresas guardan su información en bases de datos dentro de ordenadores. Los piratas informáticos o hackers han desarrollado malwares que pueden robar todos estos documentos. Además, son rápidos al crear nuevos programas, por lo que algunos antivirus no pueden detectarlos fácilmente. El machine learning puede predecir qué archivos son malware con gran precisión, ya que su estudio de patrones analiza a todos los que acceden a los datos y avisar de cualquier anomalía.

También puede detectar, mediante sus algoritmos, el spam. Por lo que es una habilidad Anti-spam muy optimizada y accesible.

Por ejemplo, la plataforma GMAIL utiliza este sistema. El machine learning aprende de mensajes pasados cuáles son maliciosos o spam, por lo que si los correos futuros tienen los mismos patrones, podrá tomar decisiones basándose en ellos.

2. Detección de fraudes

Esto sirve para combatir el posible blanqueo de dinero o fraudes de miles de, en España, euros. Las empresas utilizan este sistema para analizar millones de transacciones y detectar cuáles no son reales y quiénes son los compradores o vendedores de dicha acción.

Empresas como Paypal y Bitcoin utilizan este sistema para analizar en segundos las transacciones de todos los usuarios de sus plataformas. De esta forma, las compañías se sienten más seguras.

3. Marketing

Se utiliza para aprender los patrones habituales de los clientes potenciales y así poder ofrecer nuestros productos y servicios adaptados a sus necesidades.

Un ejemplo claro para esta aplicación es la empresa Amazon. Su uso del machine learning le permite analizar a todos sus usuarios y compararlos entre sí para averiguar qué les interesa comprar en el presente o incluso en el pasado. Además, es capaz de averiguar si su cliente va a comprar algo para sí mismo o para regalar.

Es importante saber también cuándo es la mejor hora para llamar al cliente o cuáles son las mejores Keywords para mejorar el posicionamiento en Google.

Si la empresa tiene una App movil, el machine learning puede ayudar a predecir los comportamientos de sus clientes y adaptarse a sus costumbres o necesidades, y así modificar su aplicación.

4. Finanzas

Los algoritmos de este sistema estudian los patrones de inversión, de tal manera que son capaces de predecir cómo va a cambiar el mercado de valores y cuáles son los mejores momentos para invertir. Es una forma de comprar y vender más eficiente. Muchas empresas del sector ya utilizan sus propios sistemas para predecir y ejecutar operaciones de gran volumen a altas velocidades.

5. Búsqueda online

Cada vez que buscamos algo en Google, sus algoritmos estudian cómo se comporta el usuario ante las posibilidades ofrecidas por el buscador. Realiza una serie de patrones y aprende sobre su comportamiento. Todo se basa en los clicks y el tiempo que pasa una persona en la página. Si el usuario no hace clik en ningún link y cambia de palabras, el buscador aprende de su error. Si un mecánico busca "gato" y sus búsquedas anteriores están relacionadas con coches, el buscador le ofrecerá resultados sobre gatos de coche, no el animal.

Google y demás exploradores utilizan este sistema.


La próxima semana publicaremos más aplicaciones para machine learning. Si tienes alguna duda o sugerencia, no dudes en contactarnos.

Quinta parte.

En noviembre, Jorge López Lázaro, uno de nuestros profesores del master big data, realizó una ponencia. Cada martes hemos subido las partes en 10 minutos de la misma, y en este post os traemos la quinta. Jorge nos explicó toda la información que aportan los medios de comunicación sobre la COVID-19. Aporta datos claros, directos y reales, sin sesgos.

Además, en esta quinta parte nos habla sobre toda la información de la desescalada y fuentes verídicas para buscar y corroborar datos.

Ya está toda la ponencia en nuestro blog y nuestro canal de YouTube. Entrevistaremos a Jorge para conocer la evolución y los cambios en la información y datos que aportan los medios y gobiernos de los países.



Si tienes alguna pregunta o comentario acerca de este tema, contacta con nosotros y participa en el futuro del Big Data. Además, puedes comentarnos si quieres participar en alguna otra ponencia.

Cada vez es más habitual escuchar la palabra "Machine Learning", pero todavía muchas personas no saben qué significa y cuáles son sus funciones. En nuestro blog aprenderás acerca de su función y sus categorías.


Machine Learning

¿Qué es el machine learning?

Es la capacidad de aprendizaje de una máquina mediante una serie de algoritmos y la entrada de datos a su sistema. Es una rama dentro del campo de la inteligencia artificial pero, a pesar de su nombre, no aprende por sí misma, sino por los patrones y la información recopilada por sus bases de datos. Estos algoritmos crean sus propios cálculos según los datos que consiguen y, cuántos más datos tienen, más precisas son sus acciones. Por este motivo, muchas personas creen que la inteligencia artificial se mueve sola, pero la realidad es que diseña sus propias respuestas mediante sus operaciones. Además, les permite tomar decisiones en base a predicciones.

El Machine learning es importante porque gracias a este software hemos facilitado la extracción de datos, lo que nos permite una mayor competitividad frente al resto de empresas. Los programadores especializados en estos ámbitos ya son capaces de diseñar modelos para analizar información compleja y obtener resultados rápidos y precisos sin necesidad de mano humana. De tal manera que la máquina por sí sola es capaz de realizar este trabajo.


3 categorías principales



Si tenéis alguna duda o sugerencia, en datahack estamos abiertos a recibir comentarios.

Cuarta parte.

Hace ya más de un mes de la ponencia en datahack sobre los datos aportados por los medios de comunicación durante la pandemia. Fue convocada por nuestro profesor Jorge López Lázaro. En este vídeo, Jorge realiza una comparación mundial y nos aporta datos reales y su interpretación sin sesgos sobre los fallecidos por la pandemia.

Muchas personas no pudisteis estar, por lo que hemos estado subiendo las partes a la web. Esta es la cuarta parte de la ponencia. Solo falta la quinta para acabar, estará el próximo lunes 7 de diciembre.

Cuando hayamos colgado todos los vídeos, entrevistaremos de nuevo a Jorge para que nos cuente cómo ha evolucionado en el tiempo transcurrido la comunicación respecto a los datos que siguen dando medios y gobiernos a nivel mundial, y la realidad de los mismos.



Datahack está abierta a recibir comentarios, informaciones y datos que desees aportar. Si tienes alguna pregunta, contacta con nosotros y participa en el futuro del Big Data.

chevron-down