Dentro del mundo del Data Science, existen iniciativas muy interesantes. Una de las más importantes y con muy buenas herramientas son los Google Colab. Además, si queréis saber más sobre la relación que existe entre el Data y esta aplicación, podéis leer nuestro artículo de introducción. Rápido y sencillo de entender.

Google Colab y Big Data

En primer lugar, Google Colab es un entorno de máquinas virtuales y está basado en Jupyter Notebooks y Python, una herramienta de análisis de datos que combina código, salida y texto descriptivo en un solo documento. Es una aplicación muy útil que nos ofrece Google de manera gratuita pero limitada. A pesar de esto, existe la versión PRO. Es de fácil colaboración, mediante un código puedes invitar a colaboradores para trabajar en tu equipo. Puedes escribir y ejecutar tus códigos. Además, Google Colab tiene bibliotecas preinstaladas de Data Science.

Otras aplicaciones:

La ventaja principal que ofrece es la GPU gratis.  De esta manera, todo será más rápido y sencillo para las personas que no tienen máquinas poderosas. De esta manera, el trabajo podrá ser delegado en la nube. Este programa mantiene el sistema notebook. Un documento ejecutable que, a parte de código Python, permite insertar imágenes, vídeos y enlaces que se ejecutarán en la terminal.

Si queréis saber más sobre Python, Google Colab, big data o data science, este es tu blog. Ofrecemos cursos a los que podéis echar un vistazo en nuestra web. Si tienes alguna duda o sugerencia, no dudes en contactar con nosotros.

Por Antoni Munar.

Estamos rodeados de noticias del calentamiento global, y sin embargo nos sorprenden nevadas y olas de frio que rompen récords históricos. Son más propias de una glaciación. ¿En qué quedamos entonces?

La intuición nos hace pensar que a mas madera más fuego y al contrario, cuanta más agua menos fuego. Esta forma de razonar es consecuencia de un mecanismo de supervivencia natural que nos ha permitido sobrevivir desde la sabana originaria hasta la revolución industrial actual [1], pero con la revolución tecnológica y nuestro progresivo control de la naturaleza, nuestra capacidad de acción es más potente, y los fenómenos sobre los qué actuamos se vuelven más complejos. Correlación no implica causación (que dos cosas ocurran al mismo tiempo no significa automáticamente que una sea causa de la otra) y al contrario, anti-correlación no significa que una excluya a la otra.

¿Qué pasa entonces con las nevadas?

En primer lugar, no hay que confundir clima y situaciones meteorológicas puntuales, "el tiempo". Como distinguir los cambios en el curso de un rio, que se esté secándose, de los remolinos puntuales que pueden ocurrir. Porque, por ejemplo, ha caído un árbol o un desprendimiento y se produce una inundación en esa parte concreta al liberarse el agua embalsada. Es cierto que al final la tendencia prevalecerá, y al no haber en absoluto agua todo estará seco, pero en el camino pueden darse estos fenómenos en apariencia contradictorios.

Entonces,  ¿ qué ocurre con el calentamiento global y estas nevadas ? ¿ Pueden ser unas consecuencias del otro? Si, y en efecto es algo que los propios modelos del calentamiento global predicen [2]. El clima en la tierra es un complejo equilibrio dinámico entre calor recibido del sol durante el día y enfriamiento durante la noche, las oscilaciones de las estaciones, zonas polares y ecuatoriales, zonas terrestres y corrientes marinas, salinidad, acción de los seres vivos y últimamente la acción del ser humano, por su escala sin precedentes.

En este equilibrio, un símil útil puede ser como si estuviéramos en una cocina, con su horno y su nevera. Por siglos, la nevera y el horno en funcionamiento han estado en equilibrio. Últimamente encendemos el horno más de la cuenta, lo que ha hecho -y aquí es donde el símil no es exacto- que la puerta de la nevera se abra más de la cuenta, y el aire frio que se escapa es lo que nos está azotando en forma de "Filomenas" varias.

Esto que parece una anécdota, es justamente lo que estudios científicos detallados parecen indicar [3]. El calentamiento global está cambiando el equilibrio entre el frío polar y las latitudes medias en el planeta, dando lugar a estos fenómenos extremos. La evidencia actual apunta a que, si no hacemos nada, en el largo plazo, la nevera dejara definitivamente de funcionar. Tendremos un horno total, aunque por el camino hayamos tenido periodos ocasionales de congelación. 

¿Qué relación hay entre el big data y el calentamiento global?

El big data ha permitido a las nuevas tecnologías poder analizar de forma más precisa y rápida el impacto que tiene el calentamiento global en nuestro planeta. Un ejemplo claro es el de los incendios de Australia. Gracias a la información recopilada por los satélites, pudieron predecir el movimiento del incendio y detectar posibles focos. En un entorno climático cambiante e incierto, los riesgos se disparan y el big data está empezando a ser útil a la hora de analizar los riesgos a largo plazo.


Si tenéis alguna duda o sugerencia, no dudéis en enviarnos un mensaje.

Debido al aumento del teletrabajo, los ciberataques se han incrementado este 2020. En 2021 se espera que sean aún más frecuentes, por lo que hay que tomar medidas para evitarlos. El machine learning y la inteligencia artificial son dos medidas indispensables para mantener la seguridad en tu negocio. Hay amenazas que el antivirus no es capaz de detectar y frenar.



En nuestro blog, publicamos un post sobre las posibilidades que ofrece el machine learning y la inteligencia artificial. Entre ellos estaba la ciberseguridad.

La empresa experta en seguridad cibernética "CrowdStrike" realizó un estudio del aumento de estos ciberataques durante la pandemia 2020. El teletrabajo es recomendado por muchas empresas, pero también puede conllevar muchos problemas de seguridad. A pesar de los antivirus, los grupos de ataque siguen desarrollando nuevas técnicas y programas para entrar en los ordenadores.

Durante la pandemia, el teletrabajo está siendo primordial. Pero si un trabajador recibe un correo no deseado con links o páginas web desconocidas, no debe abrir el mensaje.

Hay que tener los sistemas de la IA actualizados ya que, según algunos reportes, los ciber atacantes están usando la propia inteligencia artificial para entrar en los softwares de las empresas. Al aumentar el número de equipos y asistentes virtuales, incrementa también las posibilidades de recibir un ataque. Los más utilizados son: la voz, las huellas dactilares, ataques de phishing e ingeniería social y técnicas avanzadas de ocultación de malware. El machine learning también puede detectar el tráfico de la web y el comportamiento de lo usuarios.

¿Cómo evitar estos ciberataques?

Esta ciberseguridad, junto con el machine learning, puede detectar intrusos. Otras opciones son: proteger la privacidad, descubrir y defender comportamientos extraños o amenazas encubiertas. Gracias a la Inteligencia Artificial podemos analizar cualquier proceso. Además de tomar decisiones y reaccionar de manera más rápida, fácil y segura. Podemos desarrollar sistemas que, con procesos, nos permitan automatizar estos procesos.


Próximamente tendremos webinars sobre seguridad para tu negocio. Si tenéis alguna duda, podéis contactar con nosotros. Estamos abiertos a cualquier duda, opinión o sugerencia.

Cuando hablamos de IA, nos referimos a inteligencia artificial y normalmente todo el mundo piensa en robots. Según Kaplan y Haenlein es la capacidad de un sistema para interpretar correctamente datos externos, para aprender de dichos datos y emplear esos conocimientos para lograr tareas y metas concretas a través de la adaptación flexible. En nuestro blog puedes descubrir más usos del big data y machine learning.



Las empresas están utilizando el big data y machine learning para sobrevivir estas navidades. Gracias a estos sistemas, han descubierto que el 30% de las compras online de esta época sean devueltas en enero. Por este motivo, los expertos animan a las compañías a utilizar asistentes virtuales, es decir, la IA, para facilitar el proceso. La Inteligencia Artificial y el Big Data están proporcionando información en tiempo real para optimizar la toma de decisiones.

Debido a la pandemia de este 2020, los consumidores han decidido realizar sus compras por internet. Ha aumentado su nivel, pero también el número de devoluciones. Además, es más complicado realizar las devoluciones de productos de manera presencial, ya que hay que conocer el caso y sus posibles resoluciones.

La inteligencia artificial podrá asistir a estos consumidores y les podrá guiar por los mejores caminos para conseguir su propósito. Puede ser descubrir un producto mejor adecuado a sus necesidades, un cambio etc. Además, existe un chat donde podrán preguntar a la IA y el asistente virutal les contestará.

IA como recomendador de regalos

Gracias a todos los datos que aporta el Big Data, la inteligencia artificial cada vez es más precisa. Conoce todas las preferencias de los usuarios y qué tipo de regalos podrán funcionar. También es una buena manera para evitar el aumento de las devoluciones, ya que, al estudiar a los clientes potenciales, sabremos sus necesidades y gustos.


Si tenéis alguna duda o sugerencia, no dudéis en contactarnos.

Primera parte.

En el anterior artículo sobre Machine Learning os explicamos qué era, cómo funcionaba y cuáles eran sus categorías. No leímos en profundidad cuáles eran sus aplicaciones. Este post estará dividido en 2, aquí os traemos las 5 primeras orientadas para la empresa.



El Machine Learning es la capacidad de aprendizaje de una máquina mediante una serie de algoritmos y la entrada de datos a su sistema. Hoy en día utilizamos este sistema cada vez más, en más actividades de nuestra vida cotidiana.

1. Seguridad de datos

Habilidad Antivirus. Todas las empresas guardan su información en bases de datos dentro de ordenadores. Los piratas informáticos o hackers han desarrollado malwares que pueden robar todos estos documentos. Además, son rápidos al crear nuevos programas, por lo que algunos antivirus no pueden detectarlos fácilmente. El machine learning puede predecir qué archivos son malware con gran precisión, ya que su estudio de patrones analiza a todos los que acceden a los datos y avisar de cualquier anomalía.

También puede detectar, mediante sus algoritmos, el spam. Por lo que es una habilidad Anti-spam muy optimizada y accesible.

Por ejemplo, la plataforma GMAIL utiliza este sistema. El machine learning aprende de mensajes pasados cuáles son maliciosos o spam, por lo que si los correos futuros tienen los mismos patrones, podrá tomar decisiones basándose en ellos.

2. Detección de fraudes

Esto sirve para combatir el posible blanqueo de dinero o fraudes de miles de, en España, euros. Las empresas utilizan este sistema para analizar millones de transacciones y detectar cuáles no son reales y quiénes son los compradores o vendedores de dicha acción.

Empresas como Paypal y Bitcoin utilizan este sistema para analizar en segundos las transacciones de todos los usuarios de sus plataformas. De esta forma, las compañías se sienten más seguras.

3. Marketing

Se utiliza para aprender los patrones habituales de los clientes potenciales y así poder ofrecer nuestros productos y servicios adaptados a sus necesidades.

Un ejemplo claro para esta aplicación es la empresa Amazon. Su uso del machine learning le permite analizar a todos sus usuarios y compararlos entre sí para averiguar qué les interesa comprar en el presente o incluso en el pasado. Además, es capaz de averiguar si su cliente va a comprar algo para sí mismo o para regalar.

Es importante saber también cuándo es la mejor hora para llamar al cliente o cuáles son las mejores Keywords para mejorar el posicionamiento en Google.

Si la empresa tiene una App movil, el machine learning puede ayudar a predecir los comportamientos de sus clientes y adaptarse a sus costumbres o necesidades, y así modificar su aplicación.

4. Finanzas

Los algoritmos de este sistema estudian los patrones de inversión, de tal manera que son capaces de predecir cómo va a cambiar el mercado de valores y cuáles son los mejores momentos para invertir. Es una forma de comprar y vender más eficiente. Muchas empresas del sector ya utilizan sus propios sistemas para predecir y ejecutar operaciones de gran volumen a altas velocidades.

5. Búsqueda online

Cada vez que buscamos algo en Google, sus algoritmos estudian cómo se comporta el usuario ante las posibilidades ofrecidas por el buscador. Realiza una serie de patrones y aprende sobre su comportamiento. Todo se basa en los clicks y el tiempo que pasa una persona en la página. Si el usuario no hace click en ningún link y cambia de palabras, el buscador aprende de su error. Si un mecánico busca "gato" y sus búsquedas anteriores están relacionadas con coches, el buscador le ofrecerá resultados sobre gatos de coche, no el animal.

Google y demás exploradores utilizan este sistema.


La próxima semana publicaremos más aplicaciones para machine learning. Si tienes alguna duda o sugerencia, no dudes en contactarnos.

Quinta parte.

En noviembre, Jorge López Lázaro, uno de nuestros profesores del master big data, realizó una ponencia. Cada martes hemos subido las partes en 10 minutos de la misma, y en este post os traemos la quinta. Jorge nos explicó toda la información que aportan los medios de comunicación sobre la COVID-19. Aporta datos claros, directos y reales, sin sesgos.

Además, en esta quinta parte nos habla sobre toda la información de la desescalada y fuentes verídicas para buscar y corroborar datos.

Ya está toda la ponencia en nuestro blog y nuestro canal de YouTube. Entrevistaremos a Jorge para conocer la evolución y los cambios en la información y datos que aportan los medios y gobiernos de los países.



Si tienes alguna pregunta o comentario acerca de este tema, contacta con nosotros y participa en el futuro del Big Data. Además, puedes comentarnos si quieres participar en alguna otra ponencia.

Cuarta parte.

Hace ya más de un mes de la ponencia en datahack sobre los datos aportados por los medios de comunicación durante la pandemia. Fue convocada por nuestro profesor Jorge López Lázaro. En este vídeo, Jorge realiza una comparación mundial y nos aporta datos reales y su interpretación sin sesgos sobre los fallecidos por la pandemia.

Muchas personas no pudisteis estar, por lo que hemos estado subiendo las partes a la web. Esta es la cuarta parte de la ponencia. Solo falta la quinta para acabar, estará el próximo lunes 7 de diciembre.

Cuando hayamos colgado todos los vídeos, entrevistaremos de nuevo a Jorge para que nos cuente cómo ha evolucionado en el tiempo transcurrido la comunicación respecto a los datos que siguen dando medios y gobiernos a nivel mundial, y la realidad de los mismos.



Datahack está abierta a recibir comentarios, informaciones y datos que desees aportar. Si tienes alguna pregunta, contacta con nosotros y participa en el futuro del Big Data.

El Big Data se ha convertido en algo esencial para nuestra empresa. No podemos prescindir de ello. El Workflow o flujo de trabajo es el estudio realizado de las operaciones de una actividad o tarea. En este post explicamos cómo se pueden unificar estos dos sistemas y cuáles son las mejores estrategias.


Big data y workflow

Por un lado, los procesos tienden a diseñarse como estructuras de extremo a extremo de alto nivel, útiles para la toma de decisiones y normalizan cómo se hacen las cosas en una empresa u organización. Por el contrario, los flujos de trabajo están orientados a tareas y, a menudo, requieren datos más específicos que los procesos que se componen de uno o más flujos de trabajo relevantes para el objetivo final.

Las empresas están buscando una mayor eficacia en la captura de datos. Los almacenan y procesan para conseguir mayor competitividad en el sector. Además, un negocio puede, con el big data, realizar un test constantemente sobre sus tareas y rendimiento de los recursos de la empresa para conseguir la mejor optimización. Con esta base de datos puede analizar de manera fácil y rápida cuáles de estos procesos son más rentables y seguros. Las aplicaciones del big data están marcando un cambio, puedes descubrir cuáles son en nuestro blog.


Unificar Big Data y Workflow

Antes de llevar a cabo el análisis de datos del big data es necesario es necesario vigilar, modelizar y documentar las tareas, teniendo en cuenta el método elegido por la empresa y su disciplina. Por un lado, cada vez más empresas incluyen este software en sus tareas, con ello consiguen una integración y optimización de los procesos. Gracias a esto, su flujo de trabajo se ve incrementado y mejorado.

En el software de big data incluye unos bots integrados con procesos de Inteligencia Artificial, que permiten la automatización de procesos específicos de cada sector industrial. También existe un análisis de los trabajadores. Cuáles son sus competencias, su perfil, su puesto y su desempeño, lo que le permitiría a la persona encargada predecir las acciones actuales y futuras del empleado. Así sus posibles promociones o dimisiones. En este apartado se incluye el Machine Learning que podéis leer en nuestro blog.

Durante el confinamiento y con el teletrabajo, la inclusión e implementación del Big Data en las empresas ha sido indispensable. Además, ha permitido una mejor relación y optimización de las comunicaciones entre trabajadores. Hoy en día millones de negocios están aprendiendo y utilizan este software, lo que ha conseguido una gran abundancia de datos en redes.

Este análisis de datos ha permitido a las empresas prever situaciones de riesgo durante la pandemia y conseguir la solución más segura y óptima. Este software ayuda a los procesos de venta, los procesos de comunicación y recursos humanos, monitorizan las acciones y predicen sus riesgos.


Pasos

Además, según Dummies, los pasos para unificar son:

  1. Identificar las fuentes de big data que necesita utilizar.
  2. Asignar los tipos de big data a los tipos de datos de su flujo de trabajo.
  3. Asegurarse de tener la velocidad de procesamiento y el acceso al almacenamiento para respaldar el flujo de trabajo.
  4. Seleccionar el almacén de datos que mejor se adapte a los tipos de datos.
  5. Modificar el flujo de trabajo existente para adaptarse a big data o crear un nuevo flujo de trabajo de big data.

Las empresas que consiguen una buena integración de ambos procesos, obtienen una optimización y progresión, de sus procesos, de gran valor. Big data y workflow son inseparables para tu negocio. Si quieres saber más sobre el Big data y sus usos, puedes entrar en nuestro blog.


Tercera parte.


En el mes de octubre, Jorge López Lázaro, profesor del máster de big data de Datahack, concedió una ponencia sobre los datos y la información aportados durante la pandemia. En este vídeo destaca los problemas y vaivenes de la primera ola y el SIR. Información veraz y sin sesgos. Como muchos de vosotros no pudisteis asistir, subiremos las últimas partes estas semanas.

Esta es la tercera parte de la ponencia. Si no habéis visto los vídeos anteriores, están en nuestro blog. Publicaremos los vídeos cada martes en nuestra web.

Además, estad muy atentos porque una vez que la ponencia completa esté subida, entrevistaremos de nuevo a Jorge para conocer cómo ha evolucionado la situación y los datos que aportan ahora mismo los medios y los gobiernos de los países.



Si queréis saber más acerca del máster de big data de datahack, tenéis más información en la web. Quedan 2 partes más. Nuestra empresa está abierta a recibir comentarios, informaciones y datos que desees aportar. Si tienes alguna pregunta, contacta con nosotros y participa en el futuro del Big Data.

Lourdes Hernández

Esta es la parte dos del análisis de "El dilema de las redes", documental de Netflix. Os animo a leer la parte 1 si no lo habéis hecho.

Llama la atención que solo hay dos industrias que llaman a sus clientes consumidores, las drogas ilegales y el software (Edward Tufte). Y va una pregunta, ¿cuándo chequeas tu móvil al levantarte, antes o después de hacer pis? Solo hay esas dos posibilidades. Esta situación está llevando a un cambio importante en los adolescentes y pre-adolescentes: aumento de los suicidios, cambios en el comportamiento, como por ejemplo retraso o desinterés en sacarse el carnet de conducir, o tener la primera cita con alguien .

Tenemos una competición entre un cerebro de mono y al otro lado de la pantalla millones de ordenadores, ¿quién va a ganar? Al algoritmo le pones una meta, y trabaja para alcanzarla. Aquí el documental dice que los humanos hemos perdido el control sobre estos sistemas, aunque yo no estoy de acuerdo.



La Wikipedia da respuestas distintas sobre la misma pregunta según el usuario, e incluso Google autocompleta la búsqueda de manera diferente. Es como el mago, da igual la carta que elijas, él la va a adivinar. Facebook hace lo mismo

Estos sistemas están llevando a una mayor polarización de la sociedad, porque esta polarización mantiene a la gente conectada.

Tenemos un par de ejemplos interesantes. El jugador de baloncesto Kyrie Irving se posicionó en un momento como terraplanista, tras una investigación que había realizado él mismo en Instagram. Cuando posteriormente reconoció su error y pidió disculpas, los terraplanistas dijeron que había sido abducido.


Kyrie Irving

Otro ejemplo es el Pizza Gate, donde se difundió un bulo que decía que al pedir una pizza, estabas favoreciendo el tráfico de personas.

Lo cierto es que las fake news se propagan 6 o 7 veces más rápido que las noticias verdaderas. La mentira hace ganar más dinero, mientras que la verdad es más aburrida.

Aquí menciona de soslayo el Covid, pero yo creo que les pilló un poco pronto a los creadores del documental.

En el dilema de las redes, para controlar a la población, no hay herramienta más potente que Facebook. Un ejemplo claro es lo que ocurrió en Myamar, donde a la gente se le vendía el móvil con el Facebook ya instalado. El propio Facebook reconoció haber contribuido a la violencia étnica en aquel país.

Se podría utilizar la plataforma con otros fines, pero este es el que se definió.

La inteligencia artificial por si sola no puede acabar con esto, ni el propio Google, porque no existe un proxy que detecte conspiraciones o mentiras. La tecnología no es la amenaza, sino que la tecnología ha sido diseñada para sacar lo peor de la sociedad.

¿Soluciones para el dilema de las redes?

¿Un impuesto fiscal a las empresas que capturen muchos datos, para no quedarse con todos los datos del planeta? Las leyes están hechas no para proteger a los usuarios, sino los derechos de las grandes empresas. Deberían prohibirse estos mercados, igual que están prohibidos los mercados de órganos, de esclavos… no puede ser el lucro a toda costa. Actualmente una ballena o un árbol valen más muertos que vivos. Captar tu atención por encima de todo. Es necesario mejorar los sistemas para que respeten al usuario, aunque desde mi punto de vista son objetivos contrapuestos.

Algunos consejos finales,  reduce y desactiva las notificaciones (yo tengo todas desactivadas desde más de año), antes de compartir verifica las fuentes (me parece imprescindible, para al menos estar seguros de no estar alimentando conspiraciones), “si parece diseñado para activar tus botones emocionales, lo será”, asegúrate de tener fuentes de información distintas, incluso aunque no compartan tu ideología o creencias.

Comentarios serán bienvenidos.


chevron-down