Las cinco V’s del Big Data

Las cinco V’s del Big Data

Cuando se pregunta a los expertos sobre el Big Data, son muchas las definiciones que surgen, lo cual puede llevar a confusión. No obstante, hay un cierto consenso en sus cinco características principales, que curiosamente empiezan todas por “v”. En principio eran solo tres (volumen, velocidad y variedad), que se refieren las características de los datos, pero poco a poco se han ido añadiendo dos más (veracidad y valor), que engloban lo que se debe hacer con esos datos.

Características de los datos en Big Data

Volumen

Se  trabaja con ingentes cantidades de datos. estructurados pero sobre todo desestructurados, procedentes de distintas fuentes. Los datos son tantos que resulta difícil su almacenamiento y análisis, suponiendo retos técnicos y analíticos

Velocidad (y volatilidad)

Los datos se generan con cada vez mayor rapidez, exigiendo una respuesta veloz porque también quedan obsoletos pronto. Esto requiere tiempos de recopilación, procesamiento, análisis y gestión de la información cortos, a veces incluso en el mismo momento.

Variedad

Los datos recibidos son diversos (algunos estructurados, otros no), procediendo de diversas fuentes, herramientas y plataformas. Además, muchas veces están en varios formatos, lo que aumenta la complejidad tanto en su almacenamiento como en su procesamiento y análisis. Esto es porque lo habitual es que cada tipo de información se trate de manera distinta, mediante herramientas específicas, en especial en los datos desestructurados.

Lo que se debe hacer con los datos en Big Data

Veracidad

El grado de confianza en los datos debe ser alto, con resultados de calidad y verificables. Hay que tener en cuenta muchos de los datos llegan incompletos, por lo que deben ser limpiados y analizados.  Para ello, se hace necesario invertir tiempo y dinero para conseguir datos de calidad o para aplicar soluciones y métodos capaces de eliminar al máximo los errores en los que tenemos.

Valor

Los datos generados, una vez procesados y convertidos en información, deben ser útiles y tener un valor real, tanto más si tenemos en cuenta la inversión necesaria para recopilarlos y procesarlos. Para tener valor, tienen que ser accionables, es decir, deben ayudarnos a tomar una decisión en base a ellos.

Cómo conseguir veracidad y valor en los datos

Para conseguir recopilar, limpiar, procesar, analizar y visualizar grandes cantidades de datos, muchas veces desectructurados, necesitamos conocer y dominar una larga lista de herramientas. Python, R, Hadoop, Spark… son herramientas y lenguajes imprescindibles para lograr sacar la máxima veracidad y valor de nuestros datos.

En el máster en Big Data & Analytics aprenderás a dominar las principales herramientas del mercado de forma 100% práctica y de la mano de profesionales que trabajan en el sector.

 Quiero saber más sobre el máster de BD&A

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *