Las 10 v’s del Big Data

infografia-datahack-10-v

Ya habrás oído hablar de las 3 y 5′ Vs del Big Data, pero, ¿que sabes de las restantes? En este artículo te contaremos todo sobre sus 10 propiedades más importantes.

1 – Volumen

El volumen es la cantidad masiva de datos que se generan cada segundo, minuto, hora o cualquier otra cifra de tiempo estimada. Han de ser grandes cifras de datos para considerarse Big Data. Por ejemplo, Youtube almacena 18.000 segundos de vídeo por minuto de sus usuarios.

2 – Velocidad

La velocidad a la que se generan o actualizan los datos. Un ejemplo de ello es Google, que procesa unas ” 40,000 consultas de búsqueda por segundo “, lo que se traduce apróximadamente en más de 3,5 mil millones de búsquedas por día.

3 – Variedad

Cuando se trata de Big Data, no solo tenemos que manejar datos estructurados, sino también semiestructurados y principalmente no estructurados. Desde archivos de audio, imagen, video, actualizaciones de redes sociales y otros formatos de texto, hasta archivos de registro, datos de clics, de máquinas y sensores, etc.

4 – Variabilidad

La variabilidad en el contexto de big data tiene dos significados:
Uno es el número de inconsistencias en los datos. Estos deben ser encontrados por métodos de detección de anomalías y valores atípicos para que ocurra cualquier análisis significativo.
Otro es la multitud de dimensiones de datos que resultan de múltiples tipos y fuentes de datos dispares. La variabilidad también puede referirse a la velocidad inconsistente a la que se cargan grandes datos en bases de datos.

5 – Veracidad

La veracidad se refiere a la procedencia o confiabilidad de la fuente de datos, su contexto y cuán significativo es para el análisis basado en ella. A medida que aumentan algunas o todas las propiedades anteriores la veracidad disminuye.

Ejemplo: imagine un conjunto de datos estadísticos sobre lo que la gente compra en los restaurantes y los precios de estos artículos en los últimos cinco años. Puede preguntar: ¿Quién creó la fuente? ¿Qué metodología siguieron para recopilar los datos? ¿Solo se incluyeron ciertas cocinas o ciertos tipos de restaurantes? ¿Los creadores de datos resumieron la información? ¿Esta ha sido editada o modificada por alguien más?

6 – Validez

Se refiere a la limpieza que tienen los datos, a cuán precisos y correctos son para su uso. El beneficio del análisis de Big Data es tan bueno como sus datos subyacentes, por lo que se deben adoptar buenas prácticas de gobernanza de datos para garantizar una calidad de datos coherente, definiciones comunes y metadatos.

7 – Vulnerabilidad

Toda preocupación de seguridad respecto a los datos. Se han dado muchos casos de hackeo y violación de macrodatos para posteriores actividades ilegales.

8 – Volatilidad

O el tiempo que deben conservarse los datos. Antes del Big Data, se tendía a almacenar datos indefinidamente debido a que a su pequeño volumen apenas suponía gastos. Incluso podía mantenerse en la base de datos en vivo sin causar problemas de rendimiento.

Sin embargo, debido a la velocidad y el volumen de los macrodatos, su volatilidad debe considerarse cuidadosamente. Ahora hay que establecer reglas para la disponibilidad y la vigencia de estos datos, así como para garantizar una recuperación rápida de la información cuando sea necesario.

9 – Visualización

Otra característica de los grandes datos es la complejidad para visualizarlos. No se puede confiar en los gráficos tradicionales para trazar un billón de puntos de datos, por ejemplo, por lo que son necesarias diferentes formas de representarlos, como la agrupación o el uso de mapas, las coordenadas, los diagramas, etc.

10 – Valor

Por último y posiblemente el más importante de todos. Las otras características no tienen sentido si no se obtiene un valor, como puede ser: comprender mejor a los clientes, optimizar procesos, mejorar el rendimiento, …

Conclusión

Por lo que, cada vez más se la da el valor al poder del dato, cada vez se sabe más sobre los datos y cada vez más está creciendo la importancia de la gestión de los datos dentro de las empresas.

Nosotros creemos en los datos y en su potencial, por eso creamos nuestro Máster de Big Data & Analytics.

Otros artículos

Un comentario de “Las 10 v’s del Big Data

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *