Fundamentos del Big Data 2: Ciencia de datos y data mining

Fundamentos del Big Data 2 - Ciencia de datos y data mining

Continuamos con nuestra serie de artículos con el recorrido por las tecnologías Big Data, en la que ya hablamos de las áreas de conocimiento.

Ciencia de Datos

Si nos vamos al sentido más estricto de esta expresión, diremos que ciencia de datos es casi todo aquello que tenga que ver con los datos. Y, si nos paramos a pensar, casi cualquier cosa del ámbito que nos rodea está relacionada con los datos.

Una definición más precisa es “área interdisciplinar que incluye métodos científicos, tecnologías y procesos para extraer conocimiento y valor de los datos sean del tipo que sean”. En resumen, es una disciplina que hace que los datos sean útiles.

Dicho esto, los creyentes del Big Data no debemos caer en la trampa de considerar que es una ciencia moderna y que venimos a aportar algo completamente nuevo. El almacenamiento de datos existe desde hace milenios. Como tal, esta ciencia y sus procesos tienen este nombre desde Peter Naur los llamara así en los años sesenta. Por tanto, no hemos inventado la rueda. 

Wikipedia, además, tiene una definición muy sencilla que puede conectar pasado y presente cuando lo define como: “concepto para unificar estadísticas, análisis de datos, Machine Learning y sus métodos relacionados”, para “entender y analizar fenómenos reales”.

Data Mining

Vamos a incluir en este artículo uno de los conceptos inherentes a la ciencia de datos: el data mining o minería de datos.

Podemos englobar aquí el conjunto de técnicas y tecnologías de las que nos vamos a valer para explorar grandes bases de datos. A partir de diversas técnicas, vamos a tratar de encontrar patrones, tendencias o anomalías que nos ayuden a ver cómo se comportan nuestros datos.

En mayor o menor medida siempre hemos aplicado técnicas de data mining dentro del llamado Business Intelligence o BI. La principal diferencia es que en BI generalmente hemos tratado de responder preguntas concretas a partir de nuestros datos. 

Hoy en día, gracias al crecimiento exponencial de los datos, a la mejora de capacidad de procesamiento de los equipos modernos y a las nuevas tecnologías de Big Data, ya no siempre vamos a buscar responder una pregunta. Ahora podemos observar datos de los que no conocemos nada y encontrar patrones. Una vez que encontremos ese patrón y tengamos una pista que seguir, podremos profundizar en los datos y extraer conocimiento orientado a la toma de decisiones. 

¿Por qué es tan importante formarse en técnica de data mining ahora?

Vivimos hoy una transformación en la que hemos pasado de que los datos sean una parte estática del negocio a que sean la materia prima. Donde explotábamos los datos para ver cómo iba la evolución del negocio, explotamos datos para evolucionar el negocio, tomar decisiones y crear productos y acciones de impacto en la sociedad y en las cuentas de la empresa. Además, estas acciones no tienen por qué ir orientadas únicamente al aumento del beneficio. Una de las mejores aplicaciones de estas técnicas es la optimización de costes. 

Por tanto, ya sea que quieres mejorar tu satisfacción de cliente, crear mejores productos u optimizar tus costes, una pequeña actualización técnica puede ser determinante.


Aitor Farragut, Consultor Senior BI & Big Data

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *