En este artículo creado por Pablo Sainz de Vicuña, profesor de visualización de datos en el master de Big Data &Analytics de datahack, conoceremos de su propia mano la herramienta Tableau:

Tableau es una herramienta de visualización de datos líder del mercado que se caracteriza por su fácil aprendizaje, es muy sencillo comenzar a extraer información con ella y representar los datos de forma eficiente. Además permite jugar con los datos de origen pudiendo crear tus propios campos calculados, dicho código también resulta bastante sencillo de codificar y de aprender

Me gustaría compartir un proyecto que realicé cuando comencé a trabajar con Tableau que me dio la oportunidad de combinar dos de mis aficiones, el Golf y la Visualización de datos. Seguro que todos habéis oído hablar de un torneo de Golf en el que el premio es una chaqueta verde, pues bien, este torneo es el más prestigioso del mundo y se llama Masters de Augusta.

Mi idea consistía en crear un cuadro de mando que nos permitiese explorar la clasificación así como los jugadores, los hoyos y los golpes realizados. Una idea ambiciosa por dos grandes motivos, primero, mi desconocimiento de la herramienta, la había utilizado en el master y poco más, y segundo, de donde sacaría los datos.

El primero de los problemas se podía solventar a base de trabajo, investigación y perseverancia, el segundo…es más complicado, estuve buscando bases de datos pero nunca encontré nada que se asemejara a los que buscaba por lo que si quería llevar a cabo mi proyecto tendría que conseguir los datos por mí mismo. Para ello podía ponerme a escribir los datos a mano, algo imposible e ineficiente, o podía utilizar una de las técnicas que aprendí durante el master, web scrapping, esta técnica consiste en sacar la información de una página web aprovechando el código HTML de la misma.

Visité la página oficial del torneo y comprobé que podía extraer toda la información de ella, por ejemplo, la siguiente imagen muestra la clasificación:

Y su código es el siguiente:

Podemos ver que esta página tiene una estructura que podemos aprovechar y llegar al dato que necesitamos, si nos fijamos en la línea sombreada en azul aparece el nombre del jugador en la segunda línea de la clasificación, así como sus valores en las líneas siguientes.

Localizada la fuente de datos ahora tocaba empezar a trabajar, no soy ningún experto en la programación pero si algo había aprendido durante el master de datahack era a investigar. Encontré una librería que nunca había utilizado de web scrapping llamada “Selenium” y comencé a hacer pruebas en un notebook de jupyter utilizando python como lenguaje. Pronto empecé a ver resultados satisfactorios ya que obtuve mucha información rápidamente.

Este es es script que utilicé para obtener los jugadores:

En él se puede ver que primero buscaba el listado de jugadores para después recorrer este listado con cada jugador y obtener sus datos (Player ID, Nombre, Altura, Peso, Edad, Pais, Descripción y Mejor resultado).

También aprovechamos la web para descargar las imágenes de los jugadores y de los hoyos para poder utilizarlas en nuestro cuadro de mando.

Más sencillo resultó el script para extraer la información de los hoyos:

Para cada hoyo obtenemos su Número, Nombre, Par (golpes con los que se debería hacer el hoyo), Distancia y Descripción.

Por último faltaba obtener cada golpe realizado por cada jugador, este script requirió más trabajo ya que el código resultaba más complejo, su tiempo de ejecución era muy elevado y afinarlo fue bastante tedioso, pero finalmente logré el dataset que buscaba:

De cada golpe obtuve el PlayerID, Ronda, Golpe, Distancia, Unidad de distancia, Distancia al hoyo, Unidad de distancia al hoyo, X, Y, X Origen, Y Origen. ¡Ya tenía todo lo necesario para representarlo en Tableau!

Lo primero al entrar en Tableau es crear la fuente de datos, en este caso resultó bastante sencilla debida a la labor previa que hicimos con la extracción en Python.

Simplemente unimos la tabla principal Golpes con Jugadores y Hoyos.

Utilizando la función de pivotar en la fuente de datos conseguimos juntar los puntos X e Y de origen y destino en una misma medida pudiéndolos diferenciar mediante una dimensión Origen/Destino. Esto iba a resultar imprescindible para el gráfico principal del dashboard, el shottracker.

SHOT TRACKER

La construcción del gráfico principal resultó bastante compleja, una vez resuelto el problema de unificar el origen y destino de las coordenadas en la fuente la construcción del gráfico no resulta demasiado compleja.

La hoja está compuesta por un gráfico de puntos y un gráfico de líneas en eje doble con la ronda en color, el tiro en texto, el jugador y el hoyo en detalle.

Lo que faltaba era conseguir cambiar la imagen del hoyo dinámicamente en función de la selección realizada. Para ello encontré una solución que consistía en editar las imágenes en segundo plano del el menú de Mapa.

Una vez dentro se creaban todas las imágenes una a una incluyendo un filtro personalizado en el que seleccionábamos el hoyo correspondiente.

Conseguir esta hoja me llevó una enorme labor de investigación para replicar todos los efectos deseados.

CLASIFICACIÓN

A simple vista no parece una gráfica muy compleja. Es un mapa de calor que cuenta los golpes por ronda de cada jugador. La dificultad vino de conseguir que ese cálculo fuese correcto, en esa etapa no sabía manejar las expresiones en nivel de detalle que ofrece Tableau, estas expresiones son parecido a subconsultas que se pueden hacer a la fuente de datos original para fijar el valor en una dimensión. Son unos de los conceptos más complejos de Tableau y comprenderlos lleva su tiempo, pero necesitaba utilizarlos así que tocaba de nuevo investigar y probar hasta conseguir el resultado deseado, finalmente lo conseguí con un campo calculado que a día de hoy tardaría segundos en hacer pero que en aquel momento me pudo llevar un par de días de prueba y error.

Para conseguir el color también necesite otros campos calculados:

PANEL DE JUGADOR SELECCIONADO

En función del jugador que se selecciona en el panel de clasificación cambia el panel del jugador con su nombre y su foto.

Este efecto requiere un trabajo bastante laborioso por detrás, primero hay que tener todas las imágenes guardadas en una carpeta dentro de la siguiente ruta:

C:\Users\My_User\Documents\Mi Repositorio de Tableau\Formas

Al reiniciar Tableau veremos que si creamos un gráfico de formas nos ofrece las que están dentro de la carpeta recién creada. Después hay que asignar manualmente cada foto a cada jugador.

Crear la gráfica es sencillo ya que únicamente requiere incluir los jugadores en Forma y mediante una acción de filtro en el dashboard conseguimos ver únicamente el jugador seleccionado.

En el tooltip del jugador podemos ver otros cálculos interesantes como la máxima distancia del drive y su promedio.

El número de greenes cogidos, se considera el número de golpes que se deberían dar para llegar al Green, en un par 4 serían dos golpes; para calcular esto nos basamos en las unidades que nos ofrece el dataset:

Si el golpe tiene una distancia en yardas es un golpe desde fuera de Green, mientras que si están en pies o pulgadas es un Putt.

Siguiendo esta lógica también se calcula el número de putts por ronda realizados. Una vez construidas las hojas monté todo en el dashboard de incluí las acciones de filtro necesarias para que todo respondiese correctamente.

Creo que lo más interesante de este proyecto es lo mucho que aprendí de Tableau partiendo desde cero, buscando ejemplos que me sirviesen a mi dashboard, utilizando fórmulas que nunca había realizado, queriendo crear gráficas que no sabía hacer, y pudiendo juntar dos de mis pasiones todo se hace más fácil.

Pablo Sainz de Vicuña Data Analyst Senior en Inetum • Profesor Visualización en datahack school •

 linkedin.com/in/pablo-sainz-de-vicuna

¡Si te ha gustado el contenido de este artículo no te olvides de suscribirte a la newsletter!

Temática

Business Intelligence

Tiempo de lectura

4 minutos

Claves de contenido del artículo

Power BI

Tableau

Micro Strategy

Oracle BI

Qlik

El mercado de las herramientas de Business Intelligence crecerá a un ritmo anual del 7,6% entre 2020 y 2025, según pone de manifiesto un estudio de MarketsandMarkets. La Inteligencia de Negocio y el Big Data están ofreciendo a las organizaciones justo lo que más necesitan: confianza en medio de la incertidumbre por la pandemia de la COVID-19 y por la imparable transformación digital en que se halla inmerso el sector empresarial.

Los expertos en Business Intelligence y Big Data recurren a soluciones tecnológicas para  automatizar las tareas de recolección y análisis pero, sobre todo, para trabajar en la visualización de datos. Numerosos departamentos (como marketing, RRHH, compras, logística, etc.), así como los mandos directivos, hacen uso de dashboards creados con estas plataformas para consultar información previamente tratada por los analistas y data scientists.

Ante este interés por el Business Intelligence, el número de herramientas a nuestra disposición no hace sino aumentar. ¿Con cuál -o cuáles- quedarnos? En datahack hemos llevado a cabo nuestra propia selección con las 6 soluciones de Inteligencia de Negocio más útiles para este 2021. ¿Las has probado ya?


El mercado de las herramientas de Business Intelligence crecerá a un ritmo anual del 7,6% entre 2020 y 2025
MarketsandMarkets


Power BI

Power BI es una suite de Microsoft para la gestión de datos y la realización de análisis descriptivos y predictivos. Power BI vuelca la información en cuadros de mando interactivos que muestran la evolución de las variables del negocio, favoreciendo una dinámica self-service de acceso a los datos por parte de las distintas áreas de la organización.

Entender el funcionamiento de esta herramienta de Business Intelligence es prácticamente una obligación para los expertos en Big Data. ¿Qué puedes hacer para acercarte a ella?

Tableau

Tableau mantiene su posición de preeminencia entre las soluciones de Business Intelligence más utilizadas. Probablemente, porque los niveles de dificultad en su manejo se adaptan al conocimiento de sus usuarios: los neófitos pueden efectuar análisis sencillos en una plataforma visual e intuitiva; mientras que los especialistas disponen de numeras opciones de configuración en un entorno seguro y escalable.

Además, su gran implantación en todo el mundo ha favorecido el crecimiento de una comunidad online muy activa, que comparte a menudo sus experiencias con la herramienta en foros y redes sociales.

¿Quieres profundizar más en estás herramientas? Conoce nuestro Máster en Data Science y Big Data para volverte un profesional del business Intelligence

Micro Strategy

La rapidez y la inmediatez son las grandes ventajas que sitúan a MicroStrategy como una de las herramientas de Business Intelligence con más potencial en 2021. Ofrece numerosas posibilidades de integración con otras aplicaciones (con Power BI, entre otras), permite efectuar análisis en tiempo real y acaba con los silos en el manejo de la información empresarial. Además, provee funcionalidades específicas para el entorno móvil.

Oracle BI

Oracle BI es la suite de soluciones de Inteligencia de Negocio de Oracle. Presenta dos grandes bazas como herramienta de Business Intelligence para este año:

Qlik

Qlik lleva a gala su posición de liderazgo dentro del Cuadrante Mágico de Gartner 2020 para herramientas de analítica y Business Intelligence, donde comparte trono con Microsoft y Tableau. Lo mejor de esta plataforma es que, con un tono pedagógico en su comunicación, intenta hacer fácil lo difícil, apostando por la simplificación de sus comandos y la automatización de las órdenes. En definitiva, persigue que los usuarios le pierdan el miedo a los datos.

SAP Business Objects Business Intelligence

La plataforma BusinessObjects Business Intelligence de SAP destaca por su escalabilidad, requisito extremadamente valioso para startups y empresas en expansión. Se trata de una herramienta de Inteligencia de Negocio con implementación local y 100% integrable con el paquete Office de Microsoft, lo que la convierte en la solución de elección para aquellas compañías que han hecho de Excel su biblia corporativa.

Atrévete a formarte con nuestro Máster Experto en Data Science y Big Data

Una formación 100% online y adaptada a ti para que te conviertas en un experto en las herramientas de Business Intelligence.

¿Te perdiste nuestra charla de Tableau con Pablo Sáinz de Vicuña en nuestra escuela en Madrid?

La necesidad de la visualización de datos

Hablamos sobre la importancia de la visualización de datos. Tenemos una gran responsabilidad de cara a mostrar los datos de forma clara y comprensible para que puedan ser explotados correctamente. Una interpretación incorrecta podría llevar a tomar una mala decisión y hacer perder mucho dinero a la empresa.
Es cierto que "Pintamos y Coloreamos", pero cada línea que pintamos o cada color que elegimos está pensado para dar claridad a lo que queremos expresar. El ser humano es capaz de interpretar un estímulo visual en milésimas de segundo. Nuestro objetivo es aprovechar esta capacidad incomparable a nuestro favor.

Usando Tableau

Estuvimos analizando los datos de una encuesta que rellenaron los asistentes, empezamos viendo las gráficas que Tableau nos ofrece, hicimos algunas pequeñas modificaciones sobre ellas, vimos geolocalización, conectamos con el API de Google Maps. Y terminamos haciendo un dashboard interactivo con todo lo que abordamos.

Vídeo de la charla completa de Tableau, mucho más que pinta y colorea


Pablo Sainz de Vicuña, consultor de Tableau

chevron-down