Como ya hablamos en el artículo anterior, donde se comentaban los conceptos básicos del análisis de grafos en redes sociales, uno de los usos del análisis de grafos en redes sociales es identificar a los actores clave de la red. Es decir, a aquellos con mayor poder social. Estos actores centrales tienen más facilidad de acceso al resto de nodos y tienen más poder para influenciar en el flujo entre ellos, así que nos interesa tenerlos localizados.

Intuitivamente, podemos pensar que eso es fácil de detectar: con encontrar al que tenga más conexiones basta. No obstante, ¡la realidad es mucho más compleja!

Grado

Hace referencia a la cantidad de aristas que tiene un nodo. En una red no dirigida, cuantas más aristas tenga un nodo, más oportunidades de alcanzar a otros nodos. Es decir, tiene más oportunidades y alternativas para interactuar.

En redes dirigidas es algo más complejo, porque el grado se divide en:

Prestigio de entrada (in-degree), o Soporte

El concepto básico es que los actores que tienen gran prestigio de entrada son prominentes. Es decir, son importantes porque muchos actores intentan tener enlaces directos con ellos.

Prestigio de salida (out-degree) o Influencia.

El concepto básico es que los actores con gran prestigio de entrada son influyentes gracias a la teoría de la fortaleza de los lazos débiles. Esta teoría indica que las mejores oportunidades no suelen venir de las conexiones directas, sino de las conexiones lejanas (amigos de amigos, conceptos relacionados con los conceptos a los que enlaza una idea...).

Problemas con los conceptos de grado

El problema de este concepto de influencia dirigida es que no se aplica a todas las redes. Es muy efectivo a la hora de ver los intercambios comerciales, la búsqueda de empleo o la generación de oportunidades. Pero en otras redes como twitter o la red de enlaces entre webs, el concepto de Influencia se desmorona. Que un nodo tenga un alto grado de entrada sí que le convierte en prominente, porque mucha gente les referencia. No obstante, un nodo con alto grado de salida no tiene que ser necesariamente influyente.

Por ejemplo, pensemos en una web sin importancia, recién creada, que tiene cientos de enlaces. Tendrá un gran grado de salida, pero eso no la convierte en influyente. Igualmente, en una red de comentarios de twitter, que un usuario esté retuiteando, comentando o mencionando a una o varias cuentas en concreto (alto grado de salida) no es una medida de su influencia. Todo lo contrario, son los usuarios cuyos post reciben retweets, menciones o comentarios (alto grado de entrada) los que no solo son prominentes, sino que son influyentes, ya que sus contenidos se viralizan.

Otro  problema de las medidas de grado en general es que lo único que mide es la importancia con respecto a los nodos cercanos, sin importar las conexiones de dichos nodos entre sí y con el resto de la estructura de la red.

Centralidad de vector propio

Es una versión más elaborada de la Centralidad de grado. Esta medida se basa en que la centralidad de un nodo depende de la centralidad de sus vecinos (prominencia). Así, el poder y el status de un actor (ego) lo definimos de forma recursiva a partir del poder y el status de sus vecinos (alters). De esta forma, asume que no todas las conexiones tienen la misma importancia y tiene en cuenta la calidad de las conexiones, no la cantidad. Uno de estos algoritmos es el utilizado por el Pagerank de Google.

Cercanía

Hace referencia a la longitud del camino que tiene un nodo respecto al resto de nodos de la red. Cuanta mejor sea su medida de cercanía, más posibilidad tiene el nodo de interactuar de forma más directa con el resto de nodos de la red. En definitiva, esta medida da importancia a estar cerca del centro de la red.

Más medidas y problemas de la cercanía

En redes dirigidas, la cercanía se divide también en Cercanía de entrada y Cercanía de salida, con todas las limitaciones de las que he hablado antes al hablar del grado de entrada y de salida.

Otro inconveniente de la medida de cercanía es que por lo general se consideran solo aquellos actores desde los que un nodo puede ser alcanzado, no la red completa. Por eso, en redes complejas con varios clusters separados, podemos tener problemas.

Intermediación (Betweenness)

Hace referencia a hasta qué punto un nodo hace de enlace entre otros nodos de la red. Esto le da poder para conectar distintos actores… y para desconectarlos.

Con esta medida, el actor con una posición más intermedia está situado entre los caminos geodésicos de todos los demás. Vamos, que cuantos más nodos necesiten pasar por un nodo para llegar a otros nodos por el camino más corto, más central será.

Esto se traduce en un gran poder por parte de esos usuarios para asuntos tan clave como la viralización de los contenidos. Si un contenido tiene que pasar por un nodo para llegar a un grupo grande y este es el único camino, tendrá un gran poder en la red aunque tenga pocas aristas. Por ese poder de control de la información se les llama porteros (gatekeepers).

Problema de la intermediación

El mayor problema del algoritmo de intermediación es que solo tiene en cuenta los vínculos inmediatos y deja de lado los vínculos indirectos más globales.

Otras medidas de centralidad

Excentricidad

Es otra medida basada en distancias entre nodos, teniendo en cuenta la máxima distancia geodésica entre dos actores. Los nodos con más excentricidad son los más periféricos, mientras que los que tienen menos son los más centrales.

Coeficiente Local de Clustering

Se basa en el concepto de que las redes sociales son transitivas y que los amigos de un nodo suelen ser amigos entre sí también. Pero no todas las redes lo son, así que, para averiguar si son transitivas, nos basamos en el Coeficiente de Clustering que puede ser global (toda la red) o local (cada nodo).

Conclusión

Como vemos, la centralidad está lejos de ser fácil de calcular y es un poco relativa. Elegir la medida de centralidad más adecuada para analizar una red social depende de la propia estructura de la red y de los objetivos que tengamos para localizar a los actores clave. ¿Queremos a una persona a la que sigan muchas personas o queremos encontrar puertas a comunidades a las que actualmente no podamos llegar?

Por lo general, lo interesante a la hora de analizar una red social es aplicar varias medidas de centralidad y ver qué nos encontramos.

MÁSTER EXPERTO BIG DATA ANALYTICS

Gracias al Master en Big Data Analytics 100% Online tendrás amplios conocimientos sobre las herramientas y técnicas analíticas necesarias para la modelización de los principales retos de negocio, con el fin de mejorar la toma de decisiones a través de los datos y el conocimiento.

El análisis de grafos en redes sociales nos puede proporcionar mucha información sobre las comunidades, individuos influyentes y sinergias producidas en dichas redes. En este artículo veremos los conceptos más básicos necesarios para proceder a dicho análisis.

QUÉ ES UNA RED

Una red, básicamente, es un conjunto de nodos conectados por una serie de aristas. Estos nodos no tienen necesariamente que ser personas. También pueden ser países, webs, comunidades o incluso ingredientes en recetas de cocina.

Las aristas, por su parte, son relaciones entre esos nodos. Por lo tanto, pueden ser de diversos tipos: amistad, odio, parentesco, influencia, menciones, transferencias, interacciones, comunicaciones, migraciones… ¡Todo lo que se te pueda ocurrir para conectar un nodo con otro!

QUÉ ES UNA RED SOCIAL

No es más que una red en la que los nodos son individuos y las aristas son las relaciones entre dichos individuos. Estas relaciones pueden ser de amistad, pero también de influencia. Aquí debemos distinguir entre dos tipos de redes:

REDES SOCIALES NO DIRIGIDAS

Son aquellas redes en las que las aristas entre los nodos son todas bidireccionales, es decir, no van en ningún sentido concreto. Por ejemplo, los amigos de Facebook y los contactos de linkedin (si tú eres mi contacto, yo soy tu contacto y viceversa).

REDES SOCIALES DIRIGIDAS

Son aquellas redes en las que las aristas entre los nodos tienen una dirección, es decir, no son necesariamente bidireccionales. Por ejemplo, en twitter, un usuario puede seguir a otro pero ese otro usuario no tiene obligación de seguirle de vuelta. Son dirigidas todas aquellas redes que impliquen alguna mención o enlace a otro individuo que no necesariamente tenga que ser de vuelta (retweets y comentarios, menciones…).

EL PESO DE LAS ARISTAS

En el Análisis de grafos en redes sociales, el peso de las aristas también es una medida importante. Cuanto más peso tenga una arista, significa que la relación entre dos nodos es más fuerte. Por ejemplo, un usuario que retuitea todo lo que postea su ídolo tendrá una arista más gruesa y con más peso que otro que solo le menciona de vez en cuando. Igualmente, en la vida real se podría traducir en que dos amigas que se consideran “mejores amigas” tendrían una arista más gruesa que dos personas que solo se ven de vez en cuando para ir juntas a conciertos.

CONOCER LA ESTRUCTURA DE LA RED

La forma de la red y cómo se interrelacionan sus componentes es importante para conocer mejor fenómenos sociales subyacentes (cómo se transmitirá la información…). Iremos viendo cómo en próximos artículos.

IDENTIFICAR ACTORES CLAVE

Analizar gráfos en redes sociales nos indica el poder social de cada individuo, es decir, su influencia y cómo se concentran las aristas en ciertos individuos. Para hacer estos análisis, tenemos las medidas de centralidad, que es lo que tocaremos en el próximo artículo.

MÁSTER EXPERTO BIG DATA ANALYTICS

Gracias al Master en Big Data Analytics 100% Online tendrás amplios conocimientos sobre las herramientas y técnicas analíticas necesarias para la modelización de los principales retos de negocio, con el fin de mejorar la toma de decisiones a través de los datos y el conocimiento.

chevron-down