Análisis de grafos en redes sociales: medidas de centralidad

Análisis de grafos en redes sociales - medidas de centralidad

Como ya hablamos en el artículo anterior, donde se comentaban los conceptos básicos del análisis de grafos en redes sociales, uno de los usos del análisis de grafos en redes sociales es identificar a los actores clave de la red. Es decir, a aquellos con mayor poder social. Estos actores centrales tienen más facilidad de acceso al resto de nodos y tienen más poder para influenciar en el flujo entre ellos, así que nos interesa tenerlos localizados.

Intuitivamente, podemos pensar que eso es fácil de detectar: con encontrar al que tenga más conexiones basta. No obstante, ¡la realidad es mucho más compleja!

Grado

Hace referencia a la cantidad de aristas que tiene un nodo. En una red no dirigida, cuantas más aristas tenga un nodo, más oportunidades de alcanzar a otros nodos. Es decir, tiene más oportunidades y alternativas para interactuar.

En redes dirigidas es algo más complejo, porque el grado se divide en:

Prestigio de entrada (in-degree), o Soporte

El concepto básico es que los actores que tienen gran prestigio de entrada son prominentes. Es decir, son importantes porque muchos actores intentan tener enlaces directos con ellos.

Prestigio de salida (out-degree) o Influencia.

El concepto básico es que los actores con gran prestigio de entrada son influyentes gracias a la teoría de la fortaleza de los lazos débiles. Esta teoría indica que las mejores oportunidades no suelen venir de las conexiones directas, sino de las conexiones lejanas (amigos de amigos, conceptos relacionados con los conceptos a los que enlaza una idea…).

Problemas con los conceptos de grado

El problema de este concepto de influencia dirigida es que no se aplica a todas las redes. Es muy efectivo a la hora de ver los intercambios comerciales, la búsqueda de empleo o la generación de oportunidades. Pero en otras redes como twitter o la red de enlaces entre webs, el concepto de Influencia se desmorona. Que un nodo tenga un alto grado de entrada sí que le convierte en prominente, porque mucha gente les referencia. No obstante, un nodo con alto grado de salida no tiene que ser necesariamente influyente.

Por ejemplo, pensemos en una web sin importancia, recién creada, que tiene cientos de enlaces. Tendrá un gran grado de salida, pero eso no la convierte en influyente. Igualmente, en una red de comentarios de twitter, que un usuario esté retuiteando, comentando o mencionando a una o varias cuentas en concreto (alto grado de salida) no es una medida de su influencia. Todo lo contrario, son los usuarios cuyos post reciben retweets, menciones o comentarios (alto grado de entrada) los que no solo son prominentes, sino que son influyentes, ya que sus contenidos se viralizan.

Otro  problema de las medidas de grado en general es que lo único que mide es la importancia con respecto a los nodos cercanos, sin importar las conexiones de dichos nodos entre sí y con el resto de la estructura de la red.

Centralidad de vector propio

Es una versión más elaborada de la Centralidad de grado. Esta medida se basa en que la centralidad de un nodo depende de la centralidad de sus vecinos (prominencia). Así, el poder y el status de un actor (ego) lo definimos de forma recursiva a partir del poder y el status de sus vecinos (alters). De esta forma, asume que no todas las conexiones tienen la misma importancia y tiene en cuenta la calidad de las conexiones, no la cantidad. Uno de estos algoritmos es el utilizado por el Pagerank de Google.

Cercanía

Hace referencia a la longitud del camino que tiene un nodo respecto al resto de nodos de la red. Cuanta mejor sea su medida de cercanía, más posibilidad tiene el nodo de interactuar de forma más directa con el resto de nodos de la red. En definitiva, esta medida da importancia a estar cerca del centro de la red.

Más medidas y problemas de la cercanía

En redes dirigidas, la cercanía se divide también en Cercanía de entrada y Cercanía de salida, con todas las limitaciones de las que he hablado antes al hablar del grado de entrada y de salida.

Otro inconveniente de la medida de cercanía es que por lo general se consideran solo aquellos actores desde los que un nodo puede ser alcanzado, no la red completa. Por eso, en redes complejas con varios clusters separados, podemos tener problemas.

Intermediación (Betweenness)

Hace referencia a hasta qué punto un nodo hace de enlace entre otros nodos de la red. Esto le da poder para conectar distintos actores… y para desconectarlos.

Con esta medida, el actor con una posición más intermedia está situado entre los caminos geodésicos de todos los demás. Vamos, que cuantos más nodos necesiten pasar por un nodo para llegar a otros nodos por el camino más corto, más central será.

Esto se traduce en un gran poder por parte de esos usuarios para asuntos tan clave como la viralización de los contenidos. Si un contenido tiene que pasar por un nodo para llegar a un grupo grande y este es el único camino, tendrá un gran poder en la red aunque tenga pocas aristas. Por ese poder de control de la información se les llama porteros (gatekeepers).

Problema de la intermediación

El mayor problema del algoritmo de intermediación es que solo tiene en cuenta los vínculos inmediatos y deja de lado los vínculos indirectos más globales.

Otras medidas de centralidad

Excentricidad

Es otra medida basada en distancias entre nodos, teniendo en cuenta la máxima distancia geodésica entre dos actores. Los nodos con más excentricidad son los más periféricos, mientras que los que tienen menos son los más centrales.

Coeficiente Local de Clustering

Se basa en el concepto de que las redes sociales son transitivas y que los amigos de un nodo suelen ser amigos entre sí también. Pero no todas las redes lo son, así que, para averiguar si son transitivas, nos basamos en el Coeficiente de Clustering que puede ser global (toda la red) o local (cada nodo).

Conclusión

Como vemos, la centralidad está lejos de ser fácil de calcular y es un poco relativa. Elegir la medida de centralidad más adecuada para analizar una red social depende de la propia estructura de la red y de los objetivos que tengamos para localizar a los actores clave. ¿Queremos a una persona a la que sigan muchas personas o queremos encontrar puertas a comunidades a las que actualmente no podamos llegar?

Por lo general, lo interesante a la hora de analizar una red social es aplicar varias medidas de centralidad y ver qué nos encontramos.


Déborah Fernández, responsable de marketing y comunicación de datahack

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *