Desmontando el origen ruso del hashtag #TrumpWon
No pensaba empezar aún la monitorización de las elecciones presidenciales de Estados Unidos pero me pasaron por DM un tuit que insinuaba la participación rusa en el trending topic de #TrumpWon
Me encontraba de vacaciones con Internet sólo en el móvil, aprovechando la visita nocturna a un bar de copas para conectarme con wifi. Cuando recibí el DM, intenté acceder a algún servidor de la universidad para bajarme los tuits de este hashtag pero el router debería filtrar los puertos para el ssh y no pude. No me quedaba otra opción que bajármelos con el portátil y así lo hice. El único límite fue la batería del portátil, que agoté mientras me tomaba un par de mojitos. La suerte estuvo de mi lado, normalmente el bar cierra en cuanto se queda sin parroquianos pero ese día había una fiesta de la colonia inglesa del lugar y aún seguían bebiendo y bailando cuando me fui a casa. Una vez allí, continué bajándome los datos con la internet del móvil, que consumió un giga en un santiamén.
Una vez que estuvieron los casi 320.000 tuits en mi ordenador me dispuse a averiguar qué había de cierto de la conspiración rusa analizando la localización de los usuarios, la propagación y las interacciones dinámicas. Esto es lo que encontré.
¿De dónde vinieron los tuits?
La localización de un usuario se puede obtener por la API de Twitter por dos vías: por la localización declarada en el perfil y por la geo-localización. Ambos datos son opcionales encontrándose un 65,45% de los tuits con localización declarada y un 0,03%con geo-localización (la mayoría de servicios de alerta de Trending Topics).
Existe una tercera vía que es la IP del usuario pero es un dato que maneja internamente Twitter, no transcendiendo en su API. Este dato lo utiliza para generar los trending topic locales.
Por tanto, para detectar usuarios rusos debería haber perfiles con localización declarada o geo-localización rusa o trending topics en Rusia. Ninguno de estos tres supuestos ocurrió y por tanto, no pudo ser medido por herramienta alguna. No obstante, un 34,55% de tuits están sin localizar o su localización podría ser falsa. Un análisis detallado de los 138.154 usuarios que encontré arrojaría más luz sobre quién promovió el hashtag. No dudo que haya manipulación en las redes, pero la gráfica de @DustinGiebel, no se pudo obtener con estos datos.
Creando una nube de palabras con las localizaciones declaradas quedan destacadas las ubicaciones más frecuentes. Como se puede ver en la siguiente gráfica los 5.000 primeros tuits, los iniciadores del hashtag, provenían fundamentalmente de Estados Unidos, de Florida, California, Connecticut y Texas.
Teniendo en cuenta el total de los tuits, aparecen más estados y ciudades pero siguen destacando Florida, California y Texas mientras Connecticut se desvanece.
Estos datos parecen confirmar que el hashtag se inició y desarrolló mayoritariamente en Estados Unidos. Esto concuerda con la visualización que hizo @AmberNiblock en la que la localización de tuits en un mapa los ubica mayoritariamente en USA.
¿Cómo se propagó?
La forma de propagación suministra indicios sobre si el hashtag fue inducido o se propagó de forma natural. Esto se aprecia porque en el primer caso el crecimiento es abrupto (caso de Desmontando a Ciudadanos) y el segundo porque es orgánico.
En la siguiente figura se muestra cómo evolucionaron el número de tuits y el alcance minuto a minuto. El alcance mide el número potencial de usuarios que pudieron ver el tuit y se calcula sumando el número de seguidores de los usuarios que publicaron un tuit en ese minuto. Ambas medidas están en escalas diferentes.
El arranque del hashtag muestra un desarrollo orgánico hasta que publicó un tuit @realDonaldTrump que favoreció a la propagación por aumentar el alcance. Lo mismo ocurrió cuando tuitearon @HuffingtonPost y @rickygervais.
Por la evolución del hashtag nada induce a pensar que hubiera una campaña organizada detrás.
¿Cómo se interaccionó?
Cuando se utiliza un hashtag no siempre es de apoyo, a veces se utiliza de rechazo. Para despejar la duda de si estaban todos de acuerdo o existió polémica no hay nada como un grafo de RTs. La retransmisión de mensajes se realiza entre grupos afines, por tanto, si tiene forma de esfera compacta implica que los grupos están estrechamente relacionados y posiblemente de acuerdo. Sin embargo, cuando aparecen dos polos opuestos y débilmente conectados la polémica está servida. El siguiente grafo muestra cómo se difundió el hashtag #TrumpWon entre los usuarios.
El grupo pro-Trump aparece subdividido en tres subgrupos. El que tiene color verde estuvo liderado por @realDonaldTrump. El de color azul claro fue encabezado por @scottpresler (Hi, I’m Scott. Your friendly, neighborhood Republican. #LGBTQ advocate. #GaysForTrump #LeadRight2016 #NeverHillary). El de color azul oscuro capitaneado por @always_trump (The MOST ACTIVE source for #Trump breaking news, poll #’s, speeches, videos, memes, & anything else you can imagine, w/ a dash of humor #Trump2016 #TrumpPence1) .
El grupo anti-Trump fue mucho más compacto, siendo @esheikh_ (Believe everything, Trust nothing. Devoted Trouble Maker. I have a right to be heard. No to Racism. #WithMalala) el usuario más retuiteado. El pequeño grupo de color amarillo está encabezado por @DustinGiebel, el autor del tuit sobre la conspiración rusa.
Si hubiera habido un grupo ruso fomentado el hashtag es muy posible que se hubiera detectado como grupo separado y no estaría tan integrado como los tres subgrupos pro-Trump, salvo que hubiera perfiles falsos que estuvieran bien conectados a los simpatizantes del candidato y eso no se hace en un día sino que requiere más tiempo.
Todo parece indicar que fueron los americanos los que tras el debate empezaron a utilizar el hashtag #TrumpWon, casi a partes iguales a favor y en contra. Si existiera una conspiración rusa, habría que detectarla identificando perfiles falsos.
Lo que queda claro es que la gráfica de @DustinGiebel no se pudo obtener con los datos que proporciona Twitter. Las noticias basadas en datos falsos no se sustentan por mucho tiempo.
2 Respuestas
[…] hay que tener en cuenta que, mediante análisis de redes, solo hay dos formas de establecerlo, como explica la profesora Mari Luz Congosto: o por el origen declarado en el perfil (suponiendo que sea cierto lo que se afirma) –el 65,4% de […]
[…] Igualment, quan hi ha personatges molt potents que polaritzen la resposta als medis, com per exemple, el president Trump, les piulades generen xarxes amb nuclis d’agrupacions de seguidors i detractors, molt separats ideològicament però que s’intercanvien múltiples missatges, com s’analitza en aquest altre blog. […]