domingo, 8 de junio de 2014

Los humanos no reconocen a la mayoría de robots tuiteros

Estas cuentas automatizadas llegaron a conseguir más seguidores y repercusión dentro de un grupo que los tuiteros reales

THE PHYSICS ARXIV BLOG 

Si tienes una cuenta de Twitter, lo más probable es que tengas menos de 50 seguidores, y que sigas a menos de 50. Probablemente conozcas bien a muchas de estas personas, pero también puede que nunca hayas conocido a algunas de ellas.

He aquí una pregunta interesante: ¿cómo sabes que estos usuarios de Twitter son personas reales y no cuentas automatizadas, conocidas como bots (robots), creadas para publicar enlaces y mensajes con los que influir en tus opiniones?

Puede que pienses que los bots no son demasiado sofisticados, y que son fáciles de detectar. Y además sabes que Twitter vigila la Tuitosfera para buscar y eliminar las cuentas automatizadas que encuentre. En consecuencia, es poco probable que, sin saberlo, estés siguiendo a cuentas automatizadas, malintencionadas o no.

Si eres de los que mantienen esta opinión, quizá te apetezca echar un vistazo al trabajo de Carlos Freitas en la Universidad Federal de Minas Gerais (Brasil), que ha estudiado la facilidad con la que los bots sociales se infiltran en Twitter.

Sus resultados te van a sorprender. Aseguran que una proporción significativa de los bots sociales que han creado no sólo se infiltraron en grupos sociales en Twitter, sino que lograron ser influyentes entre ellos. Es más, Freitas y su equipo han identificado las características que hacen que los bots sociales tengan más probabilidades de éxito.

Comenzaron con la creación de 120 bots sociales, que después introdujeron en Twitter. Los bots tenían perfil, género masculino o femenino y algunos seguidores iniciales, algunos de los cuales eran bots también.

Los bots generan tuits ya sea volviendo a publicar mensajes que otros han publicado, o mediante la creación de sus propios tuits sintéticos utilizando un conjunto de reglas para escoger palabras comunes sobre un tema determinado y juntarlas en una frase.

A los bots también se les dio un nivel de actividad. Un nivel de actividad alto equivale a publicar al menos una vez cada hora y un nivel bajo equivale a hacerlo una vez cada dos horas (aunque ambos grupos son bastante activos en comparación con la mayoría de los seres humanos). Los bots también "dormían" entre las 22 y las 9 horas del Pacífico para simular el tiempo de inactividad de los usuarios humanos.

Por último, fueron diseñados para seguir a uno entre tres grupos distintos de seres humanos. El primero consistía en 200 personas seleccionadas al azar del feed de Twitter, el segundo fueron 200 personas que publican tuits con frecuencia sobre un tema específico, en este caso el desarrollo de software, y el grupo final consistió en 200 desarrolladores de software socialmente conectados entre sí en Twitter.

Después de soltar a los bots, la primera cuestión que Freitas quería averiguar era si sus ataques podrían evadir las defensas creadas por Twitter para evitar la publicación automatizada. "Durante los 30 días del experimento, 38 de los 120 bots sociales fueron suspendidos", afirman. En otras palabras, el 69% de los bots sociales esquivaron la detección.

Sin embargo, la cuestión más interesante era si los bots sociales podrían infiltrarse con éxito en los grupos sociales que iban a seguir. Y en ese aspecto los resultados son sorprendentes. A lo largo de la duración del experimento, los 120 bots sociales recibieron un total de 4.999 seguimientos de 1.952 usuarios diferentes. Y más del 20% de ellos consiguió más de 100 seguidores, una cantidad mayor a la que posee el 46% de los seres humanos en Twitter.

Freitas y su equipo también siguieron de cerca la puntuación Klout de cada uno de sus bots sociales para ver qué tal les iba. (Klout es un servicio en línea que mide la influencia de las cuentas de Twitter, dándoles una puntuación entre 0 y 100). "Encontramos que los bots sociales lograron puntuaciones de Klout en el mismo orden (o, a veces, incluso en un orden más alto) que varios académicos e investigadores de redes sociales de renombre", aseguran.

El equipo analizó los datos para averiguar qué factores contribuyeron al éxito de los bots. Como era de esperar, el nivel de actividad es importante y cuanto más activos fueron los bots, más popularidad alcanzaron en sus redes sociales. Eso era de esperar, ya que los bots más activos son más propensos a ser vistos por los demás (aunque también tienen más probabilidades de ser detectados por los mecanismos de defensa de Twitter).

Lo más sorprendente es que los bots sociales que generaron tuits sintéticos (en lugar de sólo volver a publicar mensajes) también consiguieron mejores resultados. Eso sugiere que los usuarios de Twitter son incapaces de distinguir entre mensajes generados por seres humanos y por bots. "Esto posiblemente sea debido a que una gran parte de los tuits en Twitter están escritos en un estilo informal, gramaticalmente incoherente, por lo que incluso los modelos estadísticos simples pueden producir tuits con una calidad similar a los que publican los seres humanos" sugieren Freitas y su equipo.

Los grupos a los que siguieron los bots sociales también tuvieron un efecto importante. El grupo de desarrolladores de software conectados socialmente produjo la menor cantidad de seguidores mientras que el grupo de desarrolladores de software seleccionados de forma aleatoria generó la cantidad más alta.

El género también resultó importante. Aunque los bots masculinos y femeninos fueron igualmente efectivos considerados en conjunto, los bots sociales femeninos fueron mucho más eficaces en la generación de seguidores entre el grupo de desarrolladores de software conectados socialmente. "Esto sugiere que el género de los bots sociales puede marcar una diferencia si los usuarios objetivo tienen prejuicios de género", afirma Freitas.

Es un trabajo interesante, ya que sugiere que la Tuitosfera podría ser más vulnerable a los ataques automatizados de lo que se pensaba.

El hallazgo podría tener implicaciones significativas para ciertos tipos de grupos en Twitter. En los últimos años han surgido una serie de servicios para medir el interés y la opinión entre usuarios de Twitter sobre una amplia variedad de temas, como la intención de voto, la opinión sobre un producto, los brotes de enfermedades, los desastres naturales, etcétera.

Lo preocupante es que se pudieran utilizar bots automatizados para influir significativamente en la opinión dentro de una o más de estas áreas. Por ejemplo, sería relativamente sencillo crear un bot que propagara rumores falsos sobre un candidato político e influir en una elección.

Así que el trabajo de Freitas y su equipo es una llamada de atención para Twitter. Si quiere evitar con éxito este tipo de ataques, tendrá que mejorar significativamente sus mecanismos de defensa. Y puesto que este trabajo revela qué hace que los bots tengan éxito, el equipo de investigación de Twitter cuenta con ventaja.

Habrá que aprender a detectar los bots sociales y a excluirlos sin excluir erróneamente a usuarios humanos durante el proceso. Y no va a ser una tarea fácil.
Sin embargo, se estima que hay unos 20 millones de cuentas de Twitter falsas ya establecidas, por lo que los investigadores de Twitter tienen muchos datos con los que trabajar.

Ref: arxiv.org/abs/1405.4927: Reverse Engineering Socialbot Infiltration Strategies in Twitter

No hay comentarios:

Publicar un comentario