El acierto de las encuestas lleva tiempo cuestionado. En las elecciones británicas, tras el fracaso en 2015 y en los referéndums del brexit y de la independencia de Escocia, la empresa encuestadora YouGov ha decidido modificar la metodología para la nueva cita con las urnas. A falta de conocer si el cambio podrá paliar los errores, existe una alternativa para paliar los patinazos de la demoscopia tradicional.
El periodista y consultor de comunicación Marc Argemí explica en el libro El Sentido del Rumor. Cuando las redes sociales ganan a las encuestas (Península, 2017) cómo consiguió adivinar el resultado de sucesivos comicios en España con un margen de error menor que el de los sondeos tradicionales. A través de la consultora de comunicación Sibilare que él mismo fundó puso en marcha un proyecto para observar de qué se habla en Twitter antes de unas elecciones.
Los retos no eran pocos. ¿Cómo luchar contra los usuarios falsos; cómo eliminar el ruido de los bots de los partidos; cómo hacer que una máquina sepa interpretar la ironía o el sentido de un comentario? Argemí cuenta a Vozpópuli las claves de sus sistema.
- Pregunta: ¿Cuál es la principal diferencia entre el método tradicional de las encuestas y el análisis de redes?
- Respuesta: Nuestra hipótesis es que la información de las redes sociales necesita ser interpretada en unos términos diferentes a los de la pregunta directa porque esta obtiene respuestas directas. Nosotros hacemos estimación de voto sin que en los mensajes que analizamos aparezca 'yo voy a votar a este partido'.
P.- Entonces, ¿cómo logran adivinar el sentido del voto?
R.- La expresión espontánea usa otras maneras de dar a entender que vas a votar a alguien. A base de analizar conversaciones, podemos inferir lo que la gente piensa a partir de con quién se relaciona; de los enlaces que comparte; y del sentimiento que expresa hacia las distintas formaciones.
P.- La muestra que se utiliza no tiene nada que ver con la de una encuesta tradicional.
R.- Nos planteamos escuchar a todo el mundo que quiera participar en una conversación abierta y pública. Hacemos un focus-group gigantesco, pero no estamos espiando ni recogemos mensajes de la gente que no sean públicos. Después, hacemos una cocina. El gran cuestionamiento que nos han hecho es que la muestra no es representativa. Pero para hacer estimación de voto creemos que no se le puede aplicar a una conversación digital los mismos criterios que a una encuesta. Lo más difícil con el algoritmo era que la máquina fuese capaz de distinguir Podemos como partido de una frase como 'podemos ir al bar'. Este análisis semántico es lo más complejo de todo.
P.- Han contrastado su sistema en sucesivas elecciones desde 2015, incluso con las generales.
R.- Empezamos en las municipales de Barcelona como un ejercicio periodístico para identificar tendencias y nos dimos cuenta de que se percibía quién sube y quién baja, aunque no hicimos estimación de voto. En las elecciones generales del 20D y del 26J estábamos ante eventos políticos en los que no había ruido, porque durante esos días no había nada más sobre la mesa. El 26J el volumen era 9 millones de mensajes procedentes de 700.000 usuarios, entre personas, partidos e instituciones. El 20D hicimos nuestra propia cocina y se acercó más que las encuestas. El 26J conseguimos lo que otros grupos todavía no han hecho: testar por segunda vez un sistema. Sólo lo hizo un indio, el que logró pronosticar la victoria de Trump.
P.- ¿Qué papel le depara a las encuestas tras los batacazos de los últimos tiempos?
R.- Yo creo que siguen sirviendo. Nuestro equipo también ha hecho encuesta tradicional porque tiene su sentido en la medida en que hay cosas que no se responden espontáneamente. El análisis de redes tiene mucho futuro no tanto por pronosticar mejor, sino por la capacidad de tomar el pulso a la opinión pública casi en directo. La diferencia es que los resultados de la encuesta no te dicen lo que pasará ni lo que está pasando; te dicen lo que pasaba en el momento en que se hizo la encuesta. El análisis de redes sí que te dice lo que está pasando.
El análisis de redes tiene mucho futuro no tanto por pronosticar mejor, sino por la capacidad de tomar el pulso a la opinión pública casi en directo
P.- Pero esa conversación puede ser adulterada por trolls, bots o el ruido de los usuarios.
R.- La gran ventaja del Big Data es que te da la posibilidad de detectar esos comportamientos. Nosotros hemos desarrollado algoritmos para detectar los bots de los partidos. Hemos desarrollado 'contralgoritmos' para que en análisis este tipo de actuaciones coordinadas de usuarios no nos afecten a los resultados. El reto es que va muy rápido y la capacidad que tienen los partidos de generar tácticas de propaganda en redes es espectacular.
P.- ¿En qué consiste el trabajo de análisis de los usuarios?
R.- Etiquetamos a usuarios que son de partidos (cuentas oficiales y líderes) y tenemos controlado a todo aquel usuario que interactúa con ellos. Los medios de comunicación son otro tipo de usuario muy importante para saber quién comparte su contenido. Eso sí, cuando hay veinte usuarios que retuitean en frecuencias sincronizadas los mensajes de un tercero, sabemos que no son espontáneos.
P.- Se suele decir que los partidos de izquierdas tienen 'ejércitos' desplegados en las redes. ¿En qué medida adultera eso los resultados de sus análisis?
R.- Podemos se moviliza bien. Pero la movilización de la derecha también es alta. La base de Izquierda Unida también está muy movilizada. El militante socialista en las últimas elecciones se movilizó menos que el de cualquier otro partido. Tuvo una conversación proporcionalmente más baja en volumen y el comportamiento fue más disciplinado. En cambio, en IU más que en Podemos, tienen gente que hacía una campaña muy adecuada a las redes; una estrategia más de cafetería. El análisis de Ciudadanos desvela lo indiscutible del candidato Albert Rivera. Sin embargo, Pedro Sánchez tuvo menos notoriedad entre los suyos. En las encuestas tradicionales se entendía por voto oculto cuando el entrevistado no se atrevía a decir a quién votaría porque le daba vergüenza. En la conversación en redes, el voto oculto se da más porque tu candidato no te genere entusiasmo.
El militante socialista en las últimas elecciones se movilizó menos que el de cualquier otro partido
P.- Imagino que aún queda mucho por aprender ¿Están más avanzados en Estados Unidos en este campo?
R.- Sí, sobre todo el mundo anglosajón y la India. Específicamente en el microtargeting, es decir, analizar la conversación en redes sociales cruzándola con otras fuentes de datos sobre la misma base electoral. Los partidos están dedicando grandes sumas de dinero a equipos de analistas cruzando estos datos para que cuando abras Facebook te llegue el anuncio que puede influir sobre tu voto o para que la propagan electoral que te envían a casa responda a la preocupación concreta que tienes en ese momento.