El domingo 25 de mayo de 2014, fecha de las elecciones europeas que se erigieron como punto de partida del cambio en la política española que ha supuesto la irrupción de Podemos, mientras nadie parecía saber que el bipartidismo estaba a punto de sufrir su primer correctivo en años, Óscar Pazos escribía por la mañana en su blog geospa sus previsiones para estos comicios basándose en las tendencias de búsquedas en Google y aplicando una 'cocina' posterior, y que titulaba Google y el derrumbe del bipartidismo. Tres hostiazos a la vista. El resultado: Óscar vaticinó que Podemos obtendría un millón y medio de votos -tuvo más de 1.200.000 apoyos-, que el PSOE caería hasta los cuatro millones -obtuvo tres millones y medio-, Ciudadanos tendría medio millón de votantes o que IU subiría medio millón -creció 700.000 votos-.
El bloguero, que advierte en primer lugar a Vozpópuli que no es "especialista en encuestas electorales, prospectiva, en redes sociales ni en nada parecido", dice que tuvo suerte y se acercó bastante, "aunque con otras suposiciones que hice para el PP, no tanto" -otorgó al Partido Popular seis millones de votos y obtuvo cuatro-. Pero lo importante, añade, fue que "ya con los resultados electorales, comprobé que podía funcionar". Óscar, que dice que es un poco "ciber-utópico" y en 2012 se afilió al Partido Pirata, apunta que "una disputa electoral no deja de ser un juego cerrado y de aritmética sencillísima: hay que sacar más que los demás, a ser posible, la mitad más uno. Y alrededor de él gira una cantidad enorme de retórica e ideología", bajo este planteamiento, apunta, Google convierte palabras en números, en frecuencias relativas, y permite obtener series temporales de esas frecuencias, lo que le permite detectar el interés de la gente.
"Las redes actúan un poco como la televisión o las propias elecciones: hacen visible lo que ocurre", señala el autor de un blog que realiza trakings diarios para saber cómo se sitúan los partidos en las redes y que seguirá publicándolos "desde Holanda" ahora que los sondeos para el 20D están prohibidos.
Este sistema, que cada vez está más presente en las estimaciones de los medios y los analistas, parece haber llegado para quedarse, y así lo afirma Óscar, que está convencido de que las empresas de demoscopia "no tardarán en utilizar" las búsquedas en internet. "Google no da acceso público a los datos originales, por ejemplo, el reparto regional, pero estoy seguro de que en cuanto se pongan a ello y los faciliten, barren con las encuestas tradicionales".
- ¿Cómo surgió tu interés por el impacto de las redes sociales en la política?
Todo esto surgió un poco por casualidad, y me interesa, además de porque me divierte, porque me permite investigar las relaciones entre las lógicas del número y las del discurso, que es un libro que estoy trabajando. Una disputa electoral no deja de ser un juego cerrado y de aritmética sencillísima: hay que sacar más que los demás, a ser posible, la mitad más uno. Y alrededor de él gira una cantidad enorme de retórica e ideología. Google Trends hace algo parecido: convierte palabras en números, en frecuencias relativas, y permite obtener series temporales de esas frecuencias. Es buenísimo para detectar y cuantificar cambios del interés público, como por ejemplo, Podemos.
Lo que yo hago es rastrear las preferencias políticas de los usuarios a través de las búsquedas agregadas que da Google Trends, que, como administrador, es neutral políticamente
Pensándolo un poco, puede que tenga algo de ciber-utópico. En 2012, por primera y única vez en mi vida me afilié a un partido político y fue al Partido Pirata, que se estaba constituyendo a la vez que se desintegraba. Toda la actividad del partido se realizaba a través de internet, pero algunos responsables y de los afiliados más activos eran genuinos Trolls, gente que disfrutaba saboteando cualquier iniciativa y además parecían no tener otra cosa que hacer en la vida. Te puedes imaginar el resultado. La experiencia fue a la vez desastrosa y muy instructiva. Una red social son personas y código, y el desarrollo y control de código es cosa de especialistas, pero si éstos interfieren demasiado en la construcción de la propia red social, por ejemplo, limitando el acceso, o participando en las elecciones, la red se rompe. No es de extrañar que el experimento del Partido Pirata saliera tan mal ni que los partidos tradicionales sean incapaces de adaptarse a este cambio que exige internet. En definitiva, yo creo que los partidos deben convertirse en herramientas de participación pública y delegar la dirección ideológica en el público.
- ¿Cómo funcionan las redes en este campo?
Lo que yo hago es rastrear las preferencias políticas de los usuarios de Google a través de las búsquedas agregadas que proporciona de Google Trends, que, como administrador, es neutral políticamente.
Lo sorprendente de verdad es lo bien que funciona, lo sencillo que resulta. Todo lo que hago son correlaciones simples, y resultan robustísimas porque las frecuencias relativas de las búsquedas son consistentes independientemente de que los datos sean medias horarias o semanales.
La mecánica que sigo la explico en las entradas, pero básicamente es:
- Google Trends te da las frecuencias relativas (puntuando de 0 a 100) con que la gente busca un determinado término en un periodo temporal. Puedes comparar hasta 5 palabras a la vez.
- Lo que yo hice fue comparar, para 11/2011 hasta el presente con periodo semanal, las frecuencias con que se buscaron los cinco partidos, así: pp, psoe, ciudadanos+ciutadans (sin acento; mayúsculas no importan), iu, podemos.
- Calculé la proporción (peso relativo) con que cada partido fue buscado cada semana respecto de los 5, normalizando el total de los 5 partidos a 100.
- Calculé la correlación simple de esos datos con los barómetros trimestrales del CIS más los resultados de elecciones generales de 2011, europeas de 2014 y autonómicas de 2015.
- (Para las europeas, como todavía no tenía suficientes barómetros CIS para una correlación fiable, hice una estimación un poco a ojímetro y fallé, claro, pero no demasiado; también en las andaluzas).
- Calculo las estimaciones de voto para el periodo que quiera a partir de las búsquedas con la ecuación de correlación.
Sobrevaloré la estimación del PP por el pico de atención que generaron las meteduras de pata del candidato Cañete en campaña
- En las pasadas europeas tu blog predijo el auge de Podemos gracias a las búsquedas en Google. En esa estimación acertaste bastantes resultados, aunque erraste algunos datos como el del PP, ¿cómo realizaste esa estimación?
Fue un primer intento, pero en lo fundamental lo hice de modo similar a como lo hago ahora, comparando el interés público por Podemos y el resto de partidos que se manifestaba a través de las búsquedas en Google con los resultados electorales y recalculando las previsiones electorales a partir de los datos de Google Trends. Entonces no había datos electorales de Podemos y usé la relación entre búsquedas y resultados de UPyD en 2009. Tuve suerte y me acerqué bastante, aunque con otras suposiciones que hice para el PP no tanto, pero lo importante fue que, ya con los resultados electorales, comprobé que podía funcionar.
- En las europeas realizaste esta estimación con las cuatro semanas previas a los comicios. ¿Son menos fiables los datos a lo largo del año?
Hice la estimación la misma mañana de las elecciones, a partir de la media de las últimas cuatro semanas. Si el periodo de promedio es demasiado largo, diluyes la información de los últimos días antes de la votación, que pueden ser importantes, aunque si es demasiado corto te expones a sobrevalorar los sesgos del momento. Cuatro semanas me pareció un buen compromiso. Aun así, sobrevaloré la estimación del PP por el pico de atención que generaron las meteduras de pata del candidato Cañete en campaña.
En cualquier caso, sea mi aproximación más o menos ingeniosa o acertada, lo cierto es que con pequeños ajustes y unas correlaciones simples, nada sofisticado, los resultados están en el rango de error de las encuestas que se publican empleando un aparato estadístico mucho más elaborado y una toma de datos carísima. Y la razón de que pueda hacerlo son los datos de Google Trends. Son datos de trazo grueso, en una escala relativa de 1 a 100, pero son increíblemente consistentes. Da igual que use una serie de cuatro años con datos semanales o una serie de una semana con datos horarios, las relaciones entre partidos se mantienen igual de robustas. Es sorprendente.
- ¿Crees que se puede hacer una estimación para las generales a través de las búsquedas en Google o el auge de las redes hace que todo se vuelva más complicado?
Ahora actualizo la estimación cada día de campaña y los resultados están en el rango de las encuestas publicadas. Ya veremos por cuánto me equivoco el próximo día 20, pero los resultados día a día varían muy poco, incluso cuando las búsquedas se multiplican por cinco o por diez, como ocurrió el pasado día 7 en el debate a cuatro. Sería estupendo contrastar los resultados con otros datos de Facebook o Twitter, pero por el momento me ciño a Google.
Ya veremos por cuánto me equivoco el próximo día 20, pero los resultados día a día varían muy poco, incluso cuando las búsquedas se multiplican por cinco o por diez
- ¿Cómo afectan las redes a la campaña electoral?
Pues mejor se lo preguntas a los que las hacen, pero yo creo que se vuelven locos. Una cosa más de la que ocuparse. De cualquier modo, hayan sido las redes o la decadencia del PSOE y el PP, se acabaron los mítines en las plazas de toros.
Por otro lado, creo que las redes actúan un poco como la televisión o las propias elecciones: hacen visible lo que ocurre, o como se dice de los sacramentos, otorgan carácter. Las redes evidencian un estado de opinión, lo hacen tangible, cierto. Cuando yo era joven veías una película en televisión o una noticia de noche y tenías que esperar al día siguiente para comprobar si tus amigos o cualquiera la había visto también y contrastar con los demás la impresión que te había causado; en cualquier caso, la idea que te hacías de la repercusión de esa noticia era muy limitada, siempre dependiente de que la publicasen o no en prensa o en televisión. Ahora las redes te dan de inmediato esa medida, sin necesidad de esperar ni posibilidad de censura o filtro, o al menos con menos censura.
- ¿Cómo crees que evolucionará el uso de las redes para estimar los resultados?
Estoy convencido de que las empresas de demoscopia no tardarán en utilizarlas. De hecho me parece que ya están tardando.
Google no da acceso público a los datos originales, por ejemplo, el reparto regional, pero estoy seguro de que en cuanto se pongan a ello y los faciliten, barren con las encuestas tradicionales. Se seguirán haciendo un tiempo como método de contraste, pero yo creo que en las próximas generales, todas las empresas habrán incorporado los datos de Google y otros big data como base a sus pronósticos.
- Desde las europeas el interés por las búsquedas en Google y las redes sociales en general se ha incrementado. ¿Crees que los medios usan con coherencia este campo o has visto algunos disparates?
Pues por el momento me parece que como fuente de información los medios usan las redes de un modo muy superficial, en muchos casos anecdótico, todo lo más para reproducir chistes de twitter o para informar de la tendencia del momento. En cuanto a los disparates, pues veo más en la política, creo que ahí los tienen todos.