La analítica de redes nos enseña que el contenido que vemos en el feed aparece con sesgos producidos por algoritmos. Después de la desaparición de Edge Rank, el algoritmo antiguo de Facebook, la posibilidad de ver un post en nuestra página se complejizó tanto, que es prácticamente imposible predecir con exactitud qué posts veremos, a menos que las redes nos lo digan. Facebook y Twitter nos lanzan señales: si el post es de un seguidor; si viene apoyado por un hashtag, si está haciendo tendencia, si es una imagen novedosa, etc., su probabilidad de aparecer quizá sea más alta. Y aquí entramos en el problema de las encuestas de redes. Sus resultados son altamente sesgados.Este tema no es nuevo, pero lo considero vital en época electoral, por aquello de las manipulaciones basadas en tendencias científicamente irrelevantes. Si usted ve una encuesta de 10.000 participantes en donde alguien gana el 80%, puede estar seguro de que el simple hecho de que haya visto la encuesta está relacionado con su red de seguidores y preferencias. El extraño hashtag #UribistaSigueAUribista ha causado risas, odios y aprecios, pero aquí lo que nos interesa no es su contenido, sino su implicación en la analítica.
Se los pondré así. Imaginen que ustedes se van a lanzar a la política y deciden hacer una encuesta en su propia casa. Para eso invitan a todos sus amigos y familiares, quienes amablemente les dan una palmadita en el hombro y un (quizá falso) “cuenta conmigo”, mientras disfrutan la comida. Ahora todos los asistentes votan en una app. Salen los resultados de la encuesta y ustedes se jactan de quedar con algo así como el 80% de los votos digitales (parece que algunos los traicionaron). Lo paradójico es que para este voto, no dejaron entrar a personas de otras casas, que también van a salir a votar, sesgando el resultado para una atractiva conveniencia en la velada. Así son las encuestas de Twitter. Se parecen mucho a ir a pedirle halagos a amigos para evitar oír que alguien no los quiere.Ahora agréguenle otro elemento peor. Los bots, las bodegas y los desocupados que tienen una cuenta oficial, una para insultar y otra para su segunda persona, en palabras de S.Turkle, algo así como el abogángster nocturno digital. Ahora imaginen que votan con todos esos perfiles y que así como ustedes, otros también lo hacen. Luego, se apoyan de un hashtag que hace tendencia en chats que persiguen el mismo interés. Todos retwittean y adivinen a quién les llega el retweet: a los de pensamiento e intereses parecidos o quizá a gente que no los quiere, pero igual los sigue a ustedes o a temas de interés común y preferencia distinta. Esa inflación en la opinión poco confiable termina volviéndose un criterio de manipulación.
Surge la pregunta, si un medio reconocido hace la encuesta en Twitter, ¿no sería ésta más confiable? Esta encuesta podrá acaparar una mayor variedad de visiones políticas, pero de nuevo, no hay garantía que los votos se den por parte de individuos, sino por un número incontrolable de cuentas. El hecho de que algunos influencers, más de izquierda o de derecha, compartan la encuesta, puede sesgar el resultado debido al público que recibe lo que llamamos en analítica “impresiones”. Estas responden a la cantidad de veces que ustedes ven un contenido en su feed.Una encuesta seria con 600 individuos es más robusta que una encuesta en Twitter con 20.000. En el caso específico de Twitter hay factores, posiblemente cambiantes, que pueden violar los principios básicos del muestreo. Así hablemos de representatividad, esta palabra es algo inexacta. Lo verdaderamente importante es que la probabilidad de ocurrencia de un evento (e.g. sacar cualquier número lanzando un dado) sea igual a la de otros eventos. Si el dado, por ejemplo, está manipulado por algún mecanismo que eleve la probabilidad de sacar 6 contra las otras 5 opciones (ejemplo un imán en la superficie del 6), no podemos decir que hay equiprobabilidad, dicho en otras palabras, que todos los números del dado pueden ocurrir con la misma oportunidad.En un interesante estudio, Mellon & Prosser (2017) concluyen que ni las encuestas de Twitter ni las de Facebook representan la población de un país. Por ende, sacar conclusiones electorales de ahí puede ser algo inexacto. La comparación entre la muestra de redes sociales y la extraída por los autores, demuestra diferencias profundas en actitudes, demografía y comportamiento político. Así los usuarios en redes hablen más de política, paradójicamente tienen una menor probabilidad de votar. También mencionan el aporte de Mislove et al. (2011), quienes muestran que los usuarios de Twitter se concentran en áreas urbanas, especialmente en las de mayores ingresos y población más joven. Inferir de ahí que la votación en encuestas de redes será igual a la de verdad, puede generar sorpresas.
El hecho de que miles y miles de cuentas respondan la encuesta no la hace más robusta. Como lo dice el profesor R. Schnell de la Universidad Duisburg-Essen, lo verdaderamente importante es ver si cada individuo de un universo tiene una probabilidad calculable, mayor a cero, de entrar en una muestra. Esto no sucede con las muestras de Twitter. Peor aún, el famoso y poco usado método bola de nieve (cuando un encuestado lo ayuda a uno a conseguir más individuos para la encuesta), termina haciéndose realidad si yo le pido a mis seguidores que también la llenen, “por favor”. El hecho de no incluir otros individuos del universo de posibles votantes, hace que estas encuestas nos hablen de actividad, engagement, visibilidad de un público digital, pero no necesariamente de lo que va a suceder en las urnas. Es bueno y vital ser visible, pero no es decisivo. En redes, la pregunta es: ¿visible ante quién?Recomiendo que no nos dejemos deslumbrar ni manipular por pseudoencuestas que realmente le apuntan al engagement y a la trama para ir a impresionar a personas indecisas que se la pasan en las redes.