TECNOLOGÍA
Siete herramientas que están analizando los sentimientos de un tuit
Estas herramientas interesan mucho al marketing de empresas y marcas, que, a tenor de las valoraciones de los usuarios, aspiran a consolidar su reputación, observar y superar a la competencia, conseguir seguidores o compradores y realizar predicciones financieras.
El análisis del sentimiento que brindan las herramientas computacionales de procesamiento del lenguaje natural e inteligencia artificial nos permite comprobar los sentimientos y emociones en los medios digitales. Actualmente, es posible destilar la polaridad e intensidad mediante la identificación de rasgos léxicos, iconográficos y estructurales.
Así, estas herramientas interesan mucho al marketing de empresas y marcas, que, a tenor de las valoraciones de los usuarios, aspiran a consolidar su reputación, observar y superar a la competencia, conseguir seguidores o compradores y realizar predicciones financieras. También a los políticos, por ejemplo, en campañas electorales.
Existen herramientas como Hootsuite, Repustate y Octoparse, por citar algunos ejemplos; también las hay específicas para Twitter, como Twitter Binder, cuyo análisis de etiquetas identifica influencers, permite crear tendencias, detectar las lenguas más utilizadas o los países que más tuitean.
Estas herramientas también son útiles para resolver problemas del mundo real: ciberseguridad, salud mental o educación a distancia. Se pueden usar para análisis específicos como, por ejemplo, las actitudes de los usuarios en Twitter ante la ortografía.
Sentimientos en Twitter
Existen herramientas variadas y de diferente complejidad para analizar el sentimiento en esta red. Por poner solo algunos ejemplos:
- Twitter Sentiment Analyzer es la herramienta prototípica que establece probabilidades y porcentajes de sentimientos positivo, negativo y neutro.
- TopicFlower, además, identifica sentimientos sin polaridad clara (mixtos), diferentes a los neutros, además de considerar los emojis. Esto último es un aspecto relevante, pues pueden decidir la polaridad de un texto y favorecer el sentimiento positivo.
- SentiStrenght estima la fuerza de sentimiento positivo y negativo en textos breves, con dos puntos fuertes de intensidad de sentimiento, de -1 (no negativo) a -5 (extremadamente negativo) y de 1 (no positivo) a 5 (extremadamente positivo). Lo justifica basándose en que la psicología ha demostrado que procesamos en paralelo ambos tipos de sentimientos. Advierte, eso sí, de que la detección no siempre es precisa, sino conjetural.
- BytesView y Komprehend incorporan, además de sentimientos, emociones: enfadado, miedo, feliz, triste. La primera añade las emociones amor y neutro; y la segunda, emocionado y aburrido.
- MeaningCloud ofrece un sentimiento global: el porcentaje de seguridad de que un texto sea positivo, negativo, etc., acuerdo o discrepancia en las polaridades, objetividad o subjetividad y presencia o ausencia de ironía.
- Natural Language Understanding (NLU) analiza texto, webs y redes sociales. Su escala de sentimientos va de -1 a 1, con valores negativos y positivos. Cuanto más cercano a -1 o a 1, más intenso es el sentimiento; incluye también palabras clave, categorías y jerarquías temáticas que clasifican el contenido, y análisis sintáctico y semántico.
- Por último, la reciente herramienta Lingmotif, desarrollada en la Universidad de Málaga, es la más completa: muestra sentimiento positivo, negativo o neutro (con colores verde, rojo y sin color, respectivamente), léxico utilizado, emojis, estructura de los mensajes, datos cuantitativos, visualización del perfil de sentimiento y un análisis cualitativo–semántico.
Tres tuits sobre ortografía
Vamos a comprobar la precisión en los resultados del análisis de algunos tuits sobre actitudes lingüísticas ante la ortografía. Empezaremos analizando este tuit:
Chicos con buena ortografía: 🤢🤮
— Marjhory Ramos (@MarjhoryRamosA) May 17, 2021
Chicos con mala ortografía: 😍🤤
Twitter Sentiment Analyzer establece que predomina el sentimiento positivo en un 76,18 % (adjudicando al neutro un 20,22 % y al negativo un 3,59 %). Con fuerza positiva lo considera también SentiStrenght, que atiende a las categorías gramaticales y la oración en su conjunto, aunque considere chicos un nombre propio.
Para NLU, presenta índices de relevancia positivos en su conjunto (0,8) y establece las siguientes jerarquías temáticas, en probabilidad decreciente: educación/aprendizaje de lenguas; películas/películas románticas; familia y relaciones/citas.
MeaningCloud estima el texto como positivo al 94 %, estableciendo que las polaridades del texto muestran desacuerdo. El texto es subjetivo y sin ironía. Komprehend lo considera igualmente, aunque en menor medida, positivo (en un 43,9 %), neutro (con un 34,1 %) y emocionalmente feliz (29,9 %).
Para Lingmotif, sin embargo, es neutro (50/100) y extremadamente intenso en sentimiento (100/100), quizá por la presencia de emojis.
Analizaremos ahora el siguiente tuit:
Suspender por faltas de ortografía es nuestra pasión @sofia_pv1 pic.twitter.com/rWuYwQaipY
— ♑ (@Glonavass) April 21, 2021
BytesView lo encuentra positivo (90,03 %), pero lo señala emocionalmente triste (51,13 %; neutro 41,08 %).
Para Komprehend es positivo (50,40 %; neutro 41,60 %; negativo 8 %), pero encuentra que las emociones que dominan son feliz 39,74 % y emocionado 36,85 %.
MeaningCloud concluye que el tuit es positivo con absoluta seguridad, con polaridades no discrepantes, siendo un texto objetivo y sin ironía.
Para TopicFlower, sin embargo, predomina el carácter negativo (49,64 %; positivo 21,32 %; neutro 21,31 %; mixto 7,72 %).
Del mismo modo, NLU establece como sentimiento general el negativo (-0,29).
Más contundente, Lingmotif lo estima extremadamente negativo (0/100) e intenso (100/100):
Puede verse que ninguna de las herramientas, ni siquiera MeaningCloud, han sido capaces de detectar la ironía que destila.
Por último, respecto al siguiente tuit:
SentiStrenght establece que tiene fuerza de sentimiento positiva 1 y negativa -2, arrojando un resultado general de 1, esto es, no positivo (dudamos, por tanto, de si lo considera neutral, con lo cual no interpreta con precisión el sentimiento negativo del tuit).
Para Komprehend, es negativo (84,8 %) con enfado como emoción preponderante (44,74 %). MeaningCloud estima que es negativo en un 92 %, sus polaridades muestran acuerdo, siendo un texto subjetivo y sin ironía.
Asimismo, NLU establece como sentimiento general el negativo (-0,74). Como también Lingmotif, que lo estima extremadamente negativo (0/100) y extremadamente intenso (100/100). Señala como ítems negativos burlar, no es gracioso; pero, por ejemplo, no detecta negatividad en clasista:
Limitaciones
En conclusión, si bien son abundantes los progresos, son patentes las limitaciones de estas herramientas, que se solventarán más pronto que tarde. En general resultan limitadas en las versiones gratuitas, pueden presentar problemas técnicos (Twitter Sentiment Analyzer sigue temporalmente no disponible); la mayoría están diseñadas solo para el inglés (MonkeyLearn, Sentigem, Sentiment Viz) o no disponen de todas las funcionalidades para el español, como NLU en los parámetros emoción o entidades, o Komprehend respecto a los criterios ofensivo/no ofensivo y sarcástico/no sarcástico.
Es evidente, por otro lado, la dificultad de dominar la programación en Atlas.ti, Python, Google Cloud Natural Language, Microsoft Azure Cognitive Services o R Studio. En cuestiones menos técnicas, continúan los problemas para detectar el lenguaje no literal, la intención del sentimiento (petición, pregunta, denuncia, etc.) o para mejorar el reconocimiento de las emociones.
Además, la idiosincrasia de Twitter (vehemencia emocional, coloquialidad, usuarios a menudo escondidos entre seudónimos y anonimato que se prestan al ingenio, humor, ambigüedad o ironía) complica algo más las cosas frente a Amazon o TripAdvisor, donde las opiniones de los usuarios son más contundentes.
A esto se añade que la polaridad no determina sin más la interpretación global de un texto; y que no siempre resulta fácil distinguir opinión de sentimiento (por ejemplo, en la etiqueta neutro), por lo que seguimos necesitando un enfoque híbrido que añada y afine el componente cualitativo para los tuits de difícil interpretación.
Por: Roberto Cuadros Muñoz
Profesor titular (Lengua Española), Universidad de Sevilla
Artículo publicado originalmente en The Conversation