La Universidad de Salamanca ha desarrollado un clasificador de tuits en tiempo real que funciona mediante aprendizaje automático y en la nube
FGUSAL/DICYT Las redes sociales se han convertido en un espacio primordial para el debate público y entre ellas destaca especialmente Twitter en el ámbito de la política. Algunas herramientas informáticas ya analizan tendencias y opiniones. La Universidad de Salamanca ha desarrollado AutoCop, un clasificador de mensajes que permite conocer en tiempo real las valoraciones positivas y negativas de los usuarios.
“Es un clasificador de tuits políticos en tiempo real que permite distinguir entre sentimientos positivos, neutros y negativos. Lo hemos desarrollado a partir de la técnica de análisis de sentimientos supervisado, que utiliza algoritmos de aprendizaje automático basado en inteligencia artificial”, explica a DiCYT Carlos Arcila Calderón, investigador del Departamento de Sociología y Comunicación de la Universidad de Salamanca.
En una primera fase, los investigadores adaptaron al castellano un código en el lenguaje de programación Python que ya existía en inglés. Para ello, entrenaron al sistema mediante un corpus que recogía ejemplos de tuits políticos en castellano clasificados de forma manual.
Ahora han dado un paso más al subir el clasificador a la nube con la plataforma de código abierto Apache Spark, un desarrollo que no existía en acceso libre en ningún idioma. De esta forma, podrán analizar una gran cantidad de datos desde cualquier parte de forma eficiente y segura.
El nuevo prototipo de AutoCop permitirá abordar problemas de análisis masivo de datos, es decir, lo que se conoce como Big Data. Como está alojado en la nube, supera las limitaciones del ordenador personal para poder procesar, gestionar y analizar en tiempo real los datos de Twitter, ya que se puede hacer de forma distribuida, entre muchos ordenadores, y de forma más rápida.
“No solo es más rápido, sino que es más estable porque no depende de las dificultades que podamos tener en casa o en la oficina, como puede ser que se vaya la luz o se caiga el ordenador, en la nube podemos distribuir y ejecutar todo el código con mucha estabilidad y velocidad”, comenta Arcila.
Para desarrollar esta segunda fase del proyecto, los investigadores del Observatorio de Contenidos Audiovisuales de la Universidad de Salamanca han participado en la convocatoria Prueba de Concepto de la Fundación General de la Universidad de Salamanca, dentro del programa TCUE de la Junta de Castilla y León cofinanciado con fondos FEDER.
Gráficos en tiempo real
“Una de las principales ventajas de AutoCop, tanto en su versión local como distribuida, es que podemos visualizar los sentimientos en tiempo real, es decir, contamos con gráficos que nos indican qué sentimiento existe ahora mismo hacia un determinado partido político o hacia una determinada idea”, destaca Arcila.
Dadas las características de este clasificador basado en aprendizaje automático, los creadores de AutoCop consideran que puede ser útil tanto para la investigación científica como para su transferencia tecnológica al mundo del periodismo, la consultoría política y los propios partidos, e incluso a otros sectores.
“La aplicación del instrumento de software y de ese know how que existe se puede dar en distintos sectores, en comunicación política, responsabilidad social corporativa, incluso marketing y salud pública”, opina Félix Ortega Mohedano, otro de los investigadores del proyecto. “El diálogo de lo que sucede hoy en día en la sociedad se da en los espacios de internet, en particular en Twitter y en otros espacios tenemos que investigar con metodologías científicas y de Big Data como AutoCop”, agrega.
A través de este proyecto, los conocimientos en materias como la política, la comunicación y la sociología se dan la mano con las tecnologías más avanzadas y la inteligencia artificial para conocer mejor la realidad.