Miguel Anxo Pérez Vila (CITIC), premiado polo seu traballo en IA para detectar depresión en redes sociais

luns, 6 de outubro do 2025 S. P.

A Sociedade Española para o Procesamento da Linguaxe Natural (SEPLN) concedeu a Miguel Anxo Pérez Vila o Premio á Mellor Tese Doutoral de 2024, un dos galardóns máis prestixiosos no ámbito do Procesamento da Linguaxe Natural (NLP) en España, en recoñecemento á súa excelencia científica e á súa relevancia social.
A investigación de Anxo Pérez, membro do Centro de Investigación en TIC (CITIC) da Universidade da Coruña, centro integrado na Rede CIGUS da Xunta de Galicia, é pioneira no uso de técnicas de Intelixencia Artificial, aprendizaxe automática e lingüística computacional para a detección da depresión a través da linguaxe en redes sociais.
A tese, dirixida polos investigadores Javier Parapar e Álvaro Barreiro, parte da evidencia de que as persoas con problemas de saúde mental adoitan amosar cambios na súa expresión. Con esta base e partindo tamén do enorme repositorio de linguaxe escrita que supoñen as redes sociais, o traballo de Anxo Pérez explora como aproveitar estas publicacións mediante modelos de IA adestrados con datos clínicos e sociais para identificar sinais de risco nos usuarios.
Segundo explicou o CITIC un dos aspectos máis innovadores da investigación é “a busca dunha maior transparencia nos sistemas de detección”. Así, “fronte a aproximacións anteriores máis opacas, a tese propón modelos explicables baseados en síntomas validados clinicamente, o que facilita que os resultados sexan transparentes e útiles para profesionais da saúde”.
O proxecto combina o deseño de novos algoritmos de estimación da gravidade da depresión coa creación de coleccións de datos específicas e coa exploración de grandes modelos de linguaxe (LLMs). Ademais, as súas achegas foron integradas nunha plataforma demostrativa que permite o seu uso por parte de profesionais clínicos, abrindo a porta a aplicacións prácticas no ámbito sanitario.
Ao longo do desenvolvemento da tese, Anxo Pérez publicou os resultados en congresos internacionais de referencia como ECIR, SIGIR ou EMNLP, así como en revistas como Artificial Intelligence in Medicine (AIM).
Entre as principais conclusións destacan varias achegas clave: os síntomas de depresión maniféstanse de maneira diferente na linguaxe, o que require modelos sensibles á súa natureza; as mensaxes en redes sociais conteñen sinais sutís que poden revelarse mediante técnicas de recuperación semántica; e a falta de datos adecuados motivou a creación de dous novos conxuntos de referencia (BDI-Sen e DepreSym). Así mesmo, a investigación subliña que, “aínda que os modelos de linguaxe de gran escala poden apoiar a tarefa de anotación, a supervisión humana segue sendo esencial”.
Para rematar, a colaboración con profesionais clínicos resultou fundamental para guiar a clasificación, a interpretación dos resultados e garantir a validez médica das conclusións.
Con este premio, a SEPLN pon en valor unha investigación que non só destaca pola súa orixinalidade e rigor metodolóxico, senón tamén polo seu impacto potencial na mellora da saúde mental e do benestar social.
Destacada participación do CITIC no congreso da SEPLN
No mesmo congreso da Sociedade Española para o Procesamento da Linguaxe Natural (SEPLN), no que foi galardoado Miguel Anxo Pérez Vila, tamén participou o investigador do CITIC Roi Santos Ríos. Na súa intervención presentou parte do seu traballo de tese Automatic Classification of the Economic Activity of a Company Using ML and DL Techniques, un traballo enmarcado no proxecto Ciencia e Enxeñaría de Datos para a Mellora da Función Estatística Oficial (CIDMEFEO) financiado polo Instituto Nacional de Estatística (INE). A súa investigación céntrase “a creación dun prototipo de clasificación automática de textos para identificar e etiquetar a actividade económica das empresas españolas a partir das descricións que elas mesmas proporcionan”.
O CITIC explicou que a liña de traballo de Roi Santos busca desenvolver un codificador automático baseado en técnicas de Machine Learning que permita axilizar e mellorar o tratamento de preguntas abertas en enquisas oficiais, en colaboración co INE”.
Con iso preténdese reducir tempos e custos, mellorar a homoxeneidade dos resultados e afrontar retos complexos como a variabilidade lingüística, a calidade desigual das respostas ou a realidade multilingüe de España.
“A nosa presenza no congreso non só estivo marcada por un premio de gran prestixio, senón tamén pola exposición de proxectos punteiros que reforzan o papel deste centro coruñés na aplicación da IA á mellora de procesos estatísticos e sociais”, concluíron fontes do CITIC.