Un proxecto de lingüística computacional do CITIC recibe financiamento do Consello Europeo de Investigación

martes, 6 de setembro do 2022 Redacción

David Villares, Elena Solera e Carlos Gómez

O Centro de Investigación en Tecnoloxías da Información e as Comunicacións (CITIC) da UDC dá un novo salto cualitativo na transferencia de tecnoloxía e no seu recoñecemento internacional. O proxecto Efficient Syntactic Analysis for Large-scale Sentiment Analysis (SALSA), dirixido polo IP do centro Carlos Gómez Rodríguez, acaba de ser seleccionado pola axencia de financiamento máis importante de Europa, o Consello Europeo de Investigación (ERC), na última convocatoria e financiado con 150.000 euros na categoría Proba de Concepto, a liña que dá cobertura a proxectos de innovación comercializables. SALSA é o único proxecto galego que recoñece o ERC nesta última convocatoria.

Ciencias e letras, da man para crear a linguaxe das TIC

O obxectivo de SALSA é crear algoritmos que traduzan a linguaxe natural, moitas veces complexa para as TIC, a contornas dixitais actuais propias da intelixencia artificial; e os códigos, ferramentas e programas informáticos propios da chamada lingüística computacional. A investigación das tecnoloxías da linguaxe é a clave desta disciplina científica que conxuga o traballo de tecnólogos como matemáticos, informáticos ou enxeñeiros, co de lingüistas e outros especialistas das humanidades. Trátase dun campo interdisciplinar que se ocupa do desenvolvemento de formalismos que describen o funcionamento da linguaxe natural para que poidan ser transformados e, por tanto, procesados, en programas executables por un dispositivo tecnolóxico.
Este programa é a continuación do tamén financiado pola ERC en 2016, finalizado recentemente, Fast Natural LanguageLarge-ScaleNLP (FASTPARSE), responsable, entre outros fitos, de deseñar o algoritmo capaz de axilizar a lectura do Quixote reducíndoa a tan só 20 segundos sen deteriorar a súa calidade conceptual. A finalidade deste innovador proxecto foi desenvolver novas técnicas para mellorar a velocidade dos analizadores sintácticos da linguaxe natural, facéndoos adecuados para o procesamento a escala web.

Software más accesible e económico

«Acelerar enormemente a análise das opinións presentes en textos da linguaxe natural para facelas máis fáciles de interpretar pola intelixencia artificial é o que buscamos con este proxecto», sinala Carlos Gómez, que lembra ademais que o principal obxectivo de SALSA é «democratizar a análise de datos de internet e redes sociais e transformalos en coñecemento para os tomadores de decisións, utilizando os modelos e algoritmos de análises sintácticas desenvolvidas no proxecto ERC Starting Grant FASTPARSE para crear sistemas de análises de sentimento que sexan á vez precisos e eficientes (ao empregar analizadores rápidos que poden procesar da orde de 1.000 oracións por segundo en hardware estándar de consumo)», apunta o investigador do CITIC.
SALSA seguirá un modelo de negocio de software de código aberto e pretende contribuír, en gran medida, á competitividade do mercado tecnolóxico da UE, «reducindo a súa dependencia do oligopolio de xigantes tecnolóxicos. Ademais de crear oportunidades para idiomas como o galego, non prioritarios para as multinacionais», lembra. A misión do CITIC con este e outros proxectos de similar alcance é demostrar que facer ciencia de vangarda en Galicia é posible. «Ciencia que sexa capaz de transferirse á sociedade e que, adicionalmente, se desenvolva desde o punto de vista industrial. A captación de proxectos de primeiro nivel como este ERC dan boa conta diso», asegura o investigador principal do CITIC.

PUBLICIDADE