A actualización do corpus do galego actual, en liña
mércores, 28 de marzo do 2007
A páxina corpus.cirp.es/corgaxml/ conta xa coa nova versión do corpus do galego actual, segundo vén de informar a Secretaría Xeral de Política Lingüística, que presentou o froito da actualización este mércores 28 en Santiago (na imaxe). Unha das grandes novidades desta anovada colección de documentos é que engade seis novos millóns de formas ortográficas ás que xa estaban dispoñibles, estando xa ó alcande da man dos internautas (de balde, previa solicitude) unha listaxe de 19,8 millóns de formas. Todas elas constitúen o miolo e o alicerce do CORGA, o Corpus de Referencia do Galego Actual desenvolvido no Centro Ramón Piñeiro baixo a dirección do mestre Guillermo Rojo.
O CORGA é un conxunto de diferentes tipos de textos (xornais, semanarios, revistas, ensaios e textos de ficción) que abrangue dende o ano 1975 até o día de hoxe e que fican codificados no estándar XML. Esta selección de documentos, que está especialmente dirixida a investigadores da lingua galega, pode ser empregado para facer procuras de palabras ou expresións, por tipos de texto, épocas ou temas. Segundo informa Política Lingüística, a nova versión “engade un novo sistema de consulta da nómina de autores e obras que permite buscar que obras ou autores están no corpus, saber que número de palabras totais e documentos corresponden á busca realizada ou que cantidade de palabras contén o CORGA nunha certa área temática, período de tempo, etc”.