O Centro Singular de Investigación en Tecnoloxías Intelixentes da USC (Citius) e o Instituto da Lingua Galega deron a coñecer a creación de ‘Carballo’, o primeiro modelo de linguaxe a gran escala e de alta calidade desenvolvido en galego. Esta innovación permitirá avanzar na creación de ferramentas e aplicacións de Intelixencia Artificial generativa, como chatbots, tradutores, ou correctores automáticos, adaptadas especificamente á lingua galega.
‘Carballo’ destaca por ser “o maior modelo creado nunca para o galego”, servindo de base para construír aplicacións versátiles de alta calidade. Aínda que aínda require de pequenas adaptacións técnicas para optimizar a súa función de diálogo, apunta a ser unha ferramenta transformadora para o uso cotián do idioma.
O desenvolvemento deste modelo foi posible grazas aos proxectos ‘Nós’, apoiado pola Xunta de Galicia, e ‘Ilenia’, impulsado polo Ministerio para a Transformación Dixital. Baséase en ‘Flor1.3’, un modelo similar desenvolvido para o catalán, adaptando a súa tecnoloxía ao galego e integrando avanzadas capacidades de procesamento de linguaxe natural.
Carballo opera sobre unha arquitectura GPT de 1.300 millóns de parámetros, unha medida da súa complexidade e capacidade, que foi adestrada empregando ‘CorpusNós’, o maior corpus textual en galego até agora, composto por máis de 2.100 millóns de palabras.
Esta iniciativa contou co apoio de numerosas institucións e entidades, incluíndo medios de comunicación como Nós Diario e a CRTVG, editoriais como Galaxia, e diversas institucións públicas, o que resalta o carácter colaborativo e a importancia deste proxecto para a promoción e normalización do galego.
Con ‘Carballo’, o Citius e o Instituto da Lingua Galega estabelecen un novo marco no desenvolvemento tecnolóxico en linguas minorizadas, abrindo camiño para futuras innovacións que continúen enriquecendo e expandindo o uso do galego nas máis diversas áreas da sociedade moderna.