Modelo de linguagem IA em português Amália apresentado “este mês”

0
1

O ministro da Educação, Ciência e Inovação, Fernando Alexandre, anunciou esta segunda-feira, em Macau, que o modelo de linguagem de inteligência artificial em português Amália será apresentado “este mês”, sem dar mais detalhes sobre o que será apresentado no final de Junho.

“É um projecto com dois anos [e representa] um investimento de mais de cinco milhões de euros por parte do Estado português, com apoio do PRR [Plano de Recuperação e Resiliência]. O projecto vai ser apresentado até ao final do mês e tem tido resultados muito positivos”, indicou o governante em declarações à Lusa em Macau.

A apresentação pública do projecto não significa que o Amália estará amplamente disponível para a população. Como o PÚBLICO noticiou em Setembro do ano passado, o projecto que foi anunciado como um “ChatGPT português”, não terá caixa de mensagens para se conversar com o modelo de inteligência artificial. O Amália não contemplará um chat online ou uma aplicação onde qualquer pessoa possa fazer questões ou pedir informações – como muitos outros serviços internacionais têm, desde logo o ChatGPT, o Gemini, o Claude ou o Mistral, por exemplo.

“O modelo será utilizado em aplicações específicas da administração pública, não estando previsto pela equipa de desenvolvimento do modelo neste momento criar um serviço de acesso público semelhante às soluções comerciais existentes no mercado”, explicou na altura João Magalhães, investigador da Universidade Nova de Lisboa e coordenador do projecto que dará vida ao Amália. O modelo será aberto e disponibilizado publicamente, mas apenas quem tiver as competências informáticas e os recursos necessários para utilizar um modelo de inteligência artificial o conseguirá usar.

Esta realidade colide com as promessas feitas, num comunicado de final de Novembro de 2024, pelo então Ministério da Juventude e Modernização – responsável pelo Amália em conjunto com o Ministério da Educação, Ciência e Inovação. Dizia o comunicado: Amália, o “ChatGPT” português, não prevê qualquer chat para o público: “Todas as versões desenvolvidas serão disponibilizadas de forma gratuita e em open source [acesso aberto], para que seja utilizado por todos, incluindo academia, centros de investigação, entidades públicas, empresas e cidadãos.” Tal não se verifica.

Objectivo “ambicioso”, diz o ministro

Fernando Alexandre esteve presente esta segunda-feira em Macau na inauguração do 35.º Encontro da Associação das Universidades de Língua Portuguesa, que junta 36 reitores e presidentes de instituições de ensino superior dos países de língua portuguesa.

O Amália faz parte da Agenda Nacional de IA, e foi desenvolvido por uma equipa composta pela Universidade Nova de Lisboa, Instituto Superior Técnico, Universidade de Coimbra, Universidade do Porto, Universidade do Minho e a Fundação para a Ciência e Tecnologia. Segundo o ministro, o objectivo do projecto era oferecer “maior rigor em toda a dimensão da língua e cultura portuguesa”, com a ambição de ser “usado e melhorado por todos os países da lusofonia”. O projecto, no entanto, só contempla o português europeu.

“É o objectivo mais ambicioso, ter um modelo de linguagem em grande escala em língua portuguesa, que preserva especificidades linguísticas, aspectos culturais e contextuais do português de Portugal e das suas variantes, algo que os modelos de inteligência artificial em língua inglesa ou chinesa muitas vezes não têm, por não terem acesso aos mesmos dados”, apontou Fernando Alexandre.

Os dados utilizados são outra das questões esquecidas no projecto do Amália. Ao contrário de outros países, o modelo português não contempla qualquer pagamento aos jornais pelo uso do seu conteúdo. O Amália recorre ao património informativo do Arquivo.pt, uma hemeroteca digital da Fundação para a Ciência e a Tecnologia que preserva a informação de mais de 300 sites portugueses desde 2008 – entre os quais os jornais portugueses, como o PÚBLICO. Este é o grande bloco que alimenta o modelo de linguagem português.

Há duas questões em aberto, no entanto. Por um lado, não há qualquer compensação pelo recurso ao material dos jornais. Por outro lado, poderão estar em causa conteúdos cujos direitos de autor estão a ser violados. O consórcio responsável pelo modelo de inteligência artificial português já adiantou que há juristas a avaliar a legalidade desta utilização.

Este ano, o Ministério da Reforma do Estado classificou o modelo como “estratégico para Portugal”, anunciando que seria “orientado para o desenvolvimento de novos casos de uso, incluindo no sistema educativo, para apoiar alunos e professores com ferramentas adaptadas ao contexto português”.

Uma versão de teste do primeiro modelo de linguagem português foi concluída na primeira metade de 2025, e a versão final será agora apresentada este mês.

“O Amáliaserá um modelo aberto e gostaríamos de o promover em todo o espaço lusófono, bem como envolver outras instituições no seu aperfeiçoamento”, destacou Fernando Alexandre.

Segundo um relatório técnico da equipa de investigação e desenvolvimento a que agência Lusa teve acesso, o modelo teve o melhor desempenho em português europeu face a outros modelos de linguagem, algo que não surpreende dada a base de dados com que foi alimentada.

Disclaimer : This story is auto aggregated by a computer programme and has not been created or edited by DOWNTHENEWS. Publisher: feeds.feedburner.com