A portuguesa Unbabel lançou o TowerLLM, um grande modelo de linguagem (LLM, na sigla em inglês), que foi concebido, treinado e otimizado para fazer tradução. Os LLM são modelos de inteligência artificial (IA), como o GPT-4o que alimenta o ChatGPT, e que foram treinados com enormes quantidades de dados para conseguir gerar informação para os utilizadores.

A Unbabel anuncia em comunicado que o TowerLLM, que foi gerado para ser multilíngue, “melhora significativamente a qualidade da tradução automática, reduzindo os erros e os custos”. A empresa menciona testes em que o modelo terá conseguido obter um desempenho acima dos modelos LLM GPT-3.5 e GPT-4o da OpenAI em tarefas ligadas à tradução. Também terá apresentado um “desempenho consistentemente superior” quando comparado com modelos da Google – não é especificado com qual versão de modelo de IA é que foi comparado.

OpenAI lança modelo GPT-4o que vai estar disponível gratuitamente. E ChatGPT ganha nova aplicação para computador

PUB • CONTINUE A LER A SEGUIR

O comunicado da Unbabel é acompanhado de alguns gráficos de comparação entre modelos, uma prática que se tornou habitual quando é revelada uma novidade deste género. Nestes exemplos foi aferido o desempenho do modelo em questões como a tradução entre pares (de inglês para português, para alemão, espanhol, francês, italiano ou coreano), tradução em vários domínios (financeiro, jurídico, médico e técnico) ou no processo de compreensão contextual.

Portuguesa Unbabel levanta financiamento de 21 milhões de dólares

A empresa explica que treinou o modelo com dados “públicos e internos” e que o TowerLLM foi “afinado com dados de tradução de elevada qualidade”, que foram filtrados e selecionados.

Na fase de lançamento, o modelo vai conseguir fazer a tradução automática em 18 pares de idiomas, conseguir reconhecer entidades nomeadas para localizar nomes, métricas e códigos (por exemplo, moedas, marcas ou localizações) e pós-edição automática para melhorar a tradução. Também é feita a promessa de correção de fonte para eliminar erros de gramática e ortografia antes da tradução. O modelo só vai estar disponível para clientes dos serviços da Unbabel.

Unbabel quer tecnologia de “telepatia” numa startup independente. Há investidores internacionais interessados

“Apesar das dúvidas que surgiram na indústria, o TowerLLM demonstra, claramente, que os LLM são a melhor solução para a tradução automática”, diz João Graça, cofundador e diretor de tecnologia da Unbabel. “Investimos anos no desenvolvimento de LLM e, por isso, não estamos surpreendidos por ver o TowerLLM superar o GPT-4o. Este é o segundo LLM multilíngue que lançamos depois do COMETKiwi e estamos apenas a começar.”

O COMETKiwi foi lançado pela Unbabel em setembro de 2023: é um modelo LLM de código aberto desenvolvido para conseguir prever a qualidade de tradução.