A Meta AI, a área de inteligência artificial (IA) da dona do Facebook e do Instagram, criou um modelo de IA chamado NLLB – 200, que promete não deixar nenhum idioma para trás (No Language Left Behind, em inglês). No próprio nome do modelo, o 200 quer refletir já o número de idiomas possíveis de traduzir. A gigante das redes sociais, que ao longo dos últimos anos tem investido nesta área da tradução, refere que este “é o primeiro modelo” a conseguir traduzir estas duas centenas de idiomas diferentes, com “qualidade de última geração validada” por avaliações para cada um dos idiomas.

“É impressionante como a inteligência artificial está a melhorar todos os nossos serviços”, defende Mark Zuckerberg, o fundador e CEO da Meta. O multimilionário norte-americano nota que, deste total de 200 idiomas, “muitos deles não eram ainda compatíveis com os atuais sistemas de tradução”.

“Chamamos a este projeto ‘No Language Left Behind’, e as técnicas de IA que usamos estão a ajudar-nos a manter uma alta qualidade nas traduções de idiomas que são falados por milhares de milhões de pessoas em todo o mundo”, comenta Zuckerberg, citado num comunicado da companhia.

A Meta refere que até aqui, a ausência de ferramentas de tradução de alta qualidade deixava um grande número de utilizadores sem acesso a conteúdos digitais que pelo menos estivessem nos seus idiomas preferenciais ou nativos. Esta situação seria mais frequente entre os vários idiomas africanos e asiáticos, explica a Meta, no anúncio deste modelo.

PUB • CONTINUE A LER A SEGUIR

A companhia explica que este modelo irá suportar 55 idiomas africanos, prometendo traduções de elevada qualidade. Em comparação, a empresa refere que, até aqui, menos de 25 idiomas africanos eram suportados pelas atuais ferramentas de tradução.

Para garantir que as traduções feitas por este modelo mantêm um determinado nível de qualidade, a companhia criou ainda um conjunto de dados de avaliação, chamado FLORES-200. A Meta AI acrescenta que, a partir destes dados de avaliação, o novo modelo “ultrapassa a tecnologia de última geração numa média de 44%”.

Neste momento, a empresa explica que está a usar as aprendizagens e técnicas de elaboração de modelos baseadas neste projeto para conseguir melhorar e expandir as traduções que são feitas no Facebook e no Instagram. A empresa promete que, só nos próprios produtos da Meta, serão “mais de 25 mil milhões” as traduções que poderão ter os efeitos deste modelo.

A empresa vai fazer o “open-sourcing” deste modelo e partilhar uma série de ferramentas de investigação para permitir que outros investigadores, externos à Meta AI, possam contribuir para chegar a mais idiomas e a criar tecnologia mais inclusiva.

Além disso, a Meta firmou uma parceria com a Wikimedia Foundation, a organização sem fins lucrativos que aloja a Wikipédia, a enciclopédia de acesso livre. A ideia é que este modelo de tradução baseado em inteligência artificial possa contribuir para expandir as versões de diferentes artigos disponíveis na Wikipédia. Embora esta enciclopédia tenha milhões de artigos e esteja disponível em mais de 300 idiomas, muitas vezes a informação mais completa está disponível num conjunto restrito de linguagens, com destaque para o inglês.

E aqui a tecnológica recorre a um exemplo concreto. “Existem cerca de 3.260 artigos da Wikipédia em lingala, um idioma falado por 45 milhões de pessoas na República Democrática do Congo, na República do Congo, República Centro-Africana e no Sudão do Sul”, enquanto quem fala sueco – cerca de 10 milhões de pessoas – tem acesso a mais de 2,5 milhões de artigos na Wikipédia. Os editores da Wikipédia já estão a usar a tecnologia do NLLB-200 para traduzir artigos em mais de 20 idiomas que sejam considerados como tendo poucos recursos.