A Google vai fazer uma pausa na ferramenta que permite gerar imagens de pessoas a partir de texto no modelo de inteligência artificial (IA) Gemini, após várias queixas sobre imprecisões nos resultados. Esta semana, a empresa já tinha reconhecido algumas falhas “na geração de imagens de figuras históricas”.

Os resultados do Gemini deram nas vistas quando o modelo de IA começou a apresentar apenas pessoas negras nos pedidos de monarcas britânicos ou soldados asiáticos na representação do exército alemão da Segunda Guerra Mundial.

Esta quinta-feira, a tecnológica explicou que “está a trabalhar para melhorar imediatamente os resultados da funcionalidade de geração de imagem”. “Enquanto fazemos isso, vamos fazer uma pausa na geração de imagem de pessoas e vamos relançar uma versão melhorada em breve.”

A ferramenta de geração de imagem do Gemini foi disponibilizada este mês. À medida que os utilizadores foram explorando as funcionalidades, as redes sociais encheram-se de exemplos de resultados imprecisos.

PUB • CONTINUE A LER A SEGUIR

Embora a Google não tenha explicado a que se devem estes resultados do Gemini, o site The Verge nota que poderá ser um resultado excessivo de tentar corrigir algum preconceito ou tendência associada à IA, que habitualmente favorece as imagens de pessoas brancas. Neste caso, numa tentativa de aumentar a diversidade nos resultados, terão surgido as imprecisões.

Ao longo dos anos, a indústria tecnológica tem justificado a tendência dos modelos de IA para serem preconceituosos devido aos dados que estão na base de muitas destas investigações.

A inteligência artificial aprendeu a ser preconceituosa. Ainda vai a tempo de ser ética?

Numa mensagem na rede social X, antigo Twitter, Jack Krawczyk, que lidera o projeto Gemini na Google, explicou que tentaram gerar a ferramenta “refletindo a base de utilizadores a nível global” e que a empresa leva a “representatividade e o preconceito a sério”. Notou ainda que “os contextos históricos têm mais nuances e que esperam ajustar [o modelo] para acomodar isso”.

A Google lançou o Gemini em dezembro de 2023, apresentando o modelo como “o maior e mais capaz” já lançado. Trata-se de um modelo multimodal, ou seja, que consegue gerar imagens, texto, vídeo e áudio.

Google lança modelo de IA que diz ser “o maior e mais capaz” até agora. Bard vai ganhar poderes com Gemini