A Google vai fazer uma pausa na ferramenta que permite gerar imagens de pessoas a partir de texto no modelo de inteligência artificial (IA) Gemini, após várias queixas sobre imprecisões nos resultados. Esta semana, a empresa já tinha reconhecido algumas falhas “na geração de imagens de figuras históricas”.
Os resultados do Gemini deram nas vistas quando o modelo de IA começou a apresentar apenas pessoas negras nos pedidos de monarcas britânicos ou soldados asiáticos na representação do exército alemão da Segunda Guerra Mundial.
Esta quinta-feira, a tecnológica explicou que “está a trabalhar para melhorar imediatamente os resultados da funcionalidade de geração de imagem”. “Enquanto fazemos isso, vamos fazer uma pausa na geração de imagem de pessoas e vamos relançar uma versão melhorada em breve.”
We're already working to address recent issues with Gemini's image generation feature. While we do this, we're going to pause the image generation of people and will re-release an improved version soon. https://t.co/SLxYPGoqOZ
— Google Communications (@Google_Comms) February 22, 2024
A ferramenta de geração de imagem do Gemini foi disponibilizada este mês. À medida que os utilizadores foram explorando as funcionalidades, as redes sociais encheram-se de exemplos de resultados imprecisos.
This is how Gemini thinks the US founding fathers looked like ???? pic.twitter.com/j849BzAgaM
— Dmitry Birulia — e/acc (@dbirulia) February 21, 2024
Embora a Google não tenha explicado a que se devem estes resultados do Gemini, o site The Verge nota que poderá ser um resultado excessivo de tentar corrigir algum preconceito ou tendência associada à IA, que habitualmente favorece as imagens de pessoas brancas. Neste caso, numa tentativa de aumentar a diversidade nos resultados, terão surgido as imprecisões.
Ao longo dos anos, a indústria tecnológica tem justificado a tendência dos modelos de IA para serem preconceituosos devido aos dados que estão na base de muitas destas investigações.
A inteligência artificial aprendeu a ser preconceituosa. Ainda vai a tempo de ser ética?
Numa mensagem na rede social X, antigo Twitter, Jack Krawczyk, que lidera o projeto Gemini na Google, explicou que tentaram gerar a ferramenta “refletindo a base de utilizadores a nível global” e que a empresa leva a “representatividade e o preconceito a sério”. Notou ainda que “os contextos históricos têm mais nuances e que esperam ajustar [o modelo] para acomodar isso”.
We are aware that Gemini is offering inaccuracies in some historical image generation depictions, and we are working to fix this immediately.
As part of our AI principles https://t.co/BK786xbkey, we design our image generation capabilities to reflect our global user base, and we…
— Jack Krawczyk (@JackK) February 21, 2024
A Google lançou o Gemini em dezembro de 2023, apresentando o modelo como “o maior e mais capaz” já lançado. Trata-se de um modelo multimodal, ou seja, que consegue gerar imagens, texto, vídeo e áudio.