Se pensa que o jogo do xadrez é complexo então fique sabendo que é um passatempo infantil comparado com o antiquíssimo jogo oriental “Go”. Enquanto num tabuleiro de xadrez a dimensão do espaço de possibilidades é da ordem de 10123, no Go é da ordem de 10320, um número que excede a soma de todos os átomos no universo observável. Outra forma de comparar o grau de complexidade dos dois jogos é pelo numero de níveis diferentes de sofisticação dos jogadores (os designados ratings ELO): no xadrez, do principiante até ao mestre internacional, existe um fosso correspondente a 15 patamares de qualidade ou de sofisticação de jogo (jogadores de um patamar de qualidade ganham a adversários do patamar imediatamente inferior 2/3 dos jogos disputados); no Go, existem 40.
Vem isto a propósito da evolução da inteligência artificial (IA). Em 1997 o supercomputador DeepBlue bateu Garry Kasparov, na altura o melhor jogador de xadrez do mundo. Todavia, foram precisas mais duas décadas de evolução da IA para uma máquina conseguir bater o melhor jogador de Go do mundo: em 2016 o sistema AlphaGo, desenvolvido pela Google-Deep Mind, venceu 3 das 4 partidas disputadas contra Lee Sedol, campeão do mundo da modalidade por 18 vezes.
O Deep-Blue bateu Kasparov apenas com base na força bruta de computação, isto é, na capacidade sobre-humana do computador em avaliar e comparar, quase instantaneamente, milhões de sequências alternativas de jogadas e contra jogadas. O AlphaGo, em contraste, representa uma nova geração da IA, suportada em “machine learning”, isto é, em máquinas que “aprendem” a partir de grandes bases de dados. Um exemplo são a tecnologias de reconhecimento facial que aprendem a partir de grandes bancos imagens – incluindo imagens de rostos humanos mas não só – e se aperfeiçoam à medida que mais imagens são adicionadas à base de dados.
No caso do AlphaGo , o algoritmo foi alimentado com o histórico de milhares de jogos disputados por grandes mestres. Numa primeira fase o AlphaGo procurou, a partir deste arquivo de dados, encontrar uma síntese do conhecimento existente entre os melhores jogadores humanos. Numa segunda fase, o AlphaGo, depois de ter absorvido o estado-da-arte entre humanos, começou a jogar contra ele próprio, refinando as suas táticas e estratégias e ficando mais forte de jogo para jogo. Pode dizer-se que o AlphaGo atingiu uma qualidade de jogo sobre-humana: com base nos ensinamentos dos melhores jogadores humanos, a máquina encontrou margem para melhorar e, assim, ultrapassar os seus professores. Contudo, como o ponto de partida foram os jogos dos grandes mestres, o estilo de jogo do algoritmo manteve um traço humano. Um grande mestre, olhando para uma jogada do AlphaGo, apesar de reconhecer que tal jogada não lhe passaria pela cabeça, consegue perceber a sua lógica.
Chegámos por fim ao AlphGoZero. Muito recentemente, a mesma empresa que desenvolveu o AlphaGo revelou que uma nova geração do sistema, designada AlphaGoZero, bateu a o AlphaGo por 100 jogos a zero. A principal novidade da nova geração consiste em prescindir totalmente do conhecimento humano e aprender exclusivamente de uma forma autónoma (daí a sufixo “zero”). O AlphaGoZero começou com uma versão zero que seleciona jogadas de uma forma puramente aleatória no espaço dos movimentos permitidos pelo jogo. Na primeira partida, jogando contra a versão zero, o algoritmo detetou alguns princípios simples de jogo que lhe permitiram ganhar à versão zero; esses princípios foram incorporados numa nova versão do algoritmo, designada versão um; na segunda partida, disputada agora contra a versão um, detetou principios mais avançados que lhe permitiram ganhar à versão um, dando origem à versão dois. E assim sucessivamente. Ao fim de 3,9 milhões de partidas jogadas contra versões cada vez mais sofisticadas de si próprio, o AlphaGoZero atingiu o nível que lhe permitiu ganhar 100 a zero ao AlphaGo. Analisando as jogadas selecionadas pelo AlphaGoZero, jogadores profissionais de topo revelarem-se incapazes de discernir a lógica subjacente a muitas delas. Se o AlphaGo era sobre-humano, o AlphaGoZero é extra-humano.
Este resultado deve deixar-nos perplexos. Ao libertar o algoritmo da bagagem histórica da sabedoria humana, deu-se ao AlphaGoZero rédea solta para explorar o espaço do conhecimento sem o condicionar pela nossa inteligência biológica: o resultado foram estratégias de jogo imbatíveis mas impenetráveis à compreensão humana. A sabedoria dos melhores jogadores acumulada ao longo de séculos não ajudou a máquina a ir mais longe, ao dar-lhe um ponto de partida favorável; pelo contrário, estorvou a aquisição de conhecimento verdadeiramente novo.
Figuras de proa da revolução digital e tecnológica começam a ficar preocupados com as novas capacidades da IA. Elon Musk afirmou mesmo que a IA coloca hoje maiores riscos do que o arsenal atómico da Coreia do Norte. A revista Vanity Fair conta a história de um investidor na Google-Deep Mind, que ao sair de uma reunião com o CEO da empresa, Demis Hassabis, lhe disse na cara que o deveria matar ali mesmo pois esta era a última oportunidade de salvar a humanidade. Esperemos que o investidor esteja enganado pois Demis Hassabis continua de boa saúde.
Professor Catedrático da Católica Lisbon School of Business & Economics