Na transição mental que tive que fazer para sobreviver entre a experiência física controlada de laboratório e a experiência não controlada com dados desestruturados, fui obrigado a entender a resposta ao problema do ovo e da galinha. A resposta correta é “não interessa.” A galinha e o ovo têm uma existência em simultâneo e um não existe sem o outro.
Porque é que isto implica uma transição mental? Porque nós, seres humanos, temos uma enorme dificuldade em entender “correlação”, isto é, a interdependência entre objetos e/ou conceitos. Até no problema do ovo e da galinha precisamos de encontrar uma causalidade, não nos chega a ideia de que os dois têm que existir em simultâneo. Mesmo dentro de domínios mais sofisticados como a Física, a questão da correlação é complicada de lidar. Conseguimos entender a gravidade como a atração devido à massa (não complicando), mas ninguém nos disse que não é o contrário, isto é, a massa é resultado da atração ou, ainda, que a massa e a atração são como o ovo e a galinha.
Outro exemplo? Quando vemos um partido com mais votos que outro, assumimos que esse partido é mais atraente que o outro e desenrolamos uma lista de razões para o justificar, quando ninguém nos disse que ser atrativo não é simplesmente ter mais votos. Parece estranho? Claro que sim, o nosso cérebro não foi treinado para ver um mundo cheio de relações entre os objetos porque evoluiu a partir de cérebros treinados para predadores, comida e parceiros para reprodução.
Esta conversa toda por ter sido desafiado por uma conhecida advogada e articulista (Eugénia Galvão Teles) para explicar, num artigo que todos entendam, os defeitos de qualquer “algoritmo censor”, como os usados pelas plataformas de redes sociais para limitar textos “menos adequados”. Espero ser bem-sucedido.
Vamos pensar em bicicletas. Se tomarmos o tamanho das rodas, se são de montanha, de estrada, de cidade, de adulto, de criança, cinzentas claras, cinzentas escuras, verdes, entre outras, podemos ver sem dificuldade que pensar em bicicletas pode gerar uns milhares valentes de hipóteses diferentes. Mas quando pedimos a uma criança para desenhar uma bicicleta, ela vai desenhar dois círculos como rodas, volante e selim. E nós vamos reconhecer o desenho como uma bicicleta. Isto resulta daquilo a que os cientistas de dados chamam de representação distribuída, que é uma forma de comprimir os milhares de possibilidades existentes na natureza para uma representação que contenha toda a informação que o nosso cérebro tomou como necessária: duas rodas, um volante e um assento. Isto é fantástico, milhares de possibilidades na natureza são reduzidas a umas quantas no interior do cérebro ou, pelo menos, numa arquitetura de neurónios como a do cérebro. E quando recebermos a imagem do automóvel, as rodas lá estão.
No entanto, experiências mostram diferenças grandes entre as bicicletas desenhadas por meninas ou desenhadas por rapazes. Estes investem no desenho do mecanismo de pedais e elas na decoração da bicicleta, com cestos, flores e fitas. Ou seja, para lá da compressão da informação da imagem, o cérebro junta mais coisas relacionadas com a pessoa que a vê e que não estão na tradução direta da imagem.
Agora vamos pensar em texto, algo que não existe na natureza, só no cérebro. Imaginem que, para construir um texto a partir do vocabulário todo, eu precisava de ir buscar uma palavra qualquer para meter à frente de outra palavra aleatoriamente e os meus estimados leitores, para lerem o que escrevi, precisavam de processar essa combinação. Como a língua portuguesa tem 100 mil palavras, combinar duas palavras daria 10 mil milhões de possibilidades. Quando formos combinar a terceira palavra, teríamos mil milhões de milhões de possibilidades. Assim que chegar ao fim desta linha, já não haveria número para exprimir o número de combinações para interpretarem. Agora imaginem a trabalheira que teríamos para comunicar este texto todo!
Vamos pensar ao contrário e ver cada palavra que está a ler. Se reparar, nenhuma delas faz sentido isoladamente. E se for ver o significado de uma palavra, aquilo que recebe em troca é um conjunto de outras palavras. Na verdade, uma palavra é aquilo que as outras palavras que a rodeiam dizem que é. Existe uma correlação natural entre as palavras todas de forma que nenhuma faz sentido sem as outras. Como o ovo e a galinha, mas com 100 mil objetos diferentes. Como o cérebro monta um universo em que, como cada palavra é representada pelas outras palavras, em vez de precisar de 100 mil objetos para ocupar o espaço da palavra que vou escrever de seguida, eu preciso de muito menos (a seguir a este “muito” não haveria muito mais palavras para aparecer para além do “menos”, certo? Seriam uma ou duas, mas não 100 mil!). Esta conjugação entre as 100 mil palavras e as interdependências entre elas gera um universo muito, mas muito mais pequeno, que aquele que seria gerado se as palavras aparecessem “ao calhas”. Diz-se que temos uma redução da dimensionalidade devido à interdependência entre as palavras.
Porque é que o texto é importante? Porque é uma forma de comunicação, e comunicação é como nós colocamos cá fora aquilo que o nosso cérebro guarda e processa. Mas aquilo para que o cérebro está preparado é para interpretar o universo que nos rodeia e aí, as coisas no mundo natural são, supostamente, independentes como as bicicletas. Para processar coisas independentes, o nosso cérebro vai usar representações comuns, como a cor ou a forma, para processar a informação de fora para dentro, reduzindo a dimensionalidade do mundo exterior para ser processada no interior. E isto é uma forma altamente eficiente de processar um universo de infinitas combinações possíveis.
Falando apenas como cientista de dados e físico teórico que sou, e não como neurocientista que não sou e que terá outra forma de dizer isto, à partida temos dois domínios muito diferentes: a representação interna no cérebro onde tudo está eficientemente correlacionado e o mundo natural exterior onde o nosso cérebro assume que tudo está descorrelacionado. O problema é quando o que nos vem do exterior já está correlacionado, ou comprimido, como quisermos encarar. Para isso o nosso cérebro precisa de estar muito treinado e precisa de aprendizagem especial, como ler.
Quando usamos a Matemática e a Física estamos a usar formas de ver o mundo exterior e, por isso, estas estão desenhadas para percecionar objetos independentes, como as bicicletas. A ciência, como a conhecemos, destina-se a traduzir aquilo que vemos, não a forma como aquilo que vemos se representa internamente na nossa cabeça. E tudo funcionaria perfeitamente, não se desse o caso de chegarmos a este ponto da História da Humanidade em que conseguimos ver muito para lá do nosso planeta, temos mais raciocínio que aquele que está dentro da nossa cabeça e temos mais braços que aqueles com que nascemos. Neste contexto, os senhores que gerem plataformas de redes sociais criaram “algoritmos censores”, que detetam textos e imagens que, de alguma forma, possam “violar padrões de civilidade”. Mas precisam de programar máquinas para isso.
Como podem calcular, tudo o que possa ser programado num computador vem do nosso cérebro e, mais especificamente, da forma como podemos produzir Matemática e Física para construir as máquinas. Aqui vamos lidar com um problema: se a Matemática e a Física vêm da forma como percecionamos o mundo, quando queremos tratar coisas como texto, que envolvem a interdependência entre os objetos e a representação interna no nosso cérebro, estamos perante uma grande limitação. Não que não consigamos construir algoritmos que conseguem mimetizar os nossos processos do cérebro, porque na verdade conseguimos – vejam o que fazem os vossos processadores de texto a encontrar sinónimos. O que não conseguimos é explicá-los tradicionalmente, porque a Física é do domínio natural e o texto do domínio da representação cerebral. Acabamos a ter de fazer uma escolha entre a explicação científica e a interpretação mecânica. Mas mais, ainda não sabemos como ligar coisas que não estão no mesmo domínio, seja natural ou representação.
Quando comecei há alguns anos a ter que lidar com texto foi exatamente por causa das redes sociais. A nossa missão era procurar menções negativas ou positivas a uma marca de uma empresa de telecomunicações e lembro-me da máquina nos ter avisado de uma frase dada como muito positiva que era “Olha, a minha net deixou de funcionar. Obrigado (marca)!!…”. Em termos de interpretação do texto pura e simples, a frase é positiva. Mas, toda o ser humano vai interpretá-la como negativa. Aliás, mais negativa que uma que não usasse ironia. O cérebro desta pessoa conjugou no mesmo universo onde tem o texto representado, outras perceções, de outros universos, para os quais a máquina não está (e não sabemos quando estará) pronta para o entender. Nós, humanos que lemos aquela frase, estamos a receber mais que a representação interna das palavras. Recebemos também a representação interna de outros sentimentos e que o nosso cérebro consegue interpretar como ironia, mas que a máquina ainda não consegue interpretar porque não sabe como fazer essa representação.
E como a ironia, falamos de inúmeras outras figuras de estilo que podemos associar a um conjunto de palavras sem que as máquinas consigam detetar porque não temos forma de as ensinar. Porquê? Porque ainda não conseguimos matematizar a tal representação interna e, enquanto não o soubermos, não conseguimos representar a ironia no mesmo espaço que as palavras, dado que, recordemos, a Matemática e a Física vêm da perceção do exterior, e a ironia da representação interior.
É por isto que os “algoritmos censores” falham de forma grotesca. Quando se usam figuras de estilo na comunicação nas redes sociais, a máquina não vai perceber e vai sinalizar um post ou uma imagem ofensiva, ou racista, ou ordinária, etc. Mais do que serem maus no seu propósito, podem até ter o efeito perverso de termos gerações a produzir texto em função daquilo que os algoritmos permitem (e não) de acordo com a representação que o texto tem nos nossos cérebros – “emburreceremos”. E isto não se resolve com a quantidade de texto com o qual treinamos as máquinas, mas com a Matemática e Física que temos que desenvolver para explicar a representação interna de interdependência.
A boa, ou má, notícia é que a Física Teórica nos dias que correm é feita quase exclusivamente deste estudo da interdependência entre os objetos, na tentativa de relacionar universos em inflação com a incerteza microscópica dos fenómenos quânticos, e cujo sucesso nos permite hoje estar a falar deste assunto por intermédio de uma rede de computadores. Um dos problemas mais antigos da Física é o chamado “problema de N-corpos quântico” que, tudo indica, se resolve da mesma forma que o nosso cérebro resolve o texto. E isto é ainda mais sensacional, porque significaria que a natureza teria o seu método de comprimir informação.
No fundo, por outras palavras, temos as pessoas mais inteligentes do mundo a resolver o problema do ovo e da galinha. Quando, e se, o resolvermos, abriremos a solução de uma quantidade enorme de problemas, que vão desde a inteligência artificial à explicação do universo, passando pelas finanças e economia (outro sistema em que tudo está correlacionado). Será uma era fantástica, se conseguirmos ultrapassar os algoritmos de censura.