Deixem-me dirigir estas primeiras palavras às minhas leitoras do sexo feminino, correndo o risco de ser apedrejado e acusado de todo o tipo de crime moderno. Minha cara amiga, a razão pela qual o seu marido casou consigo foi nenhuma. Tratou-se de um mero acaso, podia ter sido qualquer outra. Aliás, como são todas iguais, parece-me um absurdo que o seu marido a tenha escolhido exatamente a si de entre as demais 5 milhões. E, agora que tenho a sua atenção e procura o objeto mais próximo para atirar ao computador, acrescento que as frases anteriores são um absurdo. Houve dezenas de razões, boas e más, pelas quais o seu marido a escolheu a si e vice-versa porque a sua atratividade é diferente das outras mulheres. Só coloquei as frases no feminino porque as naturais diferenças de género iriam provocar mais reação nas mulheres que nos homens.

O motivo pelo qual eu puxei este tema não foi para me meter na luta dos sexos e dos géneros, mas para introduzir a questão matemática/física relativa aos dados com que somos bombardeados todos os dias a justificar todo o tipo de disparate que se queira vender. Vamos então fazer a seguinte experiência, vamos meter um conjunto de pessoas, homens e mulheres, dentro de uma caixa. Pode ser um pequeno conjunto, uma dezena para cada lado escolhida perfeitamente ao acaso, mas todos com 18 anos para terem as hormonas aos gritos. O objetivo deste Big Brother imaginário é medir o número de relações sexuais por indivíduo, assumindo que não existem relações homossexuais, mais uma vez correndo o risco de estar a ofender outro princípio qualquer daqueles a que ainda não me habituei.

Neste enquadramento, aquilo que seria de esperar é que existam atratividades diferentes, isto é, há elementos mais atraentes que outros para a generalidade dos elementos do sexo oposto, ainda que essa atratividade possa mudar no tempo e nem sequer a saibamos definir à priori. Vamos aceitar este princípio para não cairmos, mais uma vez, no erro inicial, ou seja, o de que foi escolhida por acaso. Neste sentido, não será complicado dizer que os mais atraentes têm uma probabilidade maior de ter relações sexuais do que os menos atraentes. A questão que coloco é: não sabendo nós como definir essa atratividade, será que a podemos medir? Bem, a conclusão óbvia será que se medirmos o número de relações sexuais de cada elemento, então podemos chegar a uma medida da sua atratividade relativa. Não sabemos quão atraente é, só sabemos quão atraente é comparado com todos os outros dentro da caixa.

Até aqui a coisa é relativamente simples, certo? Vamos agora meter mais uma pessoa dentro da caixa, porque este jogo não é o ‘último a sair’, é o ‘próximo a entrar’. Sabemos quantas relações sexuais vai ter este novo elemento quando entrar? Deixem-me dar já a resposta antes de justificar: não. Todos os dados que obtivemos até à entrada do novo elemento, embora tenham uma expressão numérica porque existe um número finito de pessoas dentro da caixa, são irrelevantes. Sim, sabemos quantas relações sexuais teve cada elemento, mas sabemos isso naquele enquadramento em que ele tinha uma atratividade relativa aos outros que lá estavam. Sabemos em média quanto é que cada um teve e o desvio padrão, mas tudo dados erróneos e irrelevantes porque hoje, depois da entrada do novo elemento, o mundo é outro. Na nova ‘lotaria’ das escolhas, o cenário vai ser completamente diferente, ou porque entrou um sósia do Brad Pitt ou do Nosferatu. E, à medida que vão entrando novos elementos, mais irrelevantes se vão tornando os números do passado.

Mas isto não acontece apenas porque entra um novo elemento, acontece em qualquer circunstância onde a atratividade seja tema. A entrada do novo elemento só ajuda a perceber melhor o problema. Vamos fazer um esforço para entrar numa complexidade matemática ligeiramente mais elevada. Se eu sou mais atraente, eu vou fazer mais sexo que o meu vizinho. E vou fazer tanto mais, quanto mais atraente eu sou relativamente a ele. Como a medida da minha atratividade é quanto sexo eu faço, então sou cada vez mais atraente. Por isso, quanto mais o tempo passa, mais sexo faço relativamente ao meu vizinho (que se estiver a ler isto deve estar a pensar porque é que saiu ele na rifa). Ou seja, as medidas da média, conforme o tempo vai passando, cada vez mais se começam a parecer com aquela história das duas galinhas, se eu tiver duas e o leitor nenhuma, temos uma em média. Ou seja, na prática essas medidas significam zero!

O porquê desta explicação resulta de uma série de artigos que tenho vindo a ler nos media, muitos relacionados com os fenómenos económicos (se substituirmos sexo por trabalho, como devemos sempre fazer, vemos que a nossa história da caixa é igual), incluindo o chamado gender gap, ou a diferença de rendimentos entre homens e mulheres, onde os exercícios parecem ter sido montados para dar conclusões antes de se montarem as questões fundamentais da análise dos dados. Voltemos ao nosso exemplo da caixa, como sabemos que os homens que ganham mais, ganham mais por ser homens? Não sabemos, a única coisa que sabemos é que, tal como nas relações sexuais, há quem lhes queira pagar mais porque têm uma atratividade maior. Deve haver, até, diferenças de atratividade enormes entre os homens, sem incluir sequer as mulheres. Não há qualquer outra conclusão passível de ser tirada porque a ‘estatística’ que se tire dali é irrelevante, depende fundamentalmente do facto de, por acaso, ter sido objeto de medida, não porque exista alguma causalidade ou imposição. As mulheres ganham menos do que os homens? Não sei, sei que neste instante parecem ser menos atrativas economicamente do que os homens, mas nada garante que assim seja amanhã.

Há, no entanto, formas de perceber se a escolha dentro da caixa económica é livre, isto é, a distribuição de atratividades relativas é coerente, mas só isso. Do ponto de vista matemático, o problema termina aqui, pela imposição de uma não-conclusão. Não é que não tenhamos dados suficientes ou que tenham sido mal coletados. Pela natureza do problema, a conclusão é uma não-conclusão.

E daqui podemos passar, por exemplo, para as questões do comércio. Se queremos que sejam todos igualmente atrativos, porquê gastar dinheiro em publicidade? Ou para as questões da política, se queremos que os partidos tenham atratividades equivalentes, porque é que existem? Na verdade, à medida que descascamos as várias situações de relações humanas em que os jornais nos vão servindo números a que chamam de ‘estatística’, percebemos que muito poucas dessas situações se aplicam de facto à dita. São apenas números que nos podem dar pistas do passado, mas dificilmente nos dão pistas do presente e, certamente, não do futuro. Li recentemente um ilustre economista a explicar que a razão pela qual é um ilustre economista foi porque as matérias que gostava mais na vida eram matemática e história e que economia é uma mistura das duas. Pois, por aquilo que expliquei acima, não! Não é. Pode ter sido até ontem, isso pode, mas hoje e amanhã não é de certeza.

João Pires da Cruz é PhD em Física, Co-Fundador da Closer, Vice-Presidente da Data Science Portuguese. As opiniões expressas neste artigo são pessoais e vinculam apenas e somente o seu autor