Como terá sido o dia em que Albert Einstein se viu confrontado com as consequências da sua teoria geral da relatividade? Como imaginaria ele que fosse o aspeto de um buraco negro? As pessoas que estão familiarizadas com o método científico, certamente criam empatia com tal momento de estranheza. Seria prudente, de facto, presumir que havia aspetos para as quais a teoria merecia reflexão. Estes estranhos corpos celestes, infinitamente densos, poderiam resumir-se a um artifício matemático passível de revisão. Mais frequentemente, quando um cientista se depara com uma conclusão tão inusitada, não se espantará, mais tarde, se esta se demonstrar inválida. Isto, precisamente, por estarmos a ultrapassar os limites de aplicação da teoria, ou simplesmente pelo confronto com os dados. Em casos raros, no entanto, assistimos a uma revolução no entendimento da realidade que nos rodeia – neste caso perante a existência de buracos negros.

Através dos avanços computacionais ocorridos nas últimas décadas, e com o progresso da ciência de dados propriamente dita, pudemos imaginar com grande exatidão como se aparenta este fenómeno.  Exemplo disso é o filme Interstellar, de Christopher Nolan, que com o auxílio das simulações realizadas pelo físico Kip Thorne, nos surpreendeu com magníficas imagens de um corpo celeste jamais visto. Muito progredimos desde o tempo em que, sobretudo com lápis e papel, se procurava a compreensão de um universo que não era explicado pela física Newtoniana. O mundo mudou. A imagem romântica que associamos a Einstein, de um génio da física que sozinho criava teorias brilhantes, já nessa altura não correspondia de todo à verdade. A maior democratização do conhecimento e a interação das organizações científicas culminou na criação de equipas interdisciplinares e internacionais que impulsionaram a velocidade das descobertas.

Não sendo um empreendimento individual, mas requerendo o envolvimento de centenas de pessoas, equipamentos e saberes distintos, eis que uma jovem mulher, Katie Bouman, se destaca na liderança de uma equipa que conseguiu a primeira visualização de um buraco negro, baseada em dados recolhidos por uma investigação empírica. Descontando alguma licença criativa e considerando uma menor resolução, estes resultados estão em linha com as simulações de Kip Thorne. Eventualmente, haverá quem não entenda a necessidade desta investigação. O método impõe que é preciso ver para crer, e ver é importante, uma vez que os ganhos desse esforço transbordam para a sociedade em que vivemos, com ramificações difíceis de destrinçar. Ainda assim, as tecnologias que nos rodeiam resultam destes desenvolvimentos simbióticos, académicos e industriais, que se retroalimentam e criam soluções para os nossos problemas, fazendo do mundo imaginado a realidade.

Parece-me interessante reverter o processo e identificar as tecnologias utilizadas. Os métodos e os algoritmos da ciência de dados, aqui aplicados, são os mesmos que usámos quando pretendemos segmentar mercados, prever saldos bancários ou planear a produção. As técnicas utilizadas têm uma base semelhante e resultam destes esforços titânicos adaptados à física do problema em análise.

PUB • CONTINUE A LER A SEGUIR

O método utilizado para se gerar a primeira imagem de um buraco negro é surpreendente. Para referência, considere-se que um radiotelescópio capaz de gerar uma imagem de um objeto que se encontra tão distante no espaço, teria ele próprio, de ter uma dimensão semelhante à da Terra. Claro que a sua construção não é exequível. O que Katie Bouman e a sua equipa levaram a cabo foi utilizar uma rede de oito radiotelescópios espalhados pelo mundo de forma a recolher fragmentos da imagem pretendida. Com o tempo, aliado à rotação da Terra, iam completando o puzzle. Esta tarefa não era, no entanto, trivial. Numa primeira instância, a atmosfera introduzia ruído no sinal. Imagine tentar identificar a música que toca no rádio quando se encontra num túnel e apenas ouve ruído. Num segundo plano, a recolha era feita ao longo do tempo. Como os corpos não são estáticos, a junção das peças obriga a que tenhamos de deduzir o estado do fragmento nos instantes de tempo em falta.

Num projeto de ciência de dados, é crucial existir um conjunto de referências que faça os algoritmos perceberem o tipo de soluções que se pretendem obter. Imaginemos que queremos identificar as características de uma pessoa com base em fotografias. A cada imagem de treino indicamos o resultado que o algoritmo deve procurar – o género, a idade, a cor dos olhos e o comprimento do cabelo são apenas alguns exemplos que poderemos apontar. No caso de um buraco negro, esta tarefa é bem mais complicada. De facto, não é possível indicar à partida o aspeto do buraco negro, já que nunca o vimos. Presumir alguma estrutura iria, portanto, contaminar a solução. Para contornar este problema, o treino foi realizado a partir de conjuntos de dados de referência, sendo estes dos mais variados temas. Caso os resultados fossem consistentes, haveria alguma segurança de que a imagem retratada era representativa do buraco negro. Ainda assim, quatro equipas tentaram construir esta imagem. Sem comunicarem umas com as outras, de forma a não influenciarem os resultados que cada uma iria obter, alcançaram resultados semelhantes, validando, assim, a imagem obtida.

Não olhando às especificidades da investigação, o mesmo método científico aplica-se a qualquer outro projeto de ciência de dados. Com efeito, a ciência aliada à criatividade é uma vantagem competitiva com a qual todas os setores de negócio podem ambicionar. Às empresas de hoje, nada do que é ciência de dados lhes deveria ser estranho. O sucesso empresarial no mundo atual requer o gosto por se Desafiar a Complexidade. Este é o admirável mundo novo onde os dados existem, não apenas como registos, mas onde são ativamente recolhidos e trabalhados para que possamos melhorar as nossas empresas, clientes e a sociedade como um todo. Dizem que não há lugar para a emoção na ciência, mas ao constatar os seus avanços continuo a deslumbrar-me com cada passo que damos.

Data Scientist na Closer, Professor e Investigador