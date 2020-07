Em 2014, o investigador e analista brasileiro Ricardo Cappra, que lidera o Cappra Institute for Data Science, foi contactado pelas Nações Unidas para ajudar numa tarefa complexa: estudar e, na medida do possível, antecipar a forma como a doença provocada pelo vírus ébola se estava a disseminar na África Ocidental. Já se antecipava aquele que viria a ser o maior surto de ébola até aos dias de hoje, matando mais de 11 mil pessoas. Cappra e a sua equipa, num projeto com a ONU e o Banco Mundial, desenvolveram um modelo matemático de previsão que permitiu antecipar o surto nove dias antes de a Organização Mundial de Saúde declarar formalmente a emergência — e os resultados terão salvo inúmeras vidas, ao identificarem, com vários dias de antecedência, quais os locais onde era prioritário distribuir a vacina.

Hoje em dia, o instituto liderado por Ricardo Cappra tem desenvolvido modelos de previsão cada vez mais detalhados que são capazes de antecipar a disseminação do novo coronavírus com o mesmo grau de precisão. Só há um problema: ainda não há uma vacina, pelo que o modelo de previsão serve apenas para ajudar os decisores políticos a implementar medidas de prevenção. Numa entrevista ao Observador na semana em que participa, à distância, na edição digital do Campus Party, Ricardo Cappra fala sobre a importância de utilizar os dados como ferramenta de combate ao vírus, mas também de consolidação da democracia.

Cappra, que trabalhou com outros analistas de dados na equipa responsável pela estratégia digital das duas campanhas eleitorais de Barack Obama, garante que o momento atual é de transição: a noção de privacidade vai mudar entre esta e a próxima geração. A circulação dos dados pessoais vai passar a ser um dado adquirido — e a única forma de evitar a utilização nociva das estratégias digitais por parte dos radicais e populistas é dar à sociedade as mesmas armas com que lutar. Para isso, defende Cappra, é preciso reforçar a literacia digital e reconhecer que o maior problema a combater não é a forma como os dados são usados pelas grandes empresas de comunicação, mas na generalizada falta de conhecimentos da esmagadora maioria dos utilizadores das redes sociais.

▲ Ricardo Cappra é o fundador e líder do Cappra Institute for Data Science

“O que fazemos é gerar uma informação de melhor qualidade, que ajuda a tomar decisões melhores”

O surto de ébola em África em 2014 foi uma das maiores emergências de saúde pública nos últimos anos antes da Covid-19 e, na altura, o Ricardo trabalhou com a ONU no sentido de, usando a análise de dados, ajudar a tentar conter o surto e a antecipar a disseminação do vírus. O que é que fez em concreto?

Essa é uma boa pergunta para fazer a introdução. Somos um laboratório de ciência de dados e usamos a ciência de dados para amplificar a cultura analítica. O que fazemos no nosso dia-a-dia nestes laboratórios — dois no Brasil e três nos EUA — é testar, dentro de dados disponíveis, encontrar padrões, aplicar modelagens para descobrir coisas que ainda não foram vistas no meio dos dados, criar modelos matemáticos, científicos, metodologias analíticas, para resolver problemas da sociedade ou das organizações. Dito isso, quando pegamos em qualquer problema — seja ele de saúde, de uma organização —, o que fazemos na prática é pegar num monte de dados e, dentro daquele monte de dados, aplicar modelagens estatísticas, matemáticas, e até modelos da área da física, para tentar, ali dentro, encontrar um padrão. Há alguns anos, descobrimos que uma forma de encontrar padrões é através da clusterização, ou das modelagens por redes. O que chamamos “análise de rede”. Quando pegamos em dados, seja da sociedade dentro de uma rede social como o Facebook, o Instagram, o próprio Google, não necessariamente como uma rede social, mas pelas características da plataforma…

Pela utilização que as pessoas fazem.

Pelos rastos que as pessoas acabam deixando, de comportamento, de registos, podemos encontrar muitos padrões que, às vezes, não temos como perceber a olho nu pela quantidade e volume de dados de que estamos falando. Estou dando esta volta para chegar à resposta, porque na verdade a resposta é exatamente isto. O que fazemos dentro das organizações, fizemos junto deste trabalho do ébola e fizemos junto de eleições foi sempre tentar encontrar os padrões dentro das redes. Não diferente de nada do género, as redes e a disseminação de um vírus funciona como uma informação. Então, ela circula de ponto a ponto dentro de uma rede, exatamente como uma informação. Na verdade, o que o vírus faz é isso, ele transfere uma informação para outra célula, e essa transferência faz com que o vírus se dissemine na sociedade. O que fizemos naquela época foi entender como funcionava a forma de disseminação dentro da rede. Isso faz com que as áreas de saúde, os sistemas de saúde, os governos, possam agir dentro disso com práticas mais efetivas. Naquele momento, para o ébola especificamente, havia uma forma de vacina, que estava sendo criada, mais avançada do que temos hoje no caso da Covid-19. Então, era muito mais identificar onde eu colocava a ação. Hoje, temos um problema. Temos a mesma monitorização da rede, conseguimos usar a mesma análise de rede para dizer onde estão os padrões e como é que a doença se dissemina — conseguimos, por exemplo, identificar as famílias-focos, como é que vai disseminar, a que velocidade é que vai propagar…