Dark Mode 115kWh poupados com o Asset 1
i

A opção Dark Mode permite-lhe poupar até 30% de bateria.

Hoje é um bom dia para mudar os seus hábitos. Saiba mais

Logótipo da MEO Energia
i

O continente africano, fortemente atingido pelo surto de ébola em 2014, é uma das principais preocupações das autoridades de saúde a nível global durante a pandemia da Covid-19

SOPA Images/LightRocket via Gett

O continente africano, fortemente atingido pelo surto de ébola em 2014, é uma das principais preocupações das autoridades de saúde a nível global durante a pandemia da Covid-19

SOPA Images/LightRocket via Gett

O cientista de dados que ajudou ONU a controlar o ébola: "Se os governos tivessem usado mais dados, talvez tivéssemos menos mortes" /premium

O brasileiro Ricardo Cappra, que em 2014 usou modelos de previsão para antecipar focos de contágio de ébola e possibilitar a vacinação em locais prioritários, defende o recurso aos dados na Covid-19.

    Índice

    Índice

Em 2014, o investigador e analista brasileiro Ricardo Cappra, que lidera o Cappra Institute for Data Science, foi contactado pelas Nações Unidas para ajudar numa tarefa complexa: estudar e, na medida do possível, antecipar a forma como a doença provocada pelo vírus ébola se estava a disseminar na África Ocidental. Já se antecipava aquele que viria a ser o maior surto de ébola até aos dias de hoje, matando mais de 11 mil pessoas. Cappra e a sua equipa, num projeto com a ONU e o Banco Mundial, desenvolveram um modelo matemático de previsão que permitiu antecipar o surto nove dias antes de a Organização Mundial de Saúde declarar formalmente a emergência — e os resultados terão salvo inúmeras vidas, ao identificarem, com vários dias de antecedência, quais os locais onde era prioritário distribuir a vacina.

Hoje em dia, o instituto liderado por Ricardo Cappra tem desenvolvido modelos de previsão cada vez mais detalhados que são capazes de antecipar a disseminação do novo coronavírus com o mesmo grau de precisão. Só há um problema: ainda não há uma vacina, pelo que o modelo de previsão serve apenas para ajudar os decisores políticos a implementar medidas de prevenção. Numa entrevista ao Observador na semana em que participa, à distância, na edição digital do Campus Party, Ricardo Cappra fala sobre a importância de utilizar os dados como ferramenta de combate ao vírus, mas também de consolidação da democracia.

Cappra, que trabalhou com outros analistas de dados na equipa responsável pela estratégia digital das duas campanhas eleitorais de Barack Obama, garante que o momento atual é de transição: a noção de privacidade vai mudar entre esta e a próxima geração. A circulação dos dados pessoais vai passar a ser um dado adquirido — e a única forma de evitar a utilização nociva das estratégias digitais por parte dos radicais e populistas é dar à sociedade as mesmas armas com que lutar. Para isso, defende Cappra, é preciso reforçar a literacia digital e reconhecer que o maior problema a combater não é a forma como os dados são usados pelas grandes empresas de comunicação, mas na generalizada falta de conhecimentos da esmagadora maioria dos utilizadores das redes sociais.

Ricardo Cappra é o fundador e líder do Cappra Institute for Data Science

“O que fazemos é gerar uma informação de melhor qualidade, que ajuda a tomar decisões melhores”

O surto de ébola em África em 2014 foi uma das maiores emergências de saúde pública nos últimos anos antes da Covid-19 e, na altura, o Ricardo trabalhou com a ONU no sentido de, usando a análise de dados, ajudar a tentar conter o surto e a antecipar a disseminação do vírus. O que é que fez em concreto?
Essa é uma boa pergunta para fazer a introdução. Somos um laboratório de ciência de dados e usamos a ciência de dados para amplificar a cultura analítica. O que fazemos no nosso dia-a-dia nestes laboratórios — dois no Brasil e três nos EUA — é testar, dentro de dados disponíveis, encontrar padrões, aplicar modelagens para descobrir coisas que ainda não foram vistas no meio dos dados, criar modelos matemáticos, científicos, metodologias analíticas, para resolver problemas da sociedade ou das organizações. Dito isso, quando pegamos em qualquer problema — seja ele de saúde, de uma organização —, o que fazemos na prática é pegar num monte de dados e, dentro daquele monte de dados, aplicar modelagens estatísticas, matemáticas, e até modelos da área da física, para tentar, ali dentro, encontrar um padrão. Há alguns anos, descobrimos que uma forma de encontrar padrões é através da clusterização, ou das modelagens por redes. O que chamamos “análise de rede”. Quando pegamos em dados, seja da sociedade dentro de uma rede social como o Facebook, o Instagram, o próprio Google, não necessariamente como uma rede social, mas pelas características da plataforma…

Pela utilização que as pessoas fazem.
Pelos rastos que as pessoas acabam deixando, de comportamento, de registos, podemos encontrar muitos padrões que, às vezes, não temos como perceber a olho nu pela quantidade e volume de dados de que estamos falando. Estou dando esta volta para chegar à resposta, porque na verdade a resposta é exatamente isto. O que fazemos dentro das organizações, fizemos junto deste trabalho do ébola e fizemos junto de eleições foi sempre tentar encontrar os padrões dentro das redes. Não diferente de nada do género, as redes e a disseminação de um vírus funciona como uma informação. Então, ela circula de ponto a ponto dentro de uma rede, exatamente como uma informação. Na verdade, o que o vírus faz é isso, ele transfere uma informação para outra célula, e essa transferência faz com que o vírus se dissemine na sociedade. O que fizemos naquela época foi entender como funcionava a forma de disseminação dentro da rede. Isso faz com que as áreas de saúde, os sistemas de saúde, os governos, possam agir dentro disso com práticas mais efetivas. Naquele momento, para o ébola especificamente, havia uma forma de vacina, que estava sendo criada, mais avançada do que temos hoje no caso da Covid-19. Então, era muito mais identificar onde eu colocava a ação. Hoje, temos um problema. Temos a mesma monitorização da rede, conseguimos usar a mesma análise de rede para dizer onde estão os padrões e como é que a doença se dissemina — conseguimos, por exemplo, identificar as famílias-focos, como é que vai disseminar, a que velocidade é que vai propagar…

"É a primeira vez na história da humanidade que podemos lidar com um vírus em tempo real. Temos informação em tempo real, podemos agir em tempo real. E, claro, quando se age em tempo real, sempre tem um problema de não ser a melhor ação, de ter de fazer uma correção de rumo"

Mas não temos a cura.
Exatamente. A tomada de ação que podemos fazer é muito mais uma ação social, no sentido de um governo dizer “não vá para a rua, fique em casa”. No momento em que o governo faz essa ação, ela tem duas alternativas: ou a população acatar ou não. No caso de uma vacina, chega lá e diz “vou aplicar uma vacina”. A responsabilidade sobre aqueles que não aplicavam era menor, era da família.

Na altura, foi a ONU que foi ter convosco e vos pediu que os ajudassem, com os vossos modelos matemáticos, a perceber onde devia agir?
Na prática, tivemos um contrato com o Banco Mundial, e através do IFC, ligado ao Banco Mundial, fizemos essa ativação humanitária, para colocar dessa forma, para entender o mapeamento de rede, entender como esse mapeamento de rede poderia fomentar mais informação para uma tomada de decisão melhor por parte da ONU naquele momento.

O que estudavam, essencialmente, mais do que características específicas do vírus, era o comportamento humano?
O comportamento da rede. É o que chamamos um padrão de uma rede. Independentemente do comportamento humano, ele tem um padrão social como rede. Funciona exatamente como uma rede de computador. Quando o vírus entra lá dentro, tem alguns pontos da rede que têm uma probabilidade maior de infeção. Detetámos, com um mapa de calor, dizendo onde é que estava a probabilidade maior de infeção. Estamos pegando em casos de 2014, só que hoje estamos fazendo exatamente a mesma coisa na rede atual de Covid-19. Temos exatamente os mesmos mapas de calor, as mesmas identificações de probabilidade, de disseminação n1, n vezes 4, a probabilidade de um vírus se propagar dentro de um território mais do que de outro, com análise matemática da rede. Esse é um ponto importante. Na verdade, o que fazemos é gerar uma informação de melhor qualidade, organização e visual. É mais estruturada, organizada e visual, o que ajuda as pessoas que estão olhando para essa informação a tomarem decisões melhores. Efetivamente, se uma decisão é melhor tomada ou não, não é necessariamente o nosso trabalho. Nós não somos responsáveis pela decisão. Na verdade, há uma informação a mais para ele poder tomar a decisão lá na ponta.

Os dados que estão a produzir e a compilar agora sobre o coronavírus, a quem é que os estão a dar? Quem é que os está a usar para tomar decisões?
Começámos com algumas lideranças e governos específicos nos Estados Unidos e Brasil, e em algum momento disponibilizámos esses métodos publicamente. Eles estão dentro de um laboratório aberto, criámos um canal, onde disponibilizámos toda a metodologia. Modelos matemáticos, modelos analíticos, dentro de uma camada open source, para que os governos, prefeituras, cidades e países pudessem usar diretamente. Hoje, ainda temos relação com algumas prefeituras do Brasil e com o governo nacional de alguns países. Essas relações são sempre sigilosas, por uma série de motivos, mas os modelos estão disponíveis para qualquer cidade do mundo que queira usar. São modelos que prevêem como é que vai ser a disseminação do vírus, qual a chance de ele propagar, baseado na curva de propagação. Resolvemos disponibilizar abertamente, porque estamos num momento muito particular para a ciência de dados. É a primeira vez na história da humanidade que podemos lidar com um vírus em tempo real. Temos informação em tempo real, podemos agir em tempo real. E, claro, quando se age em tempo real, sempre tem um problema de não ser a melhor ação, de ter de fazer uma correção de rumo. Mas o facto de podermos estar analisando e desmontar o RNA de um vírus em 48 horas é algo que nunca tivemos antes a possibilidade de fazer. O mesmo para a análise de redes. Hoje, estamos analisando o comportamento de uma rede de disseminação em 24 horas. Analisar a propagação de um vírus, obviamente que é triste pelo impacto na sociedade e no mundo, mas ao mesmo tempo, como ciência, é um elemento muito importante para instrumentar a sociedade para decisões melhor. É nisso que acreditamos.

A Serra Leoa foi um dos países mais afetados pelo surto de ébola entre 2014 e 2016

AFP via Getty Images

No caso do ébola, conseguiram prever o surto nove dias antes de a OMS o declarar. Atualmente, tem sido possível prever alguns surtos de coronavírus antes de eles surgirem?
Estamos sempre 18 dias à frente da curva. Temos, inclusive, este modelo matemático dentro desse laboratório aberto, mostrando que a modelagem que estamos apontando está sempre 18 dias à frente da curva. É óbvio — e ainda bem — que, quando uma ação é tomada, muda o jeito da curva. Conseguimos prever, mas muitas vezes alguma ação tomada muda a curva, e ainda bem.

Já teve alguma experiência em que previsse um surto, um aumento do número de casos, mas por não terem sido tomadas medidas a realidade viesse a comprovar o modelo?
Claro. O modelo matemático e estatístico é baseado no que tem de histórico até hoje. É uma regressão matemática que traz toda a história até aqui e monta, a partir disso, uma previsão matemática para a frente. Quando essa previsão é montada, ela considera os fatores que ela reconhece. Se hoje vem um governo, um governante, um líder e toma uma decisão que nunca foi tomada antes, a curva vai mudar de lugar e o modelo matemático vai errar. Nenhum cientista do mundo tinha um modelo matemático que previa quando iria acontecer a Covid-19. Sabia-se que existia uma probabilidade de um novo vírus, baseado nessas características que ele tem, mas não se sabia quando é que uma pessoa, em algum lugar do mundo, ia iniciar essa cadeia. Essa ação não consegue ser prevista naquele instante. Aquilo lá mudou toda a cadeia. Fui até aqui para dizer que, quando um governante recebe uma informação qualificada, organizada e visual e diz: “Se reduzir a circulação social, a curva vai reduzir, ela vai empurrar para a frente, então há mais tempo para preparar a saúde para esse efeito”. Quando um governante toma uma ação no meio disso, ele também prejudica a curva. Obviamente isso muda a previsão. Mas, mesmo assim, mesmo nesse cenário de que estamos falando, a taxa de acerto que temos na modelagem nunca passou o máximo e o mínimo. O modelo matemático tem uma margem de erro e nunca a passámos, mesmo com as ações, erradas ou certas — quando estamos tomando a decisão, nunca sabemos se vai ser errada ou certa —, conseguimos ver que não muda. O modelo preditivo, o papel dele não é necessariamente limitar uma tomada de decisão, mas sim dar uma possibilidade de observar o que significa aquela ação que se está a tomar. Se não estivéssemos medindo, não saberíamos o que significa. Hoje, como medimos cada passo, podemos dizer “este passo foi ruim, este foi bom”. Imagine que tínhamos esta quantidade de informação na Gripe Espanhola. Hoje podemos até dizer que as decisões não foram as mais certas. Concordo com isso, mas podemos dizer porque é que não foram as mais certas.

No Brasil houve “uma sequência de decisões não orientadas por dados”

Sendo um brasileiro que está a estudar ativamente o comportamento do vírus e a forma como ele deve ser combatido, como vê a forma como o Presidente do Brasil está a lidar com a pandemia? Pelo que me diz, falta de informação não existe.
É sempre uma zona de risco muito grande falar sobre uma decisão sendo tomada por alguns fatores. Se eu olhar, matematicamente, como cientista, eu vou dizer que ele não está tomando as melhores decisões. Por outro lado, eu sou um especialista em informação, em dados. Vou muito pelo racional e menos pelo emocional na hora de estruturar o processo de decisão. Só que há muita gente em torno dessa decisão a ser tomada que está sofrendo com o facto de uma restrição, por exemplo, de deslocamento, porque aquilo está afetando o bolso da família diretamente. Prefiro dizer que não queria estar na pele de quem precisa de tomar as decisões. Prefiro estar no meu lugar, em que consigo dizer “esta é a informação mais qualificada”, mas não quero participar na decisão, porque há tantos fatores emocionais em torno daquilo que é muito difícil julgar a decisão. É claro que uma sequência de decisões erradas que fizeram a curva ir para um lugar ruim… eu posso dizer que o modelo e a informação estava disponível, não o usou da melhor forma possível. Mas é muito difícil, porque tem muita coisa envolvida. São muitas variáveis envolvidas num processo de decisão como este. Não defendo nem digo que é ruim, mas é muito difícil julgar, para nós, que trabalhamos com informação, porque em alguns momentos essa decisão protegeu uma outra variável que não está no modelo do vírus, que é o modelo económico. O que vemos é claro, que são uma sequência de decisões que não são orientadas por dados. Aí a gente diz, puxa, que pena, não é?

Porque havia dados.
Existem muitos dados para tomar a decisão. Eles não estão sendo usados adequadamente. Isso podemos afirmar. Não estão sendo usados para a tomada de decisão diária. E em algum momento, dentro do governo brasileiro, até foram muito bem usados os dados. Foram expostos dentro de reuniões diárias, mostrando como estava a evolução, e daí a um pouco isso foi guardado, não foram mais expostos para a sociedade ou para o público como vinha sendo. Acho uma pena não expor a informação de uma magnitude dessa. Acho que é um erro não democratizar o acesso à informação. Isso eu posso afirmar. Posso afirmar muito pouco sobre a decisão de liberar uma quarentena ou não liberar, porque eu realmente não sou um especialista de saúde. Mas posso dizer que o facto de se bloquear um grupo de informação, não disponibilizar democraticamente, não ser transparente com isso, é um erro. Está tirando o acesso à informação à sociedade, que poderia, ela mesmo decidir. Eu, como sociedade, posso dizer o seguinte: “Baseado nessa informação que o governo disponibilizou, eu vou ficar em casa. Ou, baseado nessa informação que o governo disponibilizou, eu vou sair de casa”. É uma decisão que não se deveria, num regime de democracia, travar. Democratize-se a informação e deixe-se a sociedade tomar decisões.

"A educação analítica não tem nada a ver com ter estudado matemática, ter estudado estatística. Tem a ver com ter um pensamento crítico aliado a um bom dado e com uma tecnologia que hoje nos possa ajudar. Não fomos preparados para pensar analiticamente"

Também é preciso que a sociedade esteja capacitada para interpretar a informação e tomar decisões. Saber ler a informação.
Esse ponto é muito importante. Uma das coisas que estudamos, inclusivamente dentro das organizações, é que enquanto sociedade, e nas empresas, o nível de educação analítica é muito baixo. A educação analítica não tem nada a ver com ter estudado matemática, ter estudado estatística. Tem a ver com ter um pensamento crítico aliado a um bom dado e com uma tecnologia que hoje nos possa ajudar. Não fomos preparados para pensar analiticamente.

Qual a sua opinião sobre a possibilidade de serem usadas aplicações de telemóvel para fazer o rastreio dos infetados e dos contactos? Em Portugal, por exemplo, o governo está apostado em criar uma aplicação que permita fazê-lo.
Assim como falei do processo de decisão antes, acho que isso tem dois pontos importantes. Se o governo usasse a informação disponível sobre a sociedade, usando o rastreamento de empresas de telemóveis, monitorização de informações, etc., talvez o vírus tivesse tido uma velocidade menor no mundo. Porquê? Porque a informação que está disponível poderia fazer com que reduzíssemos o impacto do vírus, porque é uma informação de muita qualidade. Mas isso invade uma questão ética de privacidade que temos de discutir. Em alguns pontos, discute-se até que ponto a privacidade tem validade no momento de salvar vidas. Se eu lhe dissesse, na sua vida individualmente, que se tiver os seus dados vou salvar 100 mil vidas à sua volta e lhe explicasse como é que isso funciona, talvez em algum momento me dissesse “tome os meus dados”. O que não temos é uma capacidade de, numa situação de emergência, como vivemos hoje no mundo, de educar a sociedade sobre isso. Não há tempo de educar a sociedade e dizer “forneça os seus dados”. Acho que os governos foram numa ânsia de fazer uma ação para conter, e em vários casos teve uma efetividade relativamente boa, só que é um regime autoritário. Porque está pegando numa informação que não está disponível por livre arbítrio da população, por uma disponibilidade da população. Dito isso, por não termos leis tão claras sobre os dados hoje, entrámos nisto. Precisamos de usar este momento, ou após este momento de emergência, para voltar a discutir o que é um risco de vida para uma sociedade ou para o mundo e em que situações poderia ter acesso a um dado privado como estes. Que, na verdade, temos de entrar num outro ponto: ele é um dado individual, que foi coletado por uma empresa privada, e a empresa privada armazena esses dados. Quando essa empresa privada fez o acordo de coletar esses dados, o usuário assinou um contrato. Em algum momento, a pessoa concordou em fornecer esses dados. É óbvio que ela concordou para ser usado por aquela companhia. Essa empresa não pode vender para outra. Mas, numa situação de emergência no mundo, a empresa poderia fornecer para governos, para um meio de gestão que estivesse a proteger vidas?

Aplicação para rastrear casos de Covid-19 está pronta, mas aguarda luz verde do Governo para que esteja operacional

“Estamos numa geração que está passando pelo fim da privacidade”

Neste campo falta reflexão ética? Não há suficiente reflexão ética para a velocidade a que estamos a evoluir do ponto de vista tecnológico?
Claro. Sem dúvida, porque falta educação da sociedade para entender o que isso significa. A sociedade, a população, governantes não entendem. O governo de São Paulo fez exatamente essa ação, de começar a usar os dados das empresas de telefonia, ver como é que eles estão circulando para diminuir a circulação social e reduzir o impacto do vírus. Eles fizeram aquilo não com o objetivo de invadir a privacidade das pessoas. Querem, de alguma forma, proteger a sociedade. Então, onde está o limite ético disso? Um dos gráficos da nossa tecnologia mostra exatamente isso: a linha de ética no centro, quanto eu disponibilizo de dados e qual é a qualidade do serviço que eu recebo em troca. Em algum momento, essas linhas se cruzam, onde a qualidade do meu serviço é maior do que a importância da minha privacidade. Vou dar um exemplo, usando um serviço de música. Eu forneço todos os meus dados de hábitos musicais quando escuto o Spotify. Porquê? Porque a playlist que ele me gera semanalmente tem uma qualidade muito boa. Então, eu não estou mais preocupado com a minha privacidade de gosto musical, porque vale a pena. Mas, claro, eu tive de me educar analiticamente para poder entender o que significa isto. Acredito que estamos num momento muito particular de discutir isto. Mas também acredito, por outro lado, e sendo um pouquinho polémico no que vou responder, que, se os governos e as empresas tivessem usado mais dados, talvez tivéssemos menos mortes no mundo neste momento.

Um modelo de previsão consegue antever o surgimento de focos de infeção e preparar melhor as estruturas de saúde

MARIO CRUZ/EPA

Queria falar disto de um ponto de vista mais abstrato. Uma das principais fontes de informação que depois pode ser usada por qualquer modelo são os nossos hábitos na internet e o que fazemos nas redes sociais. As redes sociais, neste momento, são usadas por milhões de pessoas em todo o mundo. Parece-lhe que a maioria das pessoas que usam as redes sociais estão conscientes da quantidade de informação que fornecem sobre si próprias?
Não. Claro que não. As pessoas não têm ideia do que fornecem, não têm noção de como funciona. Não tenho o percentual disso, obviamente, mas acho que menos de 2% da sociedade toda lê um contrato na hora de entrar numa rede social. Não sabe o que está fornecendo. As pessoas entram pelo serviço que estão recebendo. É uma troca. E nesta troca elas não sabem exatamente o que estão fornecendo. Isso é o que precisa de ficar mais claro. Mas estamos falando, também, de um momento muito importante. Como sociedade desenvolvida, a nossa geração, vivendo neste mundo, está discutindo isto. Talvez a próxima geração venha com uma outra mentalidade sobre o uso de dados. Talvez a próxima geração, os nossos filhos, netos, as crianças que vêm para o mundo, entendam que vão entrar no mundo e digam: “Eu vão ser — aspas para o que vou dizer — um doador universal de dados, e com isso vou salvar a próxima geração da sociedade por causa dos meus dados de saúde”. Talvez seja uma discussão, é uma coisa muito nova, mas talvez esse uso de dados sociais ou físicos, lá para a frente, venhamos a entender que vai preparar ou criar melhores produtos para a próxima geração, vai criar novos medicamentos e novas formas de a sociedade viver. É uma discussão que precisamos de fazer enquanto sociedade, para criarmos as regras, os modelos éticos, para o futuro. Mas entendo que a próxima geração vem mais transparente.

Mas, na maioria das vezes, o benefício que é associado à disponibilização dos dados não é propriamente salvar vidas ou questões de saúde, mas sim um serviço mais personalizado. É até paradigmático que o Facebook, por causa do caso da Cambridge Analytica, tenha sido alvo de uma multa por não obter o consentimento expresso dos utilizadores que dão as informações. Parece-lhe que a política genérica nas empresas que recolhem dados é, mais do que informar as pessoas de que elas vão dar os seus dados, é de certa forma ludibriar as pessoas?
Não sei se é ludibriar, porque na verdade as pessoas forneceram os dados e os dados agora são realmente da empresa. Obviamente, não vou defender o que foi feito com os dados pela Cambridge Analytica, mas o trabalho da Cambridge Analytica de análise de dados não tem crime. O problema é o que se fez com aquela análise. O modelo matemático utilizado, o modelo de clusterização… eu pego em dados disponíveis e crio modelagens a partir dos dados. Quando se olha para isso, o analista, o cientista de dados que estava lá trabalhando na Cambridge Analytica não achou que estava fazendo nada errado. Ele só estava pegando os dados que a empresa disponibilizou e estava cruzando esses dados até encontrar os padrões. Quem eram os donos daqueles dados, quem adquiriu aqueles dados, adquiriu de uma forma ilegal. Não estou defendendo ninguém no processo, mas o cientista estava dizendo “eu estou criando um modelo incrível, um modelo matemático que consegue prever como uma mensagem vai impactar outras pessoas”. Tem toda a razão: precisamos que a sociedade esteja mais preparada para julgar o que ela quer fornecer e o que ela não quer fornecer. O serviço pelo qual ela vai trocar os dados ou não. A Amy Webb fala muito disso. Estamos numa geração que está passando pelo fim da privacidade do jeito que conhecemos, e essa geração está-se atrapalhando muito com isso neste momento. Mas a próxima geração vai lidar de um jeito diferente.

As redes são pouco transparentes na forma como pedem as informações às pessoas? Deviam ser mais explícitas quando alguém se regista?
Esse é o ponto. Está escrito lá. A rede social escreveu no contrato, está lá escrito exatamente o que ela vai fazer com os dados. O problema é que a sociedade não está preparada para assumir um serviço desses. Isto significa que empresa, só porque pôs no contrato, não tem responsabilidade? Ela tem, óbvio, tem responsabilidade ética. Tem de ter um comportamento ético. Mas ela escreveu lá. Ela disse. Agora, as pessoas não estão preparadas para entender isso. Por isso é que eu falo da próxima geração. Não estamos entendendo, não é uma questão de ser ilegal ou legal. Não entendemos que já assinámos esse contrato. Todos os emails, tudo o que estamos falando agora dentro do Zoom neste momento… Fizemos um acordo com o Zoom! E aí estamos discutindo que ele tem uma brecha de privacidade. Não. Ele tem um contrato que diz que se ele tiver uma brecha de privacidade a responsabilidade não é dele. E nós assinámos o serviço e estamos usando.

"Temos de criar leis, temos de educar a sociedade, temos de preparar as organizações para compreenderem o que é ético e o que não é ético"

E aceitámos.
E aceitámos. Eu entendo… Mas o Zoom não tem a responsabilidade? É claro que tem responsabilidade. Precisa de responder quando isso for determinado como um crime. O facto é que, hoje, isso não é um crime. Não há uma lei sobre isso. Temos de criar leis, temos de educar a sociedade, temos de preparar as organizações para compreenderem o que é ético e o que não é ético. É um momento muito importante, nesse sentido, da privacidade.

“Obama usou análises de redes para que as mensagens chegassem ao público de uma forma mais clara”

A primeira grande utilização em massa deste tipo de tecnologias está a refletir-se na esfera política. O Ricardo trabalhou duas vezes com a campanha de Barack Obama nos EUA. Gostava de saber em que é consistiu esse trabalho com a campanha eleitoral, qual é o papel deste tipo de trabalho numa campanha eleitoral como a de Obama.
Assim como clientes, sobre o trabalho para governos não entramos em detalhes. O que eu posso falar, nesse sentido, é que qualquer empresa, governo ou político pode usar da mesma forma análises de rede para entender o padrão de propagação de uma mensagem ou o comportamento humano de um cluster. O cluster é uma rede, um agrupamento, que é classificado por um modelo matemático por se assemelhar às pessoas próximas dele. Se eu sei que as pessoas que gostam de uma determinada marca de carro têm uma probabilidade maior de gostar de um determinado político, se eu mandar a mensagem através daquele cluster, eu tenho uma probabilidade maior de levar aquelas pessoas a votarem, num caso em que o voto é opcional, ou no caso de voto obrigatório, a conduzir aquela pessoa a fazer um voto para o meu candidato. Num momento em que eu consigo entender matematicamente o comportamento de uma rede, aumentar a chance da efetividade da minha mensagem. Isto significa que a ciência de dados organiza informação para uma tomada de decisão melhor para quem vai tomar aquela decisão. Pode ser usado por um político com um objetivo distorcido, pode ser usado por um político com um bom objetivo, de comunicar a mensagem dele da forma adequada. Não importa. E aí volto ao início: uma informação qualificada, organizada e visual é uma fonte de poder. O poder pode ser usada por uma pessoa do mal ou uma pessoa do bem. Se essa pessoa do mal usou esses dados de uma forma inadequada, é ruim obviamente. Como sociedade, vamos sofrer. Numa campanha política, efetivamente, o político usa isso para segmentar as mensagens dele. “Quero que esta mensagem X chegue na mão de tipo de público tal.” Quando essa mensagem chega, ele tem uma maior probabilidade de conversão. É um modelo matemático: se essa mensagem chegar a essa pessoa, eu vou convertê-la para votar em mim? Vou. Então, crio um modelo matemático. No caso dos governos, especificamente das campanhas de Obama, ele usou análises de redes para poder entender esses hábitos e comportamentos para que as mensagens e campanhas chegassem a esses públicos de uma forma mais clara, mais objetiva, e dizendo quais eram os benefícios da campanha dele, do governo dele, e quais eram as coisas que ele não estava tão preparado para lidar. Ele fez uma comunicação mais direta com o público negro de uma forma, o público asiático de outra forma, para cada público uma mensagem diferente chegou. Isso não é novidade, todos os governos usam.

Obama usou as redes sociais para direcionar mensagens na sua campanha eleitoral

CRISTOBAL HERRERA/EPA

Li numa entrevista na imprensa brasileira que o Ricardo deixou de trabalhar com a esfera política e que chegou a ser contactado por partidos brasileiros na eleição de 2018. O que é que levou a tomar essa decisão? Está, de alguma forma, desiludido com a forma como a classe política usa essas ferramentas?
Não, absolutamente. Não é esse o motivo. Como somos um laboratório de ciência de dados, inventamos, investigamos, não gostamos de executar de novo. Depois de fazermos uma modelagem, não temos interesse em repeti-la. Esse é o principal motivo. Obviamente, nós usamos o nosso conhecimento para continuar monitorizando, observando, estudando o comportamento da sociedade, dos governos e dos tomadores de decisão. Mas, como essa modelagem já foi feita, um laboratório que pesquisou e desenvolveu, essa análise de rede já existe. É mais esse o motivo. É claro que é um universo muito polémico em todos os sentidos. Para o bem e para o mal, gera um buzz muito grande. Para um cientista, pesquisador, a exposição de forma extrema gera um embate. Não é uma coisa comportável para um cientista.

É relativamente unânime que o recurso a estas estratégias digitais de recolha de dados teve um papel decisivo em alguns momentos recentes, como a eleição de Donald Trump ou o voto do Brexit. Parece-lhe que essas estratégias de alguma forma subvertem o resultado de uma eleição ou, pelo contrário, tornam-no mais fiel ao que os eleitores verdadeiramente pensam, mais real?
Pode fazer-se com que as pessoas tomem decisões que elas não queriam tomar. É possível fazer uma manipulação com uma melhor informação. Informação é poder. Acho que durante toda a nossa história como humanidade passámos por isso, dentro de campanhas publicitárias de empresas que tinham mais acesso a pesquisa e geravam um tipo de comunicação que nos fazia comprar produtos. Até hoje vivemos isso, e não necessariamente usando redes sociais. Usavam meios de pesquisa tradicionais, métodos de neurociência para nos impactar, e nem nos apercebíamos. Estamos com mais capacidade de julgar isso. Como sociedade, começámos a desenvolver um sentido crítico que vai virar um sentido analítico sobre isto. Hoje, conseguimos estar discutindo isto porque conseguimos analisar essa situação. No anterior, nem percebíamos que esses dados eram usados. Recebo um produto de um refrigerante e vou adquirir esse produto, tenho vontade. Mas de onde é que vem essa vontade? Um monte de horas de pesquisa de pesquisadores, universidades, estiveram pesquisando como gerar essa vontade. A cor do produto, a embalagem, a fonte usada na embalagem. Tudo isso foi investigado em detalhe para descodificar o nosso comportamento. Agora, claro, há métodos mais sofisticados, mas a manipulação não começa hoje. Esse é um ponto. Sempre aconteceu. Não a conseguíamos julgar, mas ela sempre aconteceu. Quem tem mais informação pode manipular, e aí entra uma questão ética. Com mais informação, eu posso manipular com uma taxa de acerto maior. É um cuidado que a sociedade, que as organizações, precisam de se auto-regular, e os governos precisam de regular os dados, para que isso aconteça.

E onde é que fica a fronteira entre o marketing, a publicidade, mesmo numa campanha eleitoral o direcionar da mensagem, e a manipulação?
É uma ótima pergunta, porque para mim a fronteira é que talvez sempre tenha sido uma manipulação. A geração de desejo numa pessoa, seja de um voto ou de aquisição de um produto, é o quê? Tem de se inserir uma mensagem dentro do cérebro para uma pessoa tomar uma decisão influenciada nisso. Claro que a palavra manipulação é mais forte. Quando a usamos, manipular um consumo, ela é pesada, “eu não queria fazer isso e fiz”. Por outro lado, se usarmos a palavra desejo, aí tem um ponto importante. Em alguns casos, a única coisa que o político está fazendo é levar informação do que ele pensa para o público que o quer ouvir. Não está necessariamente fazendo uma manipulação, está entregando a mensagem da informação do que é. Às vezes é uma mensagem negativa, do tipo “vamos levantar muros entre os países”. Se eu observar isso, vou dizer que é errado. Mas um político usou essa mensagem para se promover. Ele não manipulou ninguém, ele simplesmente disseminou a mensagem que queria passar e uma série de pessoas votaram nessa mensagem. Aqui não tem nenhum ponto de manipulação. Ele queria mais espaço para disseminar a informação. Uma grande maioria da população votou num determinado candidato porque ele disse uma coisa que eu não julgo certa, mas ele fez a mensagem chegar às pessoas que queriam a mesma coisa que ele. Também temos de tomar cuidado, porque isso, de uma forma ou de outra, é uma forma de democracia. Ele democratizou a informação, ele espalhou a informação para que mais pessoas soubessem.

"Quem tem mais informação pode manipular, e aí entra uma questão ética. Com mais informação, eu posso manipular com uma taxa de acerto maior"

Mas já conseguindo, já através das redes sociais, segmentar o público-alvo, saber para que pessoas queria falar.
Óbvio. Uma coisa que foi feita no governo de Obama, isso encontra-se em publicações da época nos Estados Unidos, e até depois foi estudado, é que o maior sucesso da campanha de Obama foi que ele levou mais pessoas para as urnas — porque o voto não é obrigatório nos Estados Unidos. Onde ele superou os candidatos concorrentes na época foi no levar mais pessoas às urnas. É curioso percebermos que ele não venceu porque convenceu as pessoas que já votavam. Ele conseguiu gerar uma informação para que as pessoas que não votavam fossem até um local eleitoral para votar. Se observarmos isso, há dois pontos de vista: ou ele comunicou para um público que antes não estava ouvindo uma mensagem; ou ele manipulou um público para ir até lá fazer o voto, o que eu não acredito, mas pode ser um ponto de vista sobre isso. A única coisa que ele fez foi que disseminou a mensagem dele. Isso não quer dizer que eu sou a favor das fake news ou que eu sou a favor da disseminação de informações que não sejam verdadeiras. É óbvio que não. Precisamos de punir esse tipo de coisas. E punir muito. Tem de ser punição severa. Se é uma pessoa que propaga um mal dentro de uma rede, um preconceito, racismo, tem de ser punido e preso. Deve haver uma lei especificamente para isso. A lei existe e deve ser aplicada em qualquer meio.

“O problema é que, quando a fake news nasce, os media tradicionais propagam-na”

Então acha que a fronteira deve ser entre o que é verdade e o que é mentira, entre o que é permitido e o que é proibido?
Acho que é uma boa fronteira. Há um estudo muito interessante do Duncan Watts — matemático que escreveu sobre a teoria dos seis graus de separação —, que saiu esta semana, ele publicou esse artigo, falando que o problema das fake news não é a fake news, porque ela impacta menos de 1% da verdade. É que, quando a fake news nasce, os media tradicionais propagam-na. Esses meios tradicionais é que estão a fazer com que a mensagem vire efetivamente uma fake news, porque estão propagando uma fake news. Porque a fake news, em si, é muito pequena. Ele fez um estudo matemático que mostra todas as análises disso. É curioso. A propagação está acontecendo através dos veículos que são contra. Os media tradicionais, que querem bloquear isso, estão de alguma forma propagando essa mensagem negativamente. Um exemplo prático: vimos agora, recentemente, que o Presidente do Brasil e o Presidente dos Estados Unidos fizeram uma propagação à violência contra negros, racismo… Uma do Trump, racista, e outra do Bolsonaro, a favor de um medicamento que não era comprovado para a Covid-19. O que é que as duas plataformas — Facebook e Twitter — fizeram? Apagaram esses posts. O que é que os media tradicionais fizeram? Disseram que esses dois governantes falaram essa fake news. Então, o estudo desse matemático diz que isto é muito pior do que o facto de a fake news ter existido, porque a propagação aconteceu por causa destes meios.

Ou seja, o efeito de as publicações serem removidas foi completamente eliminado pela reprodução…
…pela propagação nos grandes veículos.

A utilização de anúncios direcionados nas redes sociais foi um dos maiores trunfos da campanha eleitoral de Trump

AFP/Getty Images

Enquanto cientista de dados, preocupa-o o investimento que alguns líderes políticos mais radicais e populistas estão a fazer nestas tecnologias, usando-as para máquinas de propaganda?
Sem dúvida. O Niall Ferguson, que estuda exatamente o efeito das redes, fala muito do modelo de hierarquia vs. o modelo de rede. O modelo de hierarquia, que conhecemos, e é a forma do governo tradicional, é uma torre. Se na ponta da torre, na liderança, estiver uma informação mais qualificada, ele vai tomar decisões de manipulação da sociedade. Gostaria que todos os candidatos políticos e sociedade estivessem recebendo a mesma informação, sem esse escalonamento de alguém a receber uma informação privilegiada como temos hoje. Respondo para este lado porque preocupa-me, mas, ao mesmo tempo, entendo que a forma de resolver isso é com a democratização da informação. Claro, punindo quem está fazendo algo negativo, mas ao mesmo tempo democratizando toda a informação e os dados que são verdadeiros. O que é visto como “o candidato usa os dados para se promover”… a arma contra isso é a sociedade também ter os dados para poder observar. O que estamos entendendo como a arma do candidato, ou o que está gerando o poder para o candidato, para o político, é a mesma coisa que vai gerar poder para a sociedade. O que temos de fazer é que esteja disponível para todo o mundo e não limitado só a um dos lados. A democratização dos dados, da ciência da informação, é tão importante para esse candidato, mas nós como sociedade podemos lutar usando a mesma arma. Preocupa-me, mas ao mesmo tempo acho que temos hoje uma sociedade a preparar-se para lidar com isso.

Recomendamos

A página está a demorar muito tempo.