A partir desta quarta-feira, é possível consultar diretamente no site do Observador os quadros e gráficos da plataforma Covid Insights, desenvolvida através de uma parceria entre a COTEC Portugal e a NOVA Information Management School (IMS) da Universidade Nova de Lisboa. Trata-se de um projeto de visualização de dados sobre a pandemia da Covid-19 em Portugal e no mundo que, através da recolha e tratamento de informações públicas, exibe informação permanentemente atualizada sobre a evolução da doença, que pode ser correlacionada com uma série de outros indicadores, incluindo sociodemográficos e económicos.
Segundo explicou ao Observador Manuel Dias, professor na NOVA IMS e responsável pela área de análise de dados na Microsoft Portugal, o objetivo deste projeto foi “desenhar uma plataforma que conseguisse agregar informação quase em tempo real de múltiplas perspetivas da pandemia”. Por isso, além de mostrar os dados já conhecidos sobre a componente epidemiológica (obtidos através da DGS para Portugal e da Our World in Data para o resto do mundo), a plataforma permite cruzar estes dados com outro tipo de informações de contexto.
Os investigadores portugueses apresentam nesta plataforma cerca de uma centena de métricas diferentes que podem ser correlacionadas pelos utilizadores de modo a extrair conclusões sobre a evolução da pandemia. Recorrendo, por exemplo, aos dados sobre a mobilidade divulgados pela Google, a plataforma introduz um atraso de dez dias para os cruzar com o número de casos confirmados e perceber “a correlação entre os casos confirmados e o confinamento”, explica Manuel Dias.
O painel mostra também os dados referentes a todos os países do mundo e cruza-os com informações como o número de médicos ou o número de camas hospitalares por mil habitantes, ou a percentagem de população acima dos 70 anos. A plataforma permite também fazer uma comparação direta entre dois países, escolhidos pelo utilizador, em vários parâmetros, sempre com os dados em absoluto por população. “Não me importa olhar para os casos confirmados se não olhar para a população”, explica Manuel Dias.
“Este projeto vem colmatar uma necessidade de usarmos dados que estão disponíveis publicamente, mas que podem ser organizados e visualizados e sobre os quais se podem criar modelos de previsão que podem acrescentar valor”, diz ao Observador o diretor-geral da COTEC Portugal, Jorge Portugal. “Nesse sentido, quisemos demonstrar como é que os dados poderiam ser integrados numa plataforma funcional, acessível não só apenas a especialistas, mas a qualquer pessoa. Estamos a falar não apenas de interpretação, mas também de previsão.”
Dentro de Portugal, os dados estão organizados por região e por concelho e podem ser cruzados com uma série de informações públicas sobre cada município português, incluindo o rendimento médio per capita, a densidade populacional, a percentagem de idosos ou as habilitações literárias médias da comunidade. Segundo os investigadores, o cruzamento de todos estes dados permite calcular o chamado “índice de risco” de cada concelho do país para esta pandemia, uma vez que se baseiam num “conjunto de variáveis sociodemográficas que refletem o risco infeccioso e social de cada região”.
Na opinião de Manuel Dias, responsável pelo desenvolvimento tecnológico da plataforma, a principal inovação da Covid Insights não é a sua atuação enquanto fonte de dados, mas a forma como permite aos utilizadores cruzarem diretamente, numa mesma interface, dezenas de variáveis diferentes que podem contribuir para uma leitura mais detalhada dos fatores que influenciam a evolução da pandemia.
“É uma plataforma agregadora de várias informações. O mais relevante é a forma como cruzámos múltiplas fontes. Fomos buscar dados ao Banco Mundial sobre o número de médicos e camas por habitante, fomos ao Pordata buscar uma série de dados sobre os concelhos em Portugal. Era muito importante disponibilizar estas dimensões todas e ter uma visão de Portugal e mundial, mas também de Portugal ao nível dos distritos e dos concelhos”, explica Manuel Dias.
Além da quantidade de dados oriundos de múltiplas fontes que a plataforma cruza em permanência, outra das características mais relevantes do projeto é o facto de estar em atualização automática para a esmagadora maioria dos indicadores. Quase todos os dados chegam à plataforma através da importação direta de ficheiros disponibilizados gratuitamente pelas instituições. Segundo Manuel Dias, o sistema procura atualizações em cada fonte de informação quatro vezes por dia, o que significa que as informações entram na plataforma praticamente em tempo real (por exemplo, a DGS divulga os dados por volta das 13h todos os dias, a Universidade Johns Hopkins atualiza a sua plataforma à meia-noite).
A única exceção a esta facilidade em ir buscar os dados às fontes originais é, precisamente, a própria Direção-Geral da Saúde, cuja única plataforma de divulgação dos dados diariamente é um ficheiro em formato PDF — em vez de CSV, que é o formato usado por exemplo pelos ficheiros produzidos no Excel. Por essa razão, o boletim diário da DGS não pode ser importado diretamente para a ferramenta — e os investigadores dependem de um trabalho que está a ser feito pela organização não-governamental Data Science for Social Good Portugal, que todos os dias pega no boletim da DGS e o transforma, à mão, num ficheiro CSV que é disponibilizado gratuitamente para quem o quiser utilizar.
“Nós tentamos que isto seja feito à base de dados públicos, mais do que ser uma fonte de dados. O objetivo é permitir fazer correlações entre dados que são públicos, mas que muitas vezes não são olhados em conjunto, ou cruzar várias métricas em simultâneo, pôr dois países lado a lado. A grande mais-valia é a visualização de informação, que é muito rica e detalhada, porque os dados são todos públicos”, sublinha o responsável.
O projeto começou a ser desenvolvido no início de abril por um conjunto de professores da NOVA IMS, que trabalharam durante um mês para pôr a plataforma em funcionamento. O painel, que está publicado desde o início de maio numa página própria, passa agora também a estar disponível no Observador.
A plataforma foi desenvolvida com recurso à ferramenta Power BI da Microsoft, o programa de análise de dados mais avançado da empresa, que permite uma série de opções de visualização de dados que, por exemplo, o Excel não permite. Uma das ferramentas mais úteis deste painel, segundo destaca Manuel Dias, é a possibilidade de cross-filtering, ou filtragem cruzada: sempre que seleciona um determinado país ou município num gráfico, todos os outros gráficos da página ficam com a mesma seleção, o que permite uma comparação direta.
Além da possibilidade de fazer múltiplas correlações entre a evolução da epidemia e os dados sociodemográficos, a plataforma integra também um modelo de previsão epidemiológica baseado no coeficiente de reprodução do vírus (o valor do “R”) — precisamente o modelo que, na semana passada, estimou que a região de Lisboa e Vale do Tejo só deveria chegar ao pico da pandemia por estes dias, enquanto o resto do país já o havia ultrapassado. O objetivo do modelo é ajudar os agentes económicos nos processos de tomada de decisão relativamente à reabertura gradual da economia.
Como explica Jorge Portugal, “quanto mais longas no tempo são as previsões, menos fiáveis são”. Por isso, o modelo atual resulta de um “compromisso entre a fiabilidade e a utilidade” da previsão que permite oferecer estimativas sobre a evolução do surto para as próximas semanas — estimativas que, por agora, colocam a região de Lisboa e Vale do Tejo a atingir os valores residuais do resto do país entre o final de julho e o início de agosto, segundo o responsável da COTEC.
Plataforma vai ter dados económicos
Outra das inovações da Covid Insights é a inclusão de dados económicos na mesma plataforma, de modo a que possam ser cruzados com as informações relativas à pandemia. Esta vertente do painel ainda não está disponível, mas os responsáveis da iniciativa esperam que os primeiros dados comecem a ser incluídos na plataforma ainda durante o mês de junho.
Para já, como explicou Jorge Portugal ao Observador, o objetivo é combinar indicadores da atividade económica com os dados sobre a pandemia e com os modelos de previsão, de modo a auxiliar os empresários, dos mais pequenos aos maiores, a poderem organizar as suas vidas no futuro próximo. Entre os dados que serão usados para esta análise, encontram-se informações públicas já divulgadas por várias instituições e podem incluir, por exemplo, dados do consumo de energia, informações sobre o consumo nos vários setores da economia, levantamentos em multibanco, fluxos financeiros através dos bancos e dados sobre a procura e oferta de emprego.
“O nosso propósito é criar condições de segurança para a atividade económica através de informação fidedigna”, resume Jorge Portugal, salientando que a própria Covid Insights vai publicando semanalmente análises aos dados que surgem no painel.