A experiência CMS (Compact Muon Solenoid) do CERN (Laboratório Europeu de Física de Partículas) divulgou esta sexta-feira metade dos dados recolhidos em 2011: 300 terabytes de dados. Para ter uma ideia do que é isto, lembre-se que o disco rígido de um computador moderno tem, regra geral, um terabyte de capacidade para guardar informação.

Esta é a segunda vez que a colaboração CMS torna públicos os dados das colisões do LHC (Large Hadron Collider), o maior acelerador de partículas do CERN, registados pelo seu detetor. Em novembro de 2014, tinham disponibilizado 27 terabytes de dados recolhidos em 2010, revelou o site desta equipa.

Os dados são disponibilizados na plataforma CERN Open Data Portal com o objetivo de poderem ser usamos por qualquer pessoa – seja com um objetivo educativo, seja para investigação -, desde que a origem dos dados seja devidamente atribuída. Nesta plataforma pretende-se também disponibilizar os dados de outras experiências (e detetores) do LHC, como ATLAS, ALICE e LHCb.

O grupo de investigadores de CMS disponibilizou dois tipos de coleções de dados: dados em bruto, como os que normalmente analisam, e dados trabalhados, que requerem um esforço de computação menor. Mas CMS também forneceu protocolos para a simulação de dados, como as que precisam de usar durante o trabalho de investigação que realizam, e ainda um software de visualização desses dados (como no vídeo acima).

“Os membros da colaboração CMS colocam muito esforço e milhares de pessoas-hora de serviço de forma a operarem o detetor de CMS e a recolherem estes dados para análise”, explicou Kati Lassila-Perini, física responsável pelo esforço de preservação dos dados. “No entanto, uma vez que tenhamos explorado ao máximo os dados, não vemos razão para não os disponibilizarmos publicamente. Os benefícios são numerosos, desde inspirarem alunos do secundário até ao treino dos físicos de partículas de amanhã. E, pessoalmente enquanto coordenadora da preservação dos dados de CMS, esta é uma parte crucial para assegurar que os dados de investigação estarão disponíveis a longo prazo.”

A experiência de tornar os dados públicos já mostrou poder dar frutos. Depois de os dados de 2010 terem sido tornados públicos em 2014, um grupo de físicos teóricos do MIT (Instituto de Tecnologia do Massachusetts) fez uma proposta para uma análise dos dados que a colaboração CMS não tinha explorado. E assim se estabeleceu uma parceria entre os dois grupos de investigação.

“Enquanto cientistas, devemos levar esta questão da libertação dos dados financiados por dinheiros públicos muito a sério”, disse Salvatore Rappoccio, um físico de CMS que colaborou diretamente com a equipa do MIT. “Além de mostrar uma boa administração dos fundos que recebemos, também fornece um benefício científico para a nossa área como um todo. Embora seja uma tarefa difícil e assustadora ainda com muito por fazer, a divulgação de dados CMS é um passo gigantesco na direção certa.”