Tem acesso livre a todos os artigos do Observador por ser nosso assinante.

É uma descoberta que, aponta a comunidade científica, pode abrir uma série de conclusões relevantes — nomeadamente em casos clínicos e diagnósticos — na próxima década. Esta quinta-feira foi publicada a primeira sequência completa do genoma humano — o código genético dos humanos –, resolvendo assim um mistério de décadas e permitindo que os cientistas “leiam” o ADN (as moléculas que contêm as instruções genéticas que transmitem as características herdadas dos pais) de uma pessoa de uma ponta à outra, sem falhas.

A descoberta foi publicada na revista científica Science e será explorada esta semana em mais de uma dezena de outros artigos. E significa que o consórcio internacional de investigadores T2T, que trabalhou no projeto, conseguiu assim acabar o trabalho que estava feito, mas de forma incompleta, há 21 anos.

Foi nessa altura, em 2003, como lembra o jornal espanhol El Mundo, que foi anunciada a primeira versão completa do genoma humano (uma foi publicada pelo consórcio público Projeto Genoma Humano, outra pela empresa privada Celera Genomics). Mas as sequências que foram encontradas na altura não estavam completas: havia sequências muito repetidas que não era possível descodificar, o que provocava alguns “vazios” na leitura do código genético humano.

O jornal explica que durante a pandemia, com o teletrabalho e reuniões por Zoom pelo meio, cerca de cem investigadores juntaram-se ao T2T, que é liderado por Adam Phillipy, do Instituto Nacional de Investigação do Genoma Humano (o norte-americano NHGRI), e Karen Miga, da Universidade da Califórnia. E conseguiram finalmente revelar o que faltava conhecer na sequência de genes humanos — cerca de 8% do código genético.

PUB • CONTINUE A LER A SEGUIR

À Lusa, a geneticista Luísa Pereira, do i3S – Instituto de Investigação e Inovação em Saúde da Universidade do Porto, que coordena no instituto o grupo de trabalho sobre diversidade genética, diz que a tecnologia usada em 2003 “só permitia estudar as bases (as letras) de pequenos segmentos (centenas de bases) e o genoma era reconstituído como um puzzle gigante destes pequenos fragmentos”. A investigação foi progredindo e agora as máquinas de sequenciação conseguem obter “uma resolução perfeita” — uma delas poderá ler até um milhão de letras de ADN com uma “precisão modesta” e a outra “pode ler cerca de 20.000 letras com uma precisão quase perfeita”.

Segundo o comunicado do NHGRI, ter uma “sequência completa e sem falhas dos cerca de três mil milhões de ‘letras'” que compõem o nosso ADN é muito importante para perceber “o espetro completo da variação de genomas humanos e perceber as contribuições genéticas para algumas doenças”, havendo “622 genes medicamente relevantes” encontrados. Também ajudará a responder a perguntas no campo da biologia e a fazer “mapas” mais completos com o desenho dos cromossomas, o que “abre novas linhas de investigação”.

Esta é a “primeira visão completa do diagrama do nosso ADN”, diz Eric Green, diretor do NHGRI. “Esta informação fundamental vai fortalecer os muitos esforços que estão em desenvolvimento para perceber todas as nuances funcionais do genoma humano, o que vai fortalecer os estudos genéticos das doenças humanas”.

Assim, quando for feita a sequenciação de um genoma, será possível identificar todas as variantes no seu ADN e usar essa informação para fins de saúde. “É como pôr um novo par de óculos”, garante o comunicado do mesmo instituto. Phillipy usa outra analogia: “É um novo cofre do tesouro de variáveis que podemos agora estudar”.

A descoberta foi possível às ferramentas laboratoriais e métodos computacionais que melhoraram desde a última vez que foi possível publicar o esquema praticamente completo, com 92% do código decifrado e já praticamente sem “zonas cinzentas”.

O consórcio T2T, explica o El Mundo, já tem outros trabalhos em curso: está a trabalhar para obter um “pangenoma”, que tem sequências de ADN completas de centenas de pessoas por todo o mundo, para “obter uma representação mais fina da diversidade humana”.

Como explica a Lusa, o genoma humano é composto por pouco mais de seis mil milhões de letras de ADN distribuídas por 23 pares de cromossomas (estruturas organizadas de células que contêm genes, responsáveis pela codificação da informação genética). Em cada um desses pares de cromossomas, um cromossoma provém do pai e o outro da mãe.

Para ler um genoma, os cientistas cortam todo o ADN em peças com centenas a milhares de letras. As máquinas de sequenciação leem as letras de cada peça e os cientistas tentam colocá-las na ordem certa como se estivessem a montar um puzzle. O desafio é que algumas regiões do genoma repetem as mesmas letras várias vezes. E é esse desafio que é agora facilitado, uma vez que essas regiões são descodificadas.