Cientistas criaram uma base de dados de genes humanos que codificam milhares de proteínas sobre as quais se sabe muito pouco, mas que, em muitos casos, podem desempenhar funções celulares importantes, como o desenvolvimento e a resistência ao stress.
O trabalho é descrito num artigo publicado esta terça-feira na revista científica de acesso aberto PLOS Biology e foi desenvolvido por investigadores da Universidade de Oxford e do Laboratório de Biologia Molecular de Cambridge, ambos no Reino Unido.
A base de dados, de acesso público, é uma espécie de compêndio de milhares de proteínas pouco estudadas e que são codificadas por genes no genoma humano (que condensa toda a informação genética) cuja existência é conhecida, mas cujas funções, em grande parte, são desconhecidas.
O trabalho pretende ajudar os cientistas a selecionarem proteínas mal caracterizadas quer de humanos quer de organismos modelo para que possam ser melhor estudadas. Os genes no genoma humano codificam cerca de 20 mil proteínas, mas muitas continuam por caracterizar devidamente por causa, inclusive, da falta de ferramentas.
Segundo os autores da base de dados, os riscos de ignorar milhares de proteínas são significativos, uma vez que muitas podem desempenhar papéis importantes em processos celulares críticos, fornecer informações e ser alvos para tratamentos de doenças.
A base de dados classifica as proteínas a partir do quão pouco se sabe delas. Para testar a sua utilidade, os cientistas escolheram 260 genes humanos para os quais havia genes comparáveis em moscas.
Em ambas as espécies, os genes tinham pontuações mínimas ou nulas em termos de conhecimento, indicando que nada ou quase nada era conhecido sobre as proteínas que codificavam.
Em muitos casos, a desativação completa dos genes era incompatível com a vida na mosca. Em contrapartida, a desativação parcial ou direcionada levou à descoberta de que uma larga fração de genes contribuía para funções essenciais que influenciam a fertilidade, o desenvolvimento, o crescimento de tecidos, o controlo da qualidade das proteínas ou a resistência ao stress celular.