Respostas sobre a origem da espécie humana podem vir de outros lugares que não os laboratórios de biologia. Graças a uma área que vem ganhando cada vez mais espaço ; a bioinformática ; e à contribuição de especialistas das ciências exatas, os cientistas conseguem se aprofundar cada vez mais no estudo das células e DOS genes do homem. Uma das mais recentes inovações veio da Universidade de Brasília (UnB). Edans de Oliveira Sandes, 25 anos, aluno do mestrado em ciência da computação, testou um novo método para a comparação genética entre toda a sequência dos cromossomos 21 do homem e 22 do chimpanzé.
O estudante utilizou uma placa de vídeo de cerca de R$ 1 mil acoplada a um processador comum para atingir maior desempenho na comparação e obteve um resultado surpreendente: a análise foi feita em 21 horas. A orientadora do mestrado de Edans, professora Alba Cristina Melo, estima que seriam necessários 4.096 processadores trabalhando durante 24 horas para atingir o mesmo resultado ; ou 64 processadores funcionando durante um mês.
O grande diferencial da técnica desenvolvida na UnB é que ela permite a comparação da sequência integral dos dois cromossomos. Hoje, a análise genética de qualquer ser vivo depende de computadores potentes e muita memória, uma vez que a quantidade de dados em cada gene é astronômica. Por conta disso, muitos cientistas utilizam apenas partes dos cromossomos para fazer seus estudos. Essa ferramenta é chamada de método heurístico. ;O método heurístico é utilizado na maior parte dos chamados projetos genoma. Mas existe outro método mais exato e que dá uma solução melhor ainda. O problema é que essa técnica não está difundida, porque gasta muito tempo e muita memória de processamento;, esclarece a professora Alba.
A ideia do projeto surgiu em 2008, quando Alba fazia pós-doutorado na Universidade de Ottawa, no Canadá. Ela leu um artigo publicado na revista Nature, quatro anos antes, sobre a similaridade entre o cromossomo 21 do homem e o 22 do chimpanzé. Na época, pesquisadores do Japão, da China, da Alemanha e dos Estados Unidos utilizaram o método heurístico para fazer a análise. ;Aí eu pensei: ;Por que não tentar o estudo da sequência completa?;;, conta a professora.
O desafio foi aceito por Edans Sandes, que já havia trabalhado com computação de alto desempenho quando cursava a graduação. O estudante, então, aplicou o tal método pouco difundido, o algoritmo (1) de Smith-Waterman, proposto em 1981. Edans levou cerca de seis meses para executar as instruções na placa de vídeo. ;Até pouco tempo atrás, esse algoritmo havia sido usado apenas em processadores normais. Há cerca de cinco anos, porém, começaram os testes em placas de vídeo;, explica o jovem.
A placa GPU ; sigla para Graphics Processing Unit (unidade de processamento de vídeo) ; tem sido muito utilizada na computação de alto desempenho, porque os modelos atuais têm, pelo menos, 200 núcleos de processamento. ;Hoje, a gente já fala em duo core, quad core, que seriam dois ou quatro núcleos de processamento na CPU do computador. O interessante da placa de vídeo é que ela já tem uma grande quantidade de cores;, detalha o mestrando. Edans utilizou um modelo de 240 núcleos. Outros pesquisadores já usaram placas GPU em projetos parecidos com esse, mas nunca para a análise de sequências longas ; caso dos cromossomos 21 do homem e 22 do chimpanzé. O 21 do homem possui 46,9 milhões de bases e o do macaco, 32,7 milhões. O cálculo da matriz entre os dois dá um número gigantesco de mais de 12 petabytes (2).
Espelho dos primatas
A primeira fase da pesquisa de Edans mostrou que os dois cromossomos têm 83% de similaridade, o que faria deles cromossomos homólogos. Segundo o professor Fábio Pittella, do Instituto de Biologia da UnB e especialista em genoma humano, a expressão indica que muitas informações presentes no cromossomo 22 do macaco estão também no 21 do homem. Esse cromossomo é um dos menores da cadeia genética e foi o primeiro a ser sequenciado no projeto genoma humano. ;Em ciência, a gente sempre procura facilitar o estudo das coisas. Por ele ser um dos menores, é um dos mais utilizados em pesquisas;, explica Pittella. Os cientistas ainda não mapearam completamente o cromossomo 22 do chimpanzé, mas já foram encontradas má-formações parecidas com as do cromossomo 21. No homem, quando há a trissomia do 21 ; o cromossomo, ao invés de se duplicar, é triplicado ; ocorre a Síndrome de Down. Pesquisas com primatas identificaram indivíduos com essa mesma trissomia no cromossomo 22 e características semelhantes às de Down.
Na segunda fase do projeto, que deve terminar até julho deste ano, Edans Sands pretende obter o alinhamento completo dos dois cromossomos. Isso servirá para que os cientistas identifiquem exatamente as partes similares e, assim, possam determinar quais características são intrinsecamente humanas. Seria uma forma de entender como ocorreu a evolução do homem. ;Minha ideia é desenvolver, até o fim do mestrado, uma ferramenta que possa ser usada pelos biólogos para fazer comparações desse tipo com mais rapidez;, explica o estudante da UnB. Edans também espera melhorar o desempenho da placa GPU. ;Conseguimos o resultado da análise em 21 horas com um modelo comum. Dentro de um ou dois anos, essas placas estarão ainda mais desenvolvidas e poderemos reduzir o prazo da comparação;, planeja o jovem.
A professora Alba, orientadora do mestrado de Edans, já apresentou o projeto em uma conferência de computação na Índia. Também fez duas palestras sobre o tema, uma na França e outra na Alemanha. Ela e Edans, no entanto, ainda não encontraram biólogos especializados no assunto para fazer a análise dos resultados. ;O problema é que, na biologia, eles trabalham com organismos específicos. Existem biólogos que estudam cada cromossomo (3) do homem e do macaco, exclusivamente;, comenta Alba.
Mesmo sem esse retorno, a professora afirma que a interação entre biologia e ciência da computação vai gerar muitas descobertas nos próximos anos. Colega de Alba, a professora Maria Emília Walter é doutora em bioinformática. Ela aposta que os cientistas da computação podem sugerir novos caminhos de pesquisa para as ciências da vida. ;Nós desenvolvemos ferramentas para juntar os dados por eles coletados e apresentar uma análise completa do ponto de vista computacional;, explica. ;E isso tende a crescer cada vez mais, inclusive com a cooperação de outras áreas, como a farmácia, a medicina, a química e a física;, exemplifica.
1 - Caminho das pedras
Os algoritmos são como instruções detalhadas sobre como atingir um objetivo. É o passo a passo que orienta quem vai aplicar uma nova técnica. Muitos algoritmos foram formulados há muito tempo, mas continuam tendo aplicações nos dias de hoje, caso da pesquisa da UnB.
2 - Montanha de zeros
Os dados armazenados em um computador ocupam espaço da mesma forma que as coisas. Nas máquinas, cada caracter equivale a 8 bits ; oito ;zeros; e ;uns;, já que a linguagem do computador é binária. E um caracter é o mesmo que 1 byte. Como um caracter não é quase nada, foram criadas outras unidades de medida: o kilobyte equivale a 1.024 bytes. Depois, vem o megabyte, o gigabyte, o terabyte e, finalmente, o petabyte ; o mesmo que 1.024 terabytes ou 2 elevado à 50; potência.
3 - Código da vida
Os cromossomos são estruturas presentes nas células e que carregam o DNA de cada ser vivo. São eles que determinam características do indivíduo, como a cor dos olhos e do cabelo e o tipo sanguíneo. A espécie humana tem 23 pares de cromossomos, enquanto o chimpanzé tem 24 pares. O cachorro tem 39 pares, o gato, 38. Bactérias têm apenas um cromossomo e algumas espécies de plantas têm mais de 100 pares deles.
Projeto
O projeto da UnB foi desenvolvido em uma arquitetura de programação chamada Cuda, que tem como foco a programação de placas de vídeo para a computação de alto desempenho. O mestrando da UnB Edans Sandes e a professora Alba Cristina Melo publicaram artigo completo sobre o desempenho da técnica na Association of Computing Machinery.
A íntegra do artigo pode ser acessada por alunos e professores de universidades federais e de algumas particulares por meio do portal de periódicos da Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (Capes) ; . O resumo e as referências podem ser lidos sem restrições no link .