Projeto Comparação de Genomas

Andamento do projeto

(atualizado em 02 de agosto de 2007)

Na primeira fase do projeto no World Community Grid, mais de 2.8 milhões de seqüências protéicas de 3.774 organismos, incluindo vírus e mais de 400 organismos cuja seqüência genômica foi completamente decifrada, foram comparadas TODAS contra TODAS. A maioria destas seqüências protéicas foram preditas a partir de análises computacionais do código genético, determinado por muitos grupos de pesquisa desde os anos sessenta e depositados em bancos de dados públicos, juntamente com a anotação funcional putativa (em sua maior parte) das mesmas.

Para a análise comparativa de genomas, as seqüências foram agrupadas em blocos de 2.000 seqüências cada, e mais de 1 milhão de comparações bloco a bloco foram feitas. Tendo início em 20 de dezembro de 2006, 4 milhões de comparações foram realizadas (incluindo redundâncias e verificações), sendo completada esta fase em 31 de março de 2007.

Para a segunda fase do projeto, o conjunto de dados inicial foi atualizado com novas seqüências protéicas preditas publicadas, em sua grande maioria oriundas de dados genômicos, acrescentando 393.999 novas seqüências. Adicionalmente, um conjunto de dados totalmente curado foi acrescentado (SwissProt – com 254.609 seqüências protéicas), contribuindo para uma anotação controlada e cruzamento dos dados com outras fontes de referência. Esta parte do projeto foi concluída em 14 de maio de 2007.

Por fim, um conjunto de dados experimental de cerca de 3 milhões de seqüências protéicas derivadas de fases abertas de leitura (Open Reading Frames [ORFs]), que não foram preditas como regiões codificadoras pelos métodos computacionais classicamente empregados, está sendo analisado neste momento. Esta é uma tentativa de descobrir padrões incomuns de codificação em seqüências genômicas. Estima-se que esta fase final do projeto demande mais 4 meses de processamento no World Community Grid.


Estatísticas para o Projeto Comparação de Genomas (todas as fases) em 02 de agosto de 2007: