Neste Dia

Genoma humano

É o código da vida

Anúncio

O genoma humano é o conjunto completo de sequências de ácido nucleico codificado como DNA dentro dos 23 pares de cromossomos nos núcleos das células e em uma pequena molécula de DNA encontrada nas mitocôndrias individuais. Usualmente, o genoma mitocondrial é tratado separadamente do genoma nuclear.

Os genomas humanos são compostos tanto por genes de DNA codificadores de proteínas quanto por DNAs não codificadores.

Os genomas humanos haplóides estão contidos nas células germinativas (óvulos e espermatozóides) e são constituídos por três bilhões de pares de bases de DNA, enquanto os genomas diplóides (encontrados em células somáticas) tem o dobro do conteúdo de DNA. Embora existam diferenças significativas entre os genomas de indivíduos humanos (na ordem de 0,1%), estes são consideravelmente menores que as diferenças entre humanos e seus parentes vivos mais próximos, os chimpanzés (aproximadamente 4%) e os bonobos. As primeiras sequências do genoma humano foram publicadas em fevereiro de 2001 pelo Projeto Genoma Humano e pela Celera Corporation. A conclusão da sequência do projeto do genoma humano foi publicada em 2004. O genoma humano foi o primeiro de todos os vertebrados a ser completamente sequenciado. A partir de 2012, milhares de genomas humanos foram completamente sequenciados, e muitos outros foram mapeados em níveis mais baixos de resolução. Esses dados são usados mundialmente em ciências biomédicas, antropologia, ciência forense e outros ramos da ciência. Existe uma expectativa amplamente difundida de que os estudos genômicos levarão a avanços no diagnóstico e tratamento de doenças e em novas teorias em muitos campos da biologia, por exemplo a evolução humana.

Embora a sequência do genoma humano tenha sido quase totalmente sequenciada, ela ainda não é totalmente compreendida. A maioria dos genes foi identificada por uma combinação de abordagens experimentais e de bioinformática de alto rendimento, mas ainda há muito trabalho a ser feito para elucidar melhor as funções biológicas de seus produtos (proteínas e RNA).

Existem cerca de 19 000 a 20 000 genes codificadores de proteínas humanas. A estimativa do número de genes humanos foi repetidamente revisada para baixo de previsões iniciais de 100 000 ou mais, já que a qualidade da sequência do genoma e os métodos de detecção de genes melhoraram e poderiam continuar a cair ainda mais. Sequências codificadoras de proteínas representam apenas uma pequena fração do genoma (aproximadamente 1,5%), e o resto é associado com moléculas de RNA não codificante, sequências reguladoras de DNA, LINEs, SINEs, intróns, e sequências de funções ainda indeterminadas.

Em junho de 2016, os cientistas anunciaram formalmente o HGP-Write, um plano para sintetizar o genoma humano.

Organização molecular e conteúdo genético

O comprimento total do genoma humano é superior a 3 bilhões de pares de bases. O genoma é organizado em 22 cromossomos pareados, mais o cromossomo X pareado com outro cromossomo X em fêmeas, e, em machos, com um cromossomo Y.

Cromossomos são grandes moléculas lineares de DNA contidas no núcleo da célula. O genoma também inclui o DNA mitocondrial, uma molécula circular com tamanho bem menor que o do DNA nuclear e que se localiza nas mitocôndrias.

Na tabela a seguir, estão expostas informações básicas sobre o genoma humano, baseadas em uma referência. Logo, a tabela não representa a sequência de nenhum indivíduo específico. (Fonte de dados: Ensembl genome browser release 87, December 2016 para a maioria dos valores; Ensembl genome browser release 68, julho de 2012 para miRNA, rRNA, snRNA, snoRNA.)

Tabela 1 (acima) resume a organização física e o conteúdo gênico do genoma de referência humano, com links para a análise original, conforme publicado no banco de dados Ensembl do Instituto Europeu de Bioinformática (EBI) e do Wellcome Trust Sanger Institute.

Os comprimentos cromossômicos foram estimados pela multiplicação do número de pares de bases por 0,34 nanômetros - a distância entre pares de bases em uma dupla hélice do DNA.

O número de proteínas baseia-se no número inicial de transcritos de precursores RNAm e não inclui produtos de splicing alternativo, ou modificações na estrutura proteica que ocorrem após a tradução.

Variações são diferenças únicas na sequência de DNA que foram identificadas nas sequências do genoma humano analisadas pela Ensembl em dezembro de 2016. Espera-se que o número de variações identificadas aumente à medida que outros genomas pessoais sejam sequenciados e analisados. Além do conteúdo gênico mostrado nesta tabela, um grande número de sequências funcionais não expressas foram identificadas em todo o genoma humano (ver abaixo).

RNAs não-codificantes pequenos são RNAs de até 200 bases que não possuem potencial de codificação de proteínas. Estes incluem: microRNAs ou miRNAs (reguladores pós-transcricionais da expressão gênica), RNAs nucleares pequenos ou snRNAs (os componentes de RNA dos spliceosomos) e RNAs nucleolares pequenos, ou snoRNA (envolvido na orientação de modificações químicas para outras moléculas de RNA). RNAs longos não-codificantes são moléculas de RNA com mais de 200 bases que não possuem potencial de codificação de proteínas. Estes incluem: RNAs ribossômicos ou rRNAs (os componentes de RNA dos ribossomos), e uma variedade de outros RNAs longos que estão envolvidos na regulação da expressão gênica, epigenética, e regulação da atividade de genes codificadores de proteínas.

Das 126.018 variações estruturais descobertas existe variações medicamente importantes herdadas dos denisovanos nas populações oceânicas da Papua Nova Guiné e nas proximidades, incluindo uma exclusão de alta frequência no gene AQR que desempenha um papel na detecção de vírus e na regulação da resposta imune antiviral.

Completude da sequência do genoma humano

Embora o genoma humano tenha sido completamente sequenciado para todos os fins práticos, ainda existem centenas de lacunas na sequência. Um estudo recente observou mais de 160 lacunas eucromáticas, das quais 50 lacunas foram fechadas. No entanto, ainda existem numerosas lacunas nas partes heterocromáticas do genoma que são muito mais difíceis de sequenciar devido a numerosas repetições e outras sequências de características intratáveis.

Anúncio

Em breve no aplicativo World in Stories

Áudio, download offline, sem anúncios e muito mais.

Conhecer Premium
Genoma humano | World in Stories