Genoma
Nas áreas de biologia molecular e genética, um genoma é toda a informação genética de um organismo. Consiste em sequências de nucleotídeos de DNA (ou RNA em vírus de RNA). O genoma nuclear inclui genes codificadores de proteínas e genes não codificantes, outras regiões funcionais do genoma, como sequências regulatórias (consulte DNA não codificador) e, frequentemente, uma fração substancial de 'lixo' DNA sem função evidente. Quase todos os eucariotos têm mitocôndrias e um pequeno genoma mitocondrial. Algas e plantas também contêm cloroplastos com um genoma de cloroplasto.
O estudo do genoma é chamado de genômica. Os genomas de muitos organismos foram sequenciados e várias regiões anotadas. O Projeto Genoma Humano Internacional relatou a sequência do genoma do Homo sapiens em 2004 O Projeto Genoma Humano, embora o projeto inicial "concluído" faltava 8% do genoma consistindo principalmente de sequências repetitivas.
Com os avanços na tecnologia que podem lidar com o sequenciamento de muitas sequências repetitivas encontradas no DNA humano que não foram totalmente descobertas pelo estudo original do Projeto Genoma Humano, os cientistas relataram a primeira sequência completa do genoma humano em março de 2022.
Origem do termo
O termo genoma foi criado em 1920 por Hans Winkler, professor de botânica na Universidade de Hamburgo, Alemanha. O Oxford Dictionary e o Online Etymology Dictionary sugerem que o nome é uma mistura das palavras gene e chromosome. No entanto, veja ômicas para uma discussão mais completa. Algumas palavras -ome relacionadas já existiam, como bioma e rizoma, formando um vocabulário no qual genoma se encaixa sistematicamente.
Definindo o genoma
É muito difícil chegar a uma definição precisa de "genoma." Geralmente se refere às moléculas de DNA (ou às vezes de RNA) que carregam a informação genética em um organismo, mas às vezes é difícil decidir quais moléculas incluir na definição; por exemplo, as bactérias geralmente têm uma ou duas grandes moléculas de DNA (cromossomos) que contêm todo o material genético essencial, mas também contêm moléculas de plasmídeo extracromossômicas menores que carregam informações genéticas importantes. A definição de 'genoma' que é comumente usado na literatura científica é geralmente restrito às grandes moléculas de DNA cromossômico em bactérias.
Os genomas eucarióticos são ainda mais difíceis de definir porque quase todas as espécies eucarióticas contêm cromossomos nucleares mais moléculas extras de DNA nas mitocôndrias. Além disso, algas e plantas possuem DNA de cloroplasto. A maioria dos livros didáticos faz uma distinção entre o genoma nuclear e os genomas das organelas (mitocôndrias e cloroplastos), então, quando eles falam, digamos, do genoma humano, eles estão se referindo apenas ao material genético no núcleo. Este é o uso mais comum de 'genoma' na literatura científica.
A maioria dos eucariotos é diplóide, o que significa que existem duas cópias de cada cromossomo no núcleo, mas o 'genoma' refere-se a apenas uma cópia de cada cromossomo. Alguns eucariotos têm cromossomos sexuais distintos, como os cromossomos X e Y de mamíferos, portanto, a definição técnica do genoma deve incluir ambas as cópias dos cromossomos sexuais. Ao se referir ao genoma de referência padrão dos humanos, por exemplo, ele consiste em uma cópia de cada um dos 22 autossomos mais um cromossomo X e um cromossomo Y.
Sequenciamento e mapeamento
Uma sequência do genoma é a lista completa dos nucleotídeos (A, C, G e T para genomas de DNA) que compõem todos os cromossomos de um indivíduo ou espécie. Dentro de uma espécie, a grande maioria dos nucleotídeos é idêntica entre os indivíduos, mas o sequenciamento de vários indivíduos é necessário para entender a diversidade genética.
Em 1976, Walter Fiers na Universidade de Ghent (Bélgica) foi o primeiro a estabelecer a sequência completa de nucleotídeos de um genoma de RNA viral (Bacteriófago MS2). No ano seguinte, Fred Sanger completou a primeira sequência de DNA-genoma: Phage Φ-X174, de 5386 pares de bases. O primeiro genoma bacteriano a ser sequenciado foi o do Haemophilus influenzae, concluído por uma equipe do The Institute for Genomic Research em 1995. Alguns meses depois, o primeiro genoma eucariótico foi concluído, com sequências dos 16 cromossomos da levedura em brotamento Saccharomyces cerevisiae publicado como resultado de um esforço liderado pela Europa iniciado em meados da década de 1980. A primeira sequência do genoma de um archaeon, Methanococcus jannaschii, foi concluída em 1996, novamente pelo Instituto de Pesquisa Genômica.
O desenvolvimento de novas tecnologias tornou o sequenciamento do genoma dramaticamente mais barato e fácil, e o número de sequências completas do genoma está crescendo rapidamente. Os Institutos Nacionais de Saúde dos EUA mantêm um dos vários bancos de dados abrangentes de informações genômicas. Entre os milhares de projetos de sequenciamento de genoma concluídos estão os de arroz, camundongos, a planta Arabidopsis thaliana, o baiacu e a bactéria E. coli. Em dezembro de 2013, os cientistas sequenciaram pela primeira vez todo o genoma de um Neandertal, uma espécie extinta de humanos. O genoma foi extraído do osso do pé de um Neandertal de 130.000 anos encontrado em uma caverna na Sibéria.
Novas tecnologias de sequenciamento, como o sequenciamento paralelo massivo, também abriram a perspectiva do sequenciamento do genoma pessoal como uma ferramenta de diagnóstico, pioneira da Manteia Predictive Medicine. Um grande passo em direção a esse objetivo foi a conclusão em 2007 do genoma completo de James D. Watson, um dos co-descobridores da estrutura do DNA.
Enquanto uma sequência do genoma lista a ordem de cada base de DNA em um genoma, um mapa do genoma identifica os marcos. Um mapa do genoma é menos detalhado do que uma sequência do genoma e ajuda a navegar pelo genoma. O Projeto Genoma Humano foi organizado para mapear e sequenciar o genoma humano. Um passo fundamental no projeto foi o lançamento de um mapa genômico detalhado por Jean Weissenbach e sua equipe no Genoscope em Paris.
Sequências e mapas do genoma de referência continuam sendo atualizados, removendo erros e esclarecendo regiões de alta complexidade alélica. O custo decrescente do mapeamento genômico permitiu que sites genealógicos o oferecessem como um serviço, na medida em que alguém pode submeter seu genoma a empreendimentos científicos colaborativos, como DNA.LAND no New York Genome Center, um exemplo tanto de as economias de escala e da ciência cidadã.
Genomas virais
Os genomas virais podem ser compostos de RNA ou DNA. Os genomas dos vírus de ARN podem ser ARN de cadeia simples ou ARN de cadeia dupla e podem conter uma ou mais moléculas de ARN separadas (segmentos: genoma monopartido ou multipartido). Os vírus de DNA podem ter genomas de fita simples ou fita dupla. A maioria dos genomas de vírus de DNA é composta por uma única molécula linear de DNA, mas alguns são compostos por uma molécula de DNA circular.
Genomas procarióticos
Procariotos e eucariotos têm genomas de DNA. Archaea e a maioria das bactérias têm um único cromossomo circular, no entanto, algumas espécies bacterianas têm cromossomos lineares ou múltiplos. Se o DNA for replicado mais rápido do que a divisão das células bacterianas, múltiplas cópias do cromossomo podem estar presentes em uma única célula, e se as células se dividirem mais rápido do que o DNA pode ser replicado, a replicação múltipla do cromossomo é iniciada antes que a divisão ocorra. permitindo que as células filhas herdem genomas completos e cromossomos já parcialmente replicados. A maioria dos procariotos tem muito pouco DNA repetitivo em seus genomas. No entanto, algumas bactérias simbióticas (por exemplo, Serratia symbiotica) têm genomas reduzidos e uma alta fração de pseudogenes: apenas ~ 40% de seu DNA codifica proteínas.
Algumas bactérias possuem material genético auxiliar, também parte de seu genoma, que é transportado em plasmídeos. Para isso, a palavra genoma não deve ser usada como sinônimo de cromossomo.
Genomas eucarióticos
Os genomas eucarióticos são compostos por um ou mais cromossomos lineares de DNA. O número de cromossomos varia amplamente, desde formigas saltadoras e um nemótode assexuado, cada um com apenas um par, até uma espécie de samambaia com 720 pares. É surpreendente a quantidade de DNA que os genomas eucarióticos contêm em comparação com outros genomas. A quantidade é ainda maior do que a necessária para os genes codificadores e não codificadores de proteínas de DNA, devido ao fato de que os genomas eucarióticos apresentam variação de até 64.000 vezes em seus tamanhos. No entanto, essa característica especial é causada pela presença de DNA repetitivo e elementos transponíveis (TEs).
Uma célula humana típica tem duas cópias de cada um dos 22 autossomos, um herdado de cada pai, mais dois cromossomos sexuais, tornando-a diplóide. Os gametas, como óvulos, esperma, esporos e pólen, são haplóides, o que significa que carregam apenas uma cópia de cada cromossomo. Além dos cromossomos no núcleo, organelas como os cloroplastos e as mitocôndrias possuem seu próprio DNA. Às vezes, diz-se que as mitocôndrias têm seu próprio genoma, muitas vezes referido como o "genoma mitocondrial". O DNA encontrado dentro do cloroplasto pode ser referido como o "plastoma". Como as bactérias de onde se originaram, as mitocôndrias e os cloroplastos têm um cromossomo circular.
Ao contrário dos procariotos, onde a organização exon-intron de genes codificadores de proteínas existe, mas é bastante excepcional, os eucariotos geralmente têm essas características em seus genes e seus genomas contêm quantidades variáveis de DNA repetitivo. Em mamíferos e plantas, a maior parte do genoma é composta de DNA repetitivo. Genes em genomas eucarióticos podem ser anotados usando FINDER.
Sequenciamento de DNA
A tecnologia de alto rendimento torna o sequenciamento para montar novos genomas acessível a todos. Polimorfismos de sequência são normalmente descobertos comparando isolados resequenciados a uma referência, enquanto análises de profundidade de cobertura e topologia de mapeamento podem fornecer detalhes sobre variações estruturais, como translocações cromossômicas e duplicações segmentares.
Sequências de codificação
As sequências de DNA que carregam as instruções para produzir proteínas são chamadas de sequências codificadoras. A proporção do genoma ocupado por sequências de codificação varia amplamente. Um genoma maior não contém necessariamente mais genes, e a proporção de DNA não repetitivo diminui junto com o aumento do tamanho do genoma em eucariotos complexos.
Sequências não codificantes
Sequências não codificantes incluem íntrons, sequências para RNAs não codificantes, regiões regulatórias e DNA repetitivo. Sequências não codificantes compõem 98% do genoma humano. Existem duas categorias de DNA repetitivo no genoma: repetições em tandem e repetições intercaladas.
Repetições tandem
Sequências curtas e sem codificação que são repetidas de ponta a ponta são chamadas de repetições em tandem. Os microssatélites consistem em repetições de 2 a 5 pares de bases, enquanto as repetições de minissatélites são de 30 a 35 pb. As repetições em tandem constituem cerca de 4% do genoma humano e 9% do genoma da mosca-das-frutas. As repetições em tandem podem ser funcionais. Por exemplo, os telômeros são compostos pela repetição em tandem TTAGGG em mamíferos e desempenham um papel importante na proteção das extremidades do cromossomo.
Em outros casos, expansões no número de repetições em tandem em éxons ou íntrons podem causar doenças. Por exemplo, o gene huntingtin humano (Htt) normalmente contém 6-29 repetições em tandem dos nucleotídeos CAG (que codificam um trato de poliglutamina). Uma expansão para mais de 36 repetições resulta na doença de Huntington, uma doença neurodegenerativa. Sabe-se que vinte distúrbios humanos resultam de expansões semelhantes de repetição em tandem em vários genes. O mecanismo pelo qual as proteínas com tratos poligulatínicos expandidos causam a morte de neurônios não é totalmente compreendido. Uma possibilidade é que as proteínas não se dobram adequadamente e evitam a degradação, acumulando-se em agregados que também sequestram importantes fatores de transcrição, alterando assim a expressão gênica.
Repetições em tandem são geralmente causadas por deslizamento durante a replicação, cruzamento desigual e conversão de genes.
Elementos transponíveis
Elementos transponíveis (TEs) são sequências de DNA com uma estrutura definida que são capazes de mudar de localização no genoma. Os TEs são categorizados como um mecanismo que se replica por copiar e colar ou como um mecanismo que pode ser retirado do genoma e inserido em um novo local. No genoma humano, existem três classes importantes de TEs que compõem mais de 45% do DNA humano; essas classes são os elementos nucleares longos intercalados (LINEs), os elementos nucleares intercalados (SINEs) e os retrovírus endógenos. Esses elementos têm um grande potencial para modificar o controle genético em um organismo hospedeiro.
O movimento dos TEs é uma força motriz da evolução do genoma em eucariotos porque sua inserção pode interromper as funções dos genes, a recombinação homóloga entre os TEs pode produzir duplicações e o TE pode embaralhar éxons e sequências reguladoras para novos locais.
Retrotransposons
Os retrotransposons são encontrados principalmente em eucariotos, mas não são encontrados em procariotos e os retrotransposons formam uma grande porção dos genomas de muitos eucariotos. O retrotransposon é um elemento transponível que se transpõe através de um intermediário de RNA. Os retrotransposons são compostos de DNA, mas são transcritos em RNA para transposição, então o RNA transcrito é copiado de volta para a formação do DNA com a ajuda de uma enzima específica chamada transcriptase reversa. Os retrotransposons que carregam a transcriptase reversa em seu gene podem desencadear sua própria transposição, mas os genes que não possuem a transcriptase reversa devem usar a transcriptase reversa sintetizada por outro retrotransposon. Os retrotransposons podem ser transcritos em RNA, que são então duplicados em outro local do genoma. Os retrotransposons podem ser divididos em repetições terminais longas (LTRs) e repetições terminais não longas (Non-LTRs).
Repetições terminais longas (LTRs) são derivadas de infecções retrovirais antigas, então elas codificam proteínas relacionadas a proteínas retrovirais, incluindo gag (proteínas estruturais do vírus), pol (transcriptase reversa e integrase), pro (protease) e, em alguns casos, genes env (envelope). Esses genes são flanqueados por longas repetições em ambos os 5' e 3' termina. Foi relatado que os LTRs consistem na maior fração do genoma da maioria das plantas e podem ser responsáveis pela enorme variação no tamanho do genoma.
Repetições terminais não longas (Non-LTRs) são classificadas como elementos nucleares intercalados longos (LINEs), elementos nucleares intercalados curtos (SINEs) e elementos semelhantes a Penélope (PLEs). Em Dictyostelium discoideum, há outros elementos do tipo DIRS pertencentes a Não-LTRs. Não-LTRs são amplamente difundidos em genomas eucarióticos.
Elementos intercalados longos (LINEs) codificam genes para transcriptase reversa e endonuclease, tornando-os elementos transponíveis autônomos. O genoma humano tem cerca de 500.000 LINEs, ocupando cerca de 17% do genoma.
Elementos intercalados curtos (SINEs) geralmente têm menos de 500 pares de bases e não são autônomos, então eles dependem das proteínas codificadas por LINEs para transposição. O elemento Alu é o SINE mais comum encontrado em primatas. Tem cerca de 350 pares de bases e ocupa cerca de 11% do genoma humano com cerca de 1.500.000 cópias.
Transposons de DNA
Os transposons de DNA codificam uma enzima transposase entre repetições terminais invertidas. Quando expressa, a transposase reconhece as repetições invertidas terminais que flanqueiam o transposon e catalisa sua excisão e reinserção em um novo sítio. Este mecanismo recortar e colar normalmente reinsere os transposons perto de sua localização original (dentro de 100kb). Os transposons de DNA são encontrados em bactérias e constituem 3% do genoma humano e 12% do genoma da lombriga C. elegans.
Tamanho do genoma
O tamanho do genoma é o número total de pares de bases de DNA em uma cópia de um genoma haploide. O tamanho do genoma varia amplamente entre as espécies. Invertebrados têm genomas pequenos, isso também está relacionado a um pequeno número de elementos transponíveis. Peixes e anfíbios têm genomas de tamanho intermediário, e as aves têm genomas relativamente pequenos, mas foi sugerido que as aves perderam uma porção substancial de seus genomas durante a fase de transição para o vôo. Antes dessa perda, a metilação do DNA permite a expansão adequada do genoma.
Nos seres humanos, o genoma nuclear compreende aproximadamente 3,1 bilhões de nucleotídeos de DNA, divididos em 24 moléculas lineares, a mais curta com 45.000.000 nucleotídeos de comprimento e a mais longa com 248.000.000 nucleotídeos, cada uma contida em um cromossomo diferente. Não há correlação clara e consistente entre a complexidade morfológica e o tamanho do genoma em procariotos ou eucariotos inferiores. O tamanho do genoma é em grande parte uma função da expansão e contração de elementos repetitivos do DNA.
Como os genomas são muito complexos, uma estratégia de pesquisa é reduzir o número de genes em um genoma ao mínimo e ainda fazer com que o organismo em questão sobreviva. Há trabalho experimental sendo feito em genomas mínimos para organismos unicelulares, bem como genomas mínimos para organismos multicelulares (ver biologia do desenvolvimento). O trabalho é in vivo e in silico.
Diferenças de tamanho do genoma devido a elementos transponíveis
Existem muitas diferenças enormes de tamanho nos genomas, especialmente mencionadas anteriormente nos genomas eucarióticos multicelulares. Muito disso se deve às diferentes abundâncias de elementos transponíveis, que evoluem criando novas cópias de si mesmos nos cromossomos. Os genomas de eucariotos geralmente contêm muitos milhares de cópias desses elementos, a maioria dos quais adquiriu mutações que os tornam defeituosos. Aqui está uma tabela de alguns genomas significativos ou representativos. Consulte #Consulte também as listas de genomas sequenciados.
Tipo de organização | Organismo | Tamanho do genoma (paros de base) | Aprox. no. de genes | Nota | |
---|---|---|---|---|---|
Vírus | Porcino circovírus tipo 1 | 1,759 | 1.8 kB | Vírus mais pequenos replicando autônoma em células eucarióticas | |
Vírus | Bactéria MS2 | 3,569 | 3.6 kB | Primeira sequência RNA-genome | |
Vírus | SV40 | 5,224 | 5.2 kB | ||
Vírus | Phage Φ-X174 | 5,386 | 5.4 kB | Primeira sequência de DNA-genome | |
Vírus | HIV | 9,749 | 9,7 kB | ||
Vírus | Phage λ | 48,502 | 48.5 kB | Muitas vezes usado como um vetor para a clonagem de DNA recombinante | |
Vírus | Megavírus | 1.259,197 | 1.3 MB | Até 2013 o maior genoma viral conhecido | |
Vírus | Salinus Pandora | 2,470.000 | 2.47 MB | O maior genoma viral conhecido. | |
Organismo eucariótico | mitocondria humana | 16,569 | 16.6 kB | ||
Bacterium | Natura deltocephalinicola (strain NAS-ALF) | 112,091 | 112 kB | 137 | O genoma não-viral mais conhecido. Symbiont de folhetos. |
Bacterium | Revisão de Carson | 159,662 | 160 kB | Um endosymbiont de insetos psyllid | |
Bacterium | Anúncio grátis para sua empresa | 600.000 | 600 kB | Um endosymbiont de aphids | |
Bacterium | Condutor de velocidade | 700.000 | 700 kB | Um symbiont no intestino da mosca tsetse | |
Bacterium – cyanobacterium | Prochlorocococcus (1.7 Mb) | 1,700.000 | 1.7 MB | 1,884 | O genoma de cianobacterium mais conhecido. Um dos principais fotossintéticos da Terra. |
Bacterium | Influenza Humana | 1,830.000 | 1,8 MB | Primeiro genoma de um organismo vivo sequenciado, Julho 1995 | |
Bacterium | Escherichia coli | 4,600.000 | 4.6 MB | 4,288 | |
Bacterium – cyanobacterium | Produtos de plástico | 9,000,000 | 9 MB | 7,432 | 7432 quadros de leitura aberta |
Bacterium | Solibacter usitatus (Strain Ellin 6076) | 9,970,000 | 10 MB | ||
Amoebóide | Polichas dubium ("Amoeba" dubia) | 670.000. | 670 GB | O maior genoma conhecido. (Disputado) | |
Planta | Genlisea tuberosa | 61,000,000 | 61 MB | O genoma mais pequeno da planta de floração, 2014 | |
Planta | Arabidopsis thaliana | 135.000.000. | 135 MB | 27,655 | Primeiro genoma vegetal sequenciado, dezembro 2000 |
Planta | Populus trichocarpa | 480.000.000 | 480 MB | 73,013 | Primeiro genoma da árvore sequenciado, setembro 2006 |
Planta | Pinus taeda (Loblolly pine) | 22,180.000.000 | 22.18 GB | 50,172 | Ginnospermas geralmente têm genomas muito maiores do que angiospermas |
Planta | Fritillaria assyriaca | 130.000. | 130 GB | ||
Planta | Paris Japonica (Japonês-nativo, ordem Liliales) | 150.000. | 150 GB | O maior genoma da planta conhecido | |
Planta – musgo | Ficomitrella patens | 480.000.000 | 480 MB | Primeiro genoma de um bryophyte sequenciado, janeiro 2008 | |
Fungus – levedura | Produtos agrícolas | 12,100.000 | 12.1 MB | 6,294 | Primeiro genoma eucariótico sequenciado, 1996 |
Fungos | Aspergillus nidulans | 30.000.000 | 30 MB | 9,541 | |
Nemato. | Pratylenchus coffeae | 20.000.000 | 20 MB | Genoma animal mais pequeno conhecido | |
Nemato. | Caenorhabditis elegans | 100 mil. | 100 MB | 19.000 | Primeiro genoma multicelular animal sequenciado, Dezembro 1998 |
Inseto | Anártica da Bélgica (Antarctic midge) | 99,000,000 | 99 MB | O genoma de insetos mais pequeno sequenciado até agora, provavelmente uma adaptação a um ambiente extremo | |
Inseto | Drosophila melanogaster (voa de frutas) | 175.000.000. | 175 MB | 13.600 | Variação de tamanho baseada na tensão (175–180 Mb; padrão Tu... a tensão é 175 Mb) |
Inseto | Apis mellifera (Querida) | 236,000,000 | 236 MB | 10,157 | |
Inseto | Bombyx mori (Math) | 432,000,000 | 432 MB | 14,623 | 14.623 genes preditos |
Inseto | Solenopsis invicta - Não. | 480.000.000 | 480 MB | 16,569 | |
Crustacean | Krill da Antártida | 48,010.000.000 | 48 GB | 23.000 | 70-92% DNA repetitivo |
Amphibian | Dog de água do rio Neuse | 118,000,000,000 | 118 GB | O maior genoma tetrapod sequenciado a partir de 2022 | |
Amphibian | sapo tocas ornamentado | 1,060.000.000 | 1.06 GB | Genoma de sapo mais conhecido | |
Mamífero | Mus musculoso | 2,70.000 | 2.7 GB | 20,210 | |
Mamífero | Panisco | 3,286,640,000 | 3.3 GB | 20.000 | Bonobo – tamanho estimado do genoma 3,29 bilhões bp |
Mamífero | Homo sapiens | 3.117,000,000 | 3.1 GB | 20.000 | Homo sapiens tamanho do genoma estimado em 3.12 Gbp em 2022
Sequenciamento inicial e análise do genoma humano |
Pássaro | Gallus gallus | 1,043,000,000 | 1.0 GB | 20.000 | |
Peixe | Tetraodon nigroviridis (tipo de peixe puffer) | 385.000.000. | 390 MB | O genoma vertebrado mais pequeno conhecido, estimado em 340 Mb – 385 Mb | |
Peixe | Protopterus aethiopicus (marbled lungfish) | 130.000. | 130 GB | O maior genoma vertebrado conhecido |
Alterações genômicas
Todas as células de um organismo se originam de uma única célula, então espera-se que elas tenham genomas idênticos; no entanto, em alguns casos, surgem diferenças. Tanto o processo de cópia do DNA durante a divisão celular quanto a exposição a agentes mutagênicos ambientais podem resultar em mutações nas células somáticas. Em alguns casos, essas mutações levam ao câncer porque fazem com que as células se dividam mais rapidamente e invadam os tecidos circundantes. Em certos linfócitos do sistema imunológico humano, a recombinação V(D)J gera diferentes sequências genômicas, de modo que cada célula produz um anticorpo único ou receptores de células T.
Durante a meiose, as células diploides se dividem duas vezes para produzir células germinativas haploides. Durante esse processo, a recombinação resulta em um rearranjo do material genético dos cromossomos homólogos, de modo que cada gameta tenha um genoma único.
Reprogramação em todo o genoma
A reprogramação do genoma em células germinativas primordiais de camundongos envolve o apagamento da impressão epigenética levando à totipotência. A reprogramação é facilitada pela desmetilação ativa do DNA, um processo que envolve a via de reparo por excisão da base do DNA. Essa via é empregada no apagamento da metilação CpG (5mC) em células germinativas primordiais. A eliminação de 5mC ocorre por meio de sua conversão em 5-hidroximetilcitosina (5hmC) impulsionada por altos níveis das dez-onze enzimas dioxigenase TET1 e TET2.
Evolução do genoma
Os genomas são mais do que a soma dos genes de um organismo e possuem características que podem ser medidas e estudadas sem referência aos detalhes de quaisquer genes em particular e seus produtos. Os pesquisadores comparam características como cariótipo (número de cromossomos), tamanho do genoma, ordem do gene, viés de uso de códons e conteúdo GC para determinar quais mecanismos poderiam ter produzido a grande variedade de genomas que existem hoje (para visões gerais recentes, consulte Brown 2002; Saccone e Pesole 2003; Benfey e Protopapas 2004; Gibson e Muse 2004; Reese 2004; Gregory 2005).
As duplicações desempenham um papel importante na formação do genoma. A duplicação pode variar desde a extensão de repetições curtas em tandem até a duplicação de um agrupamento de genes e até a duplicação de cromossomos inteiros ou mesmo genomas inteiros. Tais duplicações são provavelmente fundamentais para a criação de novidades genéticas.
A transferência horizontal de genes é invocada para explicar como muitas vezes há uma semelhança extrema entre pequenas porções dos genomas de dois organismos que, de outra forma, são parentes muito distantes. A transferência horizontal de genes parece ser comum entre muitos micróbios. Além disso, as células eucarióticas parecem ter experimentado uma transferência de algum material genético de seus cloroplastos e genomas mitocondriais para seus cromossomos nucleares. Dados empíricos recentes sugerem um papel importante dos vírus e das redes de RNA subvirais para representar um papel principal na geração de novidades genéticas e edição natural do genoma.
Na ficção
Obras de ficção científica ilustram preocupações sobre a disponibilidade de sequências genômicas.
O romance de 1990 de Michael Crichton, Jurassic Park, e o filme subsequente contam a história de um bilionário que cria um parque temático de dinossauros clonados em uma ilha remota, com resultados desastrosos. Um geneticista extrai DNA de dinossauro do sangue de mosquitos antigos e preenche as lacunas com DNA de espécies modernas para criar várias espécies de dinossauros. Um teórico do caos é solicitado a dar sua opinião especializada sobre a segurança da engenharia de um ecossistema com os dinossauros, e ele adverte repetidamente que os resultados do projeto serão imprevisíveis e incontroláveis. Esses alertas sobre os perigos do uso de informações genômicas são um dos principais temas do livro.
O filme de 1997 Gattaca é ambientado em uma sociedade futurista onde os genomas de crianças são modificados para conter a combinação mais ideal da identidade de seus pais. traços e métricas, como risco de doença cardíaca e expectativa de vida prevista, são documentados para cada pessoa com base em seu genoma. Pessoas concebidas fora do programa de eugenia, conhecidas como "In-Valids" sofrem discriminação e são relegados a ocupações subalternas. O protagonista do filme é um inválido que trabalha para desafiar as supostas probabilidades genéticas e realizar seu sonho de trabalhar como navegador espacial. O filme adverte contra um futuro onde a informação genômica alimenta o preconceito e as diferenças extremas de classe entre aqueles que podem e não podem pagar por crianças geneticamente modificadas.
Contenido relacionado
Colágeno
Combustão espontânea (desambiguação)
Cardiologia
Osteoporose
Fator de crescimento