Gen

Ajustar Compartir Imprimir Citar

En biología, un gen (del griego genos , que significa generación, nacimiento o género) es una unidad básica de la herencia y una secuencia de nucleótidos en el ADN que codifica la síntesis de un producto génico, ya sea ARN o proteína.

Durante la expresión génica, el ADN se copia primero en ARN. El ARN puede ser directamente funcional o ser la plantilla intermedia de una proteína que realiza una función. La transmisión de genes a la descendencia de un organismo es la base de la herencia de los rasgos fenotípicos. Estos genes forman diferentes secuencias de ADN llamadas genotipos. Los genotipos junto con los factores ambientales y de desarrollo determinan cuáles serán los fenotipos. La mayoría de los rasgos biológicos están bajo la influencia de poligenes (muchos genes diferentes), así como de interacciones entre genes y medio ambiente. Algunos rasgos genéticos son visibles al instante, como el color de los ojos o el número de extremidades, y otros no, como el tipo de sangre, el riesgo de enfermedades específicas o los miles de procesos bioquímicos básicos que constituyen la vida.

Los genes pueden adquirir mutaciones en su secuencia, dando lugar a diferentes variantes, conocidas como alelos, en la población. Estos alelos codifican versiones ligeramente diferentes de una proteína, lo que provoca diferentes rasgos fenotípicos. El uso del término "tener un gen" (p. ej., "buenos genes", "gen del color del cabello") generalmente se refiere a contener un alelo diferente del mismo gen compartido. Los genes evolucionan debido a la selección natural/supervivencia del más apto y la deriva genética de los alelos.

El concepto de gen sigue perfeccionándose a medida que se descubren nuevos fenómenos. Por ejemplo, las regiones reguladoras de un gen pueden estar muy alejadas de sus regiones codificantes y las regiones codificantes pueden dividirse en varios exones. Algunos virus almacenan su genoma en ARN en lugar de ADN y algunos productos génicos son ARN no codificantes funcionales. Por lo tanto, una definición de trabajo amplia y moderna de un gen es cualquier locus discreto de secuencia genómica heredable que afecta los rasgos de un organismo al expresarse como un producto funcional o mediante la regulación de la expresión génica.

El término gen fue introducido por el botánico, fisiólogo vegetal y genetista danés Wilhelm Johannsen en 1909. Está inspirado en el griego antiguo: γόνος, gonos , que significa descendencia y procreación.

Historia

Descubrimiento de unidades heredadas discretas

Gregor Mendel (1822-1884) sugirió por primera vez la existencia de unidades heredables discretas. De 1857 a 1864, en Brno, Imperio austríaco (hoy República Checa), estudió los patrones de herencia en 8000 plantas de guisantes comestibles comunes, rastreando distintos rasgos de padres a hijos. Los describió matemáticamente como 2  combinaciones donde n es el número de características diferentes en los guisantes originales. Aunque no usó el término gen, explicó sus resultados en términos de unidades discretas heredadas que dan lugar a características físicas observables. Esta descripción prefiguró la distinción de Wilhelm Johannsen entre genotipo (el material genético de un organismo) y fenotipo (los rasgos observables de ese organismo). Mendel también fue el primero en demostrar la distribución independiente, la distinción entre rasgos dominantes y recesivos, la distinción entre heterocigoto y homocigoto, y el fenómeno de la herencia discontinua.

Antes del trabajo de Mendel, la teoría dominante de la herencia era la herencia combinada, que sugería que cada padre aportaba fluidos al proceso de fertilización y que los rasgos de los padres se combinaban y mezclaban para producir la descendencia. Charles Darwin desarrolló una teoría de la herencia que denominó pangénesis, del griego pan ("todo, todo") y génesis ("nacimiento") / genos ("origen"). Darwin usó el término gemmule para describir partículas hipotéticas que se mezclarían durante la reproducción.

El trabajo de Mendel pasó desapercibido en gran medida después de su primera publicación en 1866, pero fue redescubierto a fines del siglo XIX por Hugo de Vries, Carl Correns y Erich von Tschermak, quienes (afirmaron haber) llegado a conclusiones similares en su propia investigación. En concreto, en 1889, Hugo de Vries publicó su libro Pangénesis intracelular , en el que postulaba que los diferentes caracteres tienen portadores hereditarios individuales y que la herencia de rasgos específicos en los organismos viene en partículas. De Vries llamó a estas unidades "pangenes" ( Pangens en alemán), en honor a la teoría de la pangénesis de Darwin de 1868.

Veinte años más tarde, en 1909, Wilhelm Johannsen introdujo el término 'gen' y en 1906, William Bateson, el de 'genética' mientras que Eduard Strasburger, entre otros, todavía usaba el término 'pangene' para la unidad física y funcional fundamental de la herencia. .

Descubrimiento del ADN

Los avances en la comprensión de los genes y la herencia continuaron durante todo el siglo XX. Se demostró que el ácido desoxirribonucleico (ADN) es el depósito molecular de la información genética mediante experimentos en las décadas de 1940 y 1950. La estructura del ADN fue estudiada por Rosalind Franklin y Maurice Wilkins utilizando cristalografía de rayos X, lo que llevó a James D. Watson y Francis Crick a publicar un modelo de la molécula de ADN de doble cadena cuyas bases de nucleótidos emparejadas indicaron una hipótesis convincente para el mecanismo de replicación genética.

A principios de la década de 1950, la opinión predominante era que los genes de un cromosoma actuaban como entidades discretas, indivisibles por recombinación y dispuestos como cuentas en un hilo. Los experimentos de Benzer con mutantes defectuosos en la región rII del bacteriófago T4 (1955-1959) mostraron que los genes individuales tienen una estructura lineal simple y es probable que sean equivalentes a una sección lineal de ADN.

En conjunto, este cuerpo de investigación estableció el dogma central de la biología molecular, que establece que las proteínas se traducen a partir del ARN, que se transcribe a partir del ADN. Desde entonces, se ha demostrado que este dogma tiene excepciones, como la transcripción inversa en los retrovirus. El estudio moderno de la genética a nivel del ADN se conoce como genética molecular.

En 1972, Walter Fiers y su equipo fueron los primeros en determinar la secuencia de un gen: el de la proteína de cubierta del bacteriófago MS2. El desarrollo posterior de la secuenciación de ADN de terminación de cadena en 1977 por Frederick Sanger mejoró la eficiencia de la secuenciación y la convirtió en una herramienta de laboratorio de rutina. Se utilizó una versión automatizada del método Sanger en las primeras fases del Proyecto Genoma Humano.

La síntesis moderna y sus sucesores.

Las teorías desarrolladas a principios del siglo XX para integrar la genética mendeliana con la evolución darwiniana se denominan síntesis moderna, un término introducido por Julian Huxley.

Los biólogos evolutivos han modificado posteriormente este concepto, como la visión de la evolución centrada en los genes de George C. Williams. Propuso un concepto evolutivo del gen como unidad de selección natural con la definición: "aquello que se segrega y se recombina con una frecuencia apreciable". Desde este punto de vista, el gen molecular se transcribe como una unidad y el gen evolutivo hereda como una unidad. Richard Dawkins popularizó ideas relacionadas que enfatizan la centralidad de los genes en la evolución.

Base molecular

ADN

La gran mayoría de los organismos codifican sus genes en cadenas largas de ADN (ácido desoxirribonucleico). El ADN consta de una cadena formada por cuatro tipos de subunidades de nucleótidos, cada una compuesta por: un azúcar de cinco carbonos (2-desoxirribosa), un grupo fosfato y una de las cuatro bases adenina, citosina, guanina y timina.

Dos cadenas de ADN se retuercen entre sí para formar una doble hélice de ADN con el esqueleto de fosfato-azúcar en espiral alrededor del exterior y las bases apuntando hacia adentro con la base de adenina emparejada con la timina y la guanina con la citosina. La especificidad del emparejamiento de bases ocurre porque la adenina y la timina se alinean para formar dos enlaces de hidrógeno, mientras que la citosina y la guanina forman tres enlaces de hidrógeno. Las dos hebras en una doble hélice deben, por lo tanto, ser complementarias, con su secuencia de bases coincidente de modo que las adeninas de una hebra se apareen con las timinas de la otra hebra, y así sucesivamente.

Debido a la composición química de los residuos de pentosa de las bases, las cadenas de ADN tienen direccionalidad. Un extremo de un polímero de ADN contiene un grupo hidroxilo expuesto en la desoxirribosa; esto se conoce como el extremo 3' de la molécula. El otro extremo contiene un grupo fosfato expuesto; este es el extremo 5'. Las dos hebras de una doble hélice corren en direcciones opuestas. La síntesis de ácidos nucleicos, incluida la replicación y la transcripción del ADN, se produce en la dirección 5'→3', porque se añaden nuevos nucleótidos mediante una reacción de deshidratación que utiliza el hidroxilo 3' expuesto como nucleófilo.

La expresión de los genes codificados en el ADN comienza con la transcripción del gen en ARN, un segundo tipo de ácido nucleico que es muy similar al ADN, pero cuyos monómeros contienen el azúcar ribosa en lugar de la desoxirribosa. El ARN también contiene la base uracilo en lugar de timina. Las moléculas de ARN son menos estables que las de ADN y suelen ser monocatenarias. Los genes que codifican proteínas están compuestos por una serie de secuencias de tres nucleótidos llamadas codones, que sirven como "palabras" en el "lenguaje" genético. El código genético especifica la correspondencia durante la traducción de proteínas entre codones y aminoácidos. El código genético es casi el mismo para todos los organismos conocidos.

Cromosomas

El complemento total de genes en un organismo o célula se conoce como su genoma, que puede almacenarse en uno o más cromosomas. Un cromosoma consta de una sola hélice de ADN muy larga en la que se codifican miles de genes. La región del cromosoma en la que se encuentra un gen en particular se llama su locus. Cada locus contiene un alelo de un gen; sin embargo, los miembros de una población pueden tener diferentes alelos en el locus, cada uno con una secuencia genética ligeramente diferente.

La mayoría de los genes eucarióticos se almacenan en un conjunto de cromosomas grandes y lineales. Los cromosomas están empaquetados dentro del núcleo en complejos con proteínas de almacenamiento llamadas histonas para formar una unidad llamada nucleosoma. El ADN empaquetado y condensado de esta manera se llama cromatina. La forma en que el ADN se almacena en las histonas, así como las modificaciones químicas de la propia histona, regulan si una región particular del ADN es accesible para la expresión génica. Además de los genes, los cromosomas eucariotas contienen secuencias involucradas en asegurar que el ADN se copie sin degradación de las regiones finales y se clasifique en células hijas durante la división celular: orígenes de replicación, telómeros y centrómero.Los orígenes de replicación son las regiones de la secuencia donde se inicia la replicación del ADN para hacer dos copias del cromosoma. Los telómeros son tramos largos de secuencias repetitivas que tapan los extremos de los cromosomas lineales y evitan la degradación de las regiones codificantes y reguladoras durante la replicación del ADN. La longitud de los telómeros disminuye cada vez que se replica el genoma y se ha implicado en el proceso de envejecimiento. El centrómero es necesario para unir las fibras del huso para separar las cromátidas hermanas en células hijas durante la división celular.

Los procariotas (bacterias y arqueas) normalmente almacenan sus genomas en un solo cromosoma grande y circular. De manera similar, algunos orgánulos eucariotas contienen un cromosoma circular remanente con una pequeña cantidad de genes. Los procariotas a veces complementan su cromosoma con pequeños círculos adicionales de ADN llamados plásmidos, que generalmente codifican solo unos pocos genes y son transferibles entre individuos. Por ejemplo, los genes para la resistencia a los antibióticos generalmente están codificados en plásmidos bacterianos y pueden transmitirse entre células individuales, incluso entre las de diferentes especies, a través de la transferencia horizontal de genes.

Mientras que los cromosomas de los procariotas son relativamente densos en genes, los de los eucariotas a menudo contienen regiones de ADN que no tienen una función obvia. Los eucariotas unicelulares simples tienen cantidades relativamente pequeñas de dicho ADN, mientras que los genomas de los organismos multicelulares complejos, incluidos los humanos, contienen una mayoría absoluta de ADN sin una función identificada. Este ADN a menudo se ha denominado "ADN basura". Sin embargo, análisis más recientes sugieren que, aunque el ADN que codifica proteínas representa apenas el 2% del genoma humano, se puede expresar alrededor del 80% de las bases del genoma, por lo que el término "ADN basura" puede ser un nombre inapropiado.

Estructura y función

Estructura

La estructura de un gen consta de muchos elementos de los cuales la secuencia codificante de la proteína real suele ser solo una pequeña parte. Estos incluyen regiones de ADN que no se transcriben, así como regiones no traducidas del ARN.

Flanqueando el marco de lectura abierto, los genes contienen una secuencia reguladora que se requiere para su expresión. Primero, los genes requieren una secuencia promotora. El promotor es reconocido y unido por factores de transcripción que reclutan y ayudan a la ARN polimerasa a unirse a la región para iniciar la transcripción. El reconocimiento normalmente ocurre como una secuencia de consenso como la caja TATA. Un gen puede tener más de un promotor, lo que da como resultado ARN mensajeros (ARNm) que difieren en cuánto se extienden en el extremo 5'. Los genes altamente transcritos tienen secuencias promotoras "fuertes" que forman asociaciones fuertes con factores de transcripción, iniciando así la transcripción a un ritmo elevado. Otros genes tienen promotores "débiles" que forman asociaciones débiles con factores de transcripción e inician la transcripción con menos frecuencia.Las regiones promotoras eucariotas son mucho más complejas y difíciles de identificar que los promotores procariotas.

Además, los genes pueden tener regiones reguladoras muchas kilobases aguas arriba o aguas abajo del marco de lectura abierto que alteran la expresión. Éstos actúan al unirse a factores de transcripción que luego hacen que el ADN forme un bucle para que la secuencia reguladora (y el factor de transcripción unido) se acerque al sitio de unión de la ARN polimerasa. Por ejemplo, los potenciadores aumentan la transcripción al unirse a una proteína activadora que luego ayuda a reclutar la ARN polimerasa para el promotor; por el contrario, los silenciadores se unen a las proteínas represoras y hacen que el ADN esté menos disponible para la ARN polimerasa.

El pre-ARNm transcrito contiene regiones no traducidas en ambos extremos que contienen sitios de unión para ribosomas, proteínas de unión a ARN, miARN, así como terminadores y codones de inicio y finalización.Además, la mayoría de los marcos de lectura abiertos de eucariotas contienen intrones no traducidos, que se eliminan, y exones, que se conectan entre sí en un proceso conocido como empalme de ARN. Finalmente, los extremos de las transcripciones de genes se definen por sitios de escisión y poliadenilación (CPA), donde se escinde el pre-mRNA recién producido y se agrega una cadena de ~200 monofosfatos de adenosina en el extremo 3 '. La cola de poli(A) protege el ARNm maduro de la degradación y tiene otras funciones que afectan la traducción, localización y transporte de la transcripción desde el núcleo. El empalme, seguido de CPA, genera el ARNm maduro final, que codifica la proteína o el producto de ARN.Aunque se conocen los mecanismos generales que definen las ubicaciones de los genes humanos, la identificación de los factores exactos que regulan estos procesos celulares es un área de investigación activa. Por ejemplo, las características de secuencia conocidas en 3′-UTR solo pueden explicar la mitad de todos los extremos de genes humanos.

Muchos genes procarióticos están organizados en operones, con múltiples secuencias de codificación de proteínas que se transcriben como una unidad. Los genes en un operón se transcriben como un ARN mensajero continuo, denominado ARNm policistrónico. El término cistrón en este contexto es equivalente a gen. La transcripción del ARNm de un operón a menudo está controlada por un represor que puede ocurrir en un estado activo o inactivo dependiendo de la presencia de metabolitos específicos. Cuando está activo, el represor se une a una secuencia de ADN al principio del operón, llamada región operadora, y reprime la transcripción del operón; cuando el represor está inactivo, puede ocurrir la transcripción del operón (ver, por ejemplo, operón Lac). Los productos de los genes del operón suelen tener funciones relacionadas y están involucrados en la misma red reguladora.

Definiciones funcionales

Es difícil definir exactamente qué sección de una secuencia de ADN comprende un gen. Las regiones reguladoras de un gen, como los potenciadores, no necesariamente tienen que estar cerca de la secuencia codificante en la molécula lineal porque el ADN intermedio se puede enlazar para traer el gen y su región reguladora en la proximidad. De manera similar, los intrones de un gen pueden ser mucho más grandes que sus exones. Las regiones reguladoras pueden incluso estar en cromosomas completamente diferentes y operar en trans para permitir que las regiones reguladoras de un cromosoma entren en contacto con genes diana en otro cromosoma.

Los primeros trabajos en genética molecular sugirieron el concepto de que un gen produce una proteína. Este concepto (originalmente llamado hipótesis de un gen, una enzima) surgió de un influyente artículo de 1941 de George Beadle y Edward Tatum sobre experimentos con mutantes del hongo Neurospora crassa . Norman Horowitz, uno de los primeros colega en la investigación de Neurospora , recordó en 2004 que “estos experimentos fundaron la ciencia de lo que Beadle y Tatum llamaron genética bioquímica . En realidad, demostraron ser el arma inicial en lo que se convirtió en genética molecular y todos los desarrollos que siguieron a partir de eso”.El concepto de un gen-una proteína se ha perfeccionado desde el descubrimiento de genes que pueden codificar múltiples proteínas mediante empalmes alternativos y secuencias de codificación divididas en secciones cortas a lo largo del genoma cuyos ARNm se concatenan mediante transempalmes.

A veces se utiliza una definición operativa amplia para abarcar la complejidad de estos diversos fenómenos, donde un gen se define como una unión de secuencias genómicas que codifican un conjunto coherente de productos funcionales potencialmente superpuestos. Esta definición clasifica los genes por sus productos funcionales (proteínas o ARN) en lugar de sus loci de ADN específicos, con elementos reguladores clasificados como regiones asociadas a genes .

Superposición entre genes

También es posible que los genes se superpongan a la misma secuencia de ADN y se consideren genes distintos pero superpuestos. La definición actual de un gen superpuesto es diferente entre eucariotas, procariotas y virus. En eucariotas, se han definido recientemente como "cuando al menos un nucleótido se comparte entre los límites más externos de las transcripciones primarias de dos o más genes, de modo que una mutación de la base del ADN en el punto de superposición afectaría a las transcripciones de todos los genes involucrados en el superposición." En Prokaryotes and Viruses se han definido recientemente como "cuando las secuencias codificantes de dos genes comparten un nucleótido en la misma cadena o en cadenas opuestas".

La expresion genica

En todos los organismos, se requieren dos pasos para leer la información codificada en el ADN de un gen y producir la proteína que especifica. Primero, el ADN del gen se transcribe a ARN mensajero (ARNm). En segundo lugar, ese ARNm se traduce a proteína. Los genes que codifican ARN aún deben pasar por el primer paso, pero no se traducen en proteínas. El proceso de producir una molécula biológicamente funcional de ARN o proteína se denomina expresión génica, y la molécula resultante se denomina producto génico.

Codigo genetico

La secuencia de nucleótidos del ADN de un gen especifica la secuencia de aminoácidos de una proteína a través del código genético. Conjuntos de tres nucleótidos, conocidos como codones, cada uno corresponde a un aminoácido específico. El principio de que tres bases secuenciales de ADN codifican para cada aminoácido se demostró en 1961 usando mutaciones de cambio de marco en el gen rIIB del bacteriófago T4 (ver el experimento de Crick, Brenner et al.).

Además, un "codón de inicio" y tres "codones de finalización" indican el comienzo y el final de la región codificante de la proteína. Hay 64 codones posibles (cuatro nucleótidos posibles en cada una de las tres posiciones, por lo tanto, 4  codones posibles) y solo 20 aminoácidos estándar; por lo tanto, el código es redundante y múltiples codones pueden especificar el mismo aminoácido. La correspondencia entre codones y aminoácidos es casi universal entre todos los organismos vivos conocidos.

Transcripción

La transcripción produce una molécula de ARN monocatenario conocida como ARN mensajero, cuya secuencia de nucleótidos es complementaria al ADN del que se transcribió.El ARNm actúa como intermediario entre el gen de ADN y su producto proteico final. El ADN del gen se utiliza como molde para generar un ARNm complementario. El ARNm coincide con la secuencia de la hebra codificante del ADN del gen porque se sintetiza como el complemento de la hebra molde. La transcripción la realiza una enzima llamada ARN polimerasa, que lee la hebra plantilla en la dirección 3' a 5' y sintetiza el ARN de 5' a 3'. Para iniciar la transcripción, la polimerasa primero reconoce y se une a una región promotora del gen. Por lo tanto, un mecanismo importante de regulación génica es el bloqueo o secuestro de la región promotora, ya sea mediante la unión estrecha de moléculas represoras que bloquean físicamente la polimerasa o mediante la organización del ADN para que la región promotora no sea accesible.

En procariotas, la transcripción ocurre en el citoplasma; para transcripciones muy largas, la traducción puede comenzar en el extremo 5' del ARN mientras el extremo 3' aún se está transcribiendo. En los eucariotas, la transcripción ocurre en el núcleo, donde se almacena el ADN de la célula. La molécula de ARN producida por la polimerasa se conoce como transcrito primario y sufre modificaciones postranscripcionales antes de exportarse al citoplasma para su traducción. Una de las modificaciones realizadas es el empalme de intrones que son secuencias en la región transcrita que no codifican una proteína. Los mecanismos de corte y empalme alternativos pueden dar como resultado transcritos maduros del mismo gen que tienen secuencias diferentes y, por lo tanto, codifican proteínas diferentes. Esta es una forma importante de regulación en las células eucariotas y también ocurre en algunos procariotas.

Traducción

La traducción es el proceso mediante el cual una molécula de ARNm maduro se utiliza como molde para sintetizar una nueva proteína.La traducción la llevan a cabo los ribosomas, grandes complejos de ARN y proteínas responsables de llevar a cabo las reacciones químicas para agregar nuevos aminoácidos a una cadena polipeptídica en crecimiento mediante la formación de enlaces peptídicos. El código genético se lee tres nucleótidos a la vez, en unidades llamadas codones, a través de interacciones con moléculas de ARN especializadas llamadas ARN de transferencia (ARNt). Cada ARNt tiene tres bases desapareadas conocidas como anticodón que son complementarias al codón que lee en el ARNm. El tRNA también se une covalentemente al aminoácido especificado por el codón complementario. Cuando el ARNt se une a su codón complementario en una cadena de ARNm, el ribosoma une su carga de aminoácidos a la nueva cadena polipeptídica, que se sintetiza desde el extremo amino hasta el extremo carboxilo. Durante y después de la síntesis,

Regulación

Los genes están regulados para que se expresen solo cuando se necesita el producto, ya que la expresión se basa en recursos limitados. Una célula regula su expresión génica en función de su entorno externo (p. ej., nutrientes disponibles, temperatura y otras tensiones), su entorno interno (p. ej., ciclo de división celular, metabolismo, estado de infección) y su papel específico en un organismo multicelular. La expresión génica se puede regular en cualquier paso: desde el inicio transcripcional hasta el procesamiento del ARN y la modificación postraduccional de la proteína. La regulación de los genes del metabolismo de la lactosa en E. coli ( operón lac ) fue el primer mecanismo de este tipo que se describió en 1961.

Genes de ARN

Un gen codificador de proteínas típico se copia primero en ARN como intermediario en la fabricación del producto proteico final. En otros casos, las moléculas de ARN son los productos funcionales reales, como en la síntesis de ARN ribosómico y ARN de transferencia. Algunos ARN conocidos como ribozimas son capaces de realizar una función enzimática y el microARN tiene una función reguladora. Las secuencias de ADN a partir de las cuales se transcriben dichos ARN se conocen como genes de ARN no codificantes.

Algunos virus almacenan sus genomas completos en forma de ARN y no contienen ADN en absoluto. Debido a que utilizan el ARN para almacenar genes, sus anfitriones celulares pueden sintetizar sus proteínas tan pronto como se infectan y sin esperar la transcripción. Por otro lado, los retrovirus de ARN, como el VIH, requieren la transcripción inversa de su genoma de ARN a ADN antes de poder sintetizar sus proteínas. La herencia epigenética mediada por ARN también se ha observado en plantas y muy raramente en animales.

Herencia

Los organismos heredan sus genes de sus padres. Los organismos asexuales simplemente heredan una copia completa del genoma de sus padres. Los organismos sexuales tienen dos copias de cada cromosoma porque heredan un juego completo de cada padre.

Herencia mendeliana

De acuerdo con la herencia mendeliana, las variaciones en el fenotipo de un organismo (características físicas y de comportamiento observables) se deben en parte a variaciones en su genotipo (conjunto particular de genes). Cada gen especifica un rasgo particular con una secuencia diferente de un gen (alelos) que da lugar a diferentes fenotipos. La mayoría de los organismos eucariotas (como las plantas de guisantes en las que trabajó Mendel) tienen dos alelos para cada rasgo, uno heredado de cada padre.

Los alelos en un locus pueden ser dominantes o recesivos; los alelos dominantes dan lugar a sus fenotipos correspondientes cuando se emparejan con cualquier otro alelo para el mismo rasgo, mientras que los alelos recesivos dan lugar a su fenotipo correspondiente solo cuando se emparejan con otra copia del mismo alelo. Si conoce los genotipos de los organismos, puede determinar qué alelos son dominantes y cuáles son recesivos. Por ejemplo, si el alelo que especifica tallos altos en plantas de guisantes es dominante sobre el alelo que especifica tallos cortos, entonces las plantas de guisantes que heredan un alelo alto de un padre y un alelo corto del otro padre también tendrán tallos altos. El trabajo de Mendel demostró que los alelos se distribuyen de forma independiente en la producción de gametos o células germinales, lo que garantiza la variación en la siguiente generación.

Replicación del ADN y división celular.

El crecimiento, desarrollo y reproducción de los organismos se basa en la división celular; el proceso por el cual una sola célula se divide en dos células hijas generalmente idénticas. Esto requiere primero hacer una copia duplicada de cada gen en el genoma en un proceso llamado replicación de ADN.Las copias están hechas por enzimas especializadas conocidas como ADN polimerasas, que "lee" una hebra del ADN de doble hélice, conocida como hebra molde, y sintetiza una nueva hebra complementaria. Debido a que la doble hélice del ADN se mantiene unida por apareamiento de bases, la secuencia de una hebra especifica completamente la secuencia de su complemento; por lo tanto, la enzima solo necesita leer una hebra para producir una copia fiel. El proceso de replicación del ADN es semiconservador; es decir, la copia del genoma heredada por cada célula hija contiene una hebra de ADN original y otra recién sintetizada.

La tasa de replicación del ADN en células vivas se midió primero como la tasa de elongación del ADN T4 del fago en E. coli infectada con fago y se encontró que era impresionantemente rápida. Durante el período de aumento exponencial del ADN a 37 °C, la tasa de elongación fue de 749 nucleótidos por segundo.

Una vez completada la replicación del ADN, la célula debe separar físicamente las dos copias del genoma y dividirse en dos células distintas unidas a la membrana. En los procariotas (bacterias y arqueas), esto suele ocurrir a través de un proceso relativamente simple llamado fisión binaria, en el que cada genoma circular se adhiere a la membrana celular y se separa en las células hijas a medida que la membrana se invagina para dividir el citoplasma en dos porciones unidas a la membrana. . La fisión binaria es extremadamente rápida en comparación con las tasas de división celular en los eucariotas. La división de células eucariotas es un proceso más complejo conocido como ciclo celular; La replicación del ADN ocurre durante una fase de este ciclo conocida como fase S, mientras que el proceso de segregación de cromosomas y división del citoplasma ocurre durante la fase M.

Herencia molecular

La duplicación y transmisión de material genético de una generación de células a la siguiente es la base de la herencia molecular y el vínculo entre las imágenes clásica y molecular de los genes. Los organismos heredan las características de sus padres porque las células de la descendencia contienen copias de los genes en las células de sus padres. En los organismos que se reproducen asexualmente, la descendencia será una copia o clon genético del organismo progenitor. En los organismos que se reproducen sexualmente, una forma especializada de división celular llamada meiosis produce células llamadas gametos o células germinales que son haploides o contienen solo una copia de cada gen.Los gametos producidos por las hembras se denominan óvulos u óvulos, y los producidos por los machos se denominan espermatozoides. Dos gametos se fusionan para formar un óvulo fertilizado diploide, una sola célula que tiene dos juegos de genes, con una copia de cada gen de la madre y otra del padre.

Durante el proceso de división celular meiótica, a veces puede ocurrir un evento llamado recombinación genética o entrecruzamiento , en el que una longitud de ADN en una cromátida se intercambia con una longitud de ADN en la cromátida no hermana homóloga correspondiente. Esto puede resultar en una reorganización de alelos vinculados de otro modo.El principio mendeliano de la distribución independiente afirma que cada uno de los dos genes de un progenitor para cada rasgo se clasificará de forma independiente en los gametos; qué alelo hereda un organismo para un rasgo no está relacionado con qué alelo hereda para otro rasgo. De hecho, esto solo es cierto para los genes que no residen en el mismo cromosoma o que están ubicados muy lejos unos de otros en el mismo cromosoma. Cuanto más cerca estén dos genes en el mismo cromosoma, más estrechamente estarán asociados en los gametos y más a menudo aparecerán juntos (lo que se conoce como enlace genético). Los genes que están muy cerca esencialmente nunca se separan porque es extremadamente improbable que ocurra un punto de cruce entre ellos.

Evolución molecular

Mutación

La replicación del ADN es en su mayor parte extremadamente precisa, sin embargo, se producen errores (mutaciones). La tasa de error en las células eucariotas puede ser tan baja como 10 por nucleótido por replicación, mientras que para algunos virus de ARN puede ser tan alta como 10 . Esto significa que cada generación, cada genoma humano acumula 1-2 nuevas mutaciones. Las pequeñas mutaciones pueden ser causadas por la replicación del ADN y las secuelas del daño del ADN e incluyen mutaciones puntuales en las que se altera una sola base y mutaciones de cambio de marco en las que se inserta o elimina una sola base. Cualquiera de estas mutaciones puede cambiar el gen por sentido erróneo (cambiar un codón para codificar un aminoácido diferente) o sin sentido (un codón de parada prematuro).Las mutaciones más grandes pueden ser causadas por errores en la recombinación para causar anomalías cromosómicas, incluida la duplicación, eliminación, reordenamiento o inversión de grandes secciones de un cromosoma. Además, los mecanismos de reparación del ADN pueden introducir errores mutacionales al reparar el daño físico de la molécula. La reparación, incluso con mutación, es más importante para la supervivencia que restaurar una copia exacta, por ejemplo, cuando se reparan roturas de doble cadena.

Cuando varios alelos diferentes para un gen están presentes en la población de una especie, se denomina polimórfico. La mayoría de los alelos diferentes son funcionalmente equivalentes, sin embargo, algunos alelos pueden dar lugar a diferentes rasgos fenotípicos. El alelo más común de un gen se llama tipo salvaje y los alelos raros se llaman mutantes. La variación genética en las frecuencias relativas de diferentes alelos en una población se debe tanto a la selección natural como a la deriva genética. El alelo de tipo salvaje no es necesariamente el ancestro de alelos menos comunes, ni es necesariamente más apto.

La mayoría de las mutaciones dentro de los genes son neutras y no tienen efecto sobre el fenotipo del organismo (mutaciones silenciosas). Algunas mutaciones no cambian la secuencia de aminoácidos porque múltiples codones codifican el mismo aminoácido (mutaciones sinónimas). Otras mutaciones pueden ser neutrales si conducen a cambios en la secuencia de aminoácidos, pero la proteína aún funciona de manera similar con el nuevo aminoácido (p. ej., mutaciones conservadoras). Sin embargo, muchas mutaciones son perjudiciales o incluso letales y se eliminan de las poblaciones por selección natural. Los trastornos genéticos son el resultado de mutaciones deletéreas y pueden deberse a una mutación espontánea en el individuo afectado o pueden ser hereditarios. Finalmente, una pequeña fracción de las mutaciones son beneficiosas, mejoran la aptitud del organismo y son extremadamente importantes para la evolución.

Homología de secuencia

Los genes con un ancestro común más reciente y, por lo tanto, una ascendencia evolutiva compartida, se conocen como homólogos. Estos genes aparecen a partir de la duplicación de genes dentro del genoma de un organismo, donde se conocen como genes parálogos, o son el resultado de la divergencia de los genes después de un evento de especiación, donde se conocen como genes ortólogos y, a menudo, realizan funciones iguales o similares. en organismos relacionados. A menudo se supone que las funciones de los genes ortólogos son más similares que las de los genes parálogos, aunque la diferencia es mínima.

La relación entre genes se puede medir comparando la alineación de secuencias de su ADN. El grado de similitud de secuencia entre genes homólogos se denomina secuencia conservada. La mayoría de los cambios en la secuencia de un gen no afectan su función, por lo que los genes acumulan mutaciones con el tiempo por evolución molecular neutral. Además, cualquier selección en un gen hará que su secuencia diverja a un ritmo diferente. Los genes bajo selección estabilizadora están restringidos y, por lo tanto, cambian más lentamente, mientras que los genes bajo selección direccional cambian de secuencia más rápidamente. Las diferencias de secuencia entre genes se pueden usar para análisis filogenéticos para estudiar cómo han evolucionado esos genes y cómo se relacionan los organismos de los que provienen.

Orígenes de nuevos genes.

La fuente más común de nuevos genes en los linajes eucarióticos es la duplicación de genes, que crea una variación en el número de copias de un gen existente en el genoma. Los genes resultantes (parálogos) pueden entonces divergir en secuencia y función. Los conjuntos de genes formados de esta manera componen una familia de genes. Las duplicaciones y pérdidas de genes dentro de una familia son comunes y representan una fuente importante de biodiversidad evolutiva. A veces, la duplicación de genes puede resultar en una copia no funcional de un gen, o una copia funcional puede estar sujeta a mutaciones que resultan en la pérdida de la función; estos genes no funcionales se denominan pseudogenes.

Los genes "huérfanos", cuya secuencia no muestra similitud con los genes existentes, son menos comunes que los genes duplicados. El genoma humano contiene un estimado de 18 a 60 genes sin homólogos identificables fuera de los humanos. Los genes huérfanos surgen principalmente de la aparición de novo de una secuencia previamente no codificante o de la duplicación de genes seguida de un cambio de secuencia tan rápido que la relación original se vuelve indetectable. Los genes de novo suelen tener una estructura más corta y simple que la mayoría de los genes eucariotas, con pocos o ningún intrón. Durante largos períodos de tiempo evolutivo, el nacimiento de genes de novo puede ser responsable de una fracción significativa de familias de genes restringidas taxonómicamente.

La transferencia horizontal de genes se refiere a la transferencia de material genético a través de un mecanismo distinto de la reproducción. Este mecanismo es una fuente común de nuevos genes en procariotas, a veces se piensa que contribuye más a la variación genética que a la duplicación de genes. Es un medio común de propagar la resistencia a los antibióticos, la virulencia y las funciones metabólicas adaptativas. Aunque la transferencia horizontal de genes es rara en eucariotas, se han identificado ejemplos probables de genomas de protistas y algas que contienen genes de origen bacteriano.

Genoma

El genoma es el material genético total de un organismo e incluye tanto los genes como las secuencias no codificantes. Los genes eucarióticos se pueden anotar utilizando FINDER.

Número de genes

El tamaño del genoma y la cantidad de genes que codifica varían ampliamente entre organismos. Los genomas más pequeños ocurren en virus y viroides (que actúan como un solo gen de ARN no codificante). Por el contrario, las plantas pueden tener genomas extremadamente grandes, y el arroz contiene más de 46 000 genes que codifican proteínas. Se estima que el número total de genes que codifican proteínas (el proteoma de la Tierra) es de 5 millones de secuencias.

Aunque la cantidad de pares de bases de ADN en el genoma humano se conoce desde la década de 1960, la cantidad estimada de genes ha cambiado con el tiempo a medida que las definiciones de genes y los métodos para detectarlos se han perfeccionado. Las predicciones teóricas iniciales del número de genes humanos llegaron a 2.000.000. Las primeras medidas experimentales indicaron que había entre 50 000 y 100 000 genes transcritos (etiquetas de secuencia expresada). Posteriormente, la secuenciación en el Proyecto del Genoma Humano indicó que muchas de estas transcripciones eran variantes alternativas de los mismos genes, y el número total de genes que codifican proteínas se redujo a ~20 000 con 13 genes codificados en el genoma mitocondrial. Con el proyecto de anotación GENCODE, esa estimación ha seguido cayendo a 19.000.Del genoma humano, solo el 1-2% consta de secuencias codificantes de proteínas, y el resto es ADN "no codificante", como intrones, retrotransposones y ARN no codificantes. Todo organismo multicelular tiene todos sus genes en cada célula de su cuerpo, pero no todos los genes funcionan en todas las células.

Genes esenciales

Los genes esenciales son el conjunto de genes que se cree que son críticos para la supervivencia de un organismo. Esta definición asume la disponibilidad abundante de todos los nutrientes relevantes y la ausencia de estrés ambiental. Solo una pequeña porción de los genes de un organismo son esenciales. En las bacterias, se estima que entre 250 y 400 genes son esenciales para Escherichia coli y Bacillus subtilis , lo que representa menos del 10 % de sus genes. La mitad de estos genes son ortólogos en ambos organismos y están implicados en gran medida en la síntesis de proteínas. En la levadura en ciernes Saccharomyces cerevisiae , el número de genes esenciales es ligeramente mayor, 1000 genes (~20% de sus genes).Aunque el número es más difícil de medir en eucariotas superiores, se estima que los ratones y los humanos tienen alrededor de 2000 genes esenciales (~10% de sus genes). El organismo sintético, Syn 3 , tiene un genoma mínimo de 473 genes esenciales y cuasi-esenciales (necesarios para un rápido crecimiento), aunque 149 tienen una función desconocida.

Los genes esenciales incluyen genes domésticos (críticos para las funciones celulares básicas) , así como genes que se expresan en diferentes momentos del desarrollo o ciclo de vida de los organismos. Los genes domésticos se utilizan como controles experimentales cuando se analiza la expresión génica, ya que se expresan constitutivamente a un nivel relativamente constante.

Nomenclatura genética y genómica

La nomenclatura de genes ha sido establecida por el Comité de Nomenclatura de Genes de HUGO (HGNC), un comité de la Organización del Genoma Humano, para cada gen humano conocido en forma de un nombre de gen aprobado y símbolo (abreviatura de formato corto), al que se puede acceder a través de una base de datos mantenida por HGNC. Los símbolos se eligen para que sean únicos y cada gen tiene un solo símbolo (aunque los símbolos aprobados a veces cambian). Preferiblemente, los símbolos se mantienen coherentes con otros miembros de una familia de genes y con homólogos en otras especies, particularmente el ratón debido a su papel como organismo modelo común.

Ingeniería genética

La ingeniería genética es la modificación del genoma de un organismo a través de la biotecnología. Desde la década de 1970, se han desarrollado una variedad de técnicas para agregar, eliminar y editar genes específicamente en un organismo. Las técnicas de ingeniería del genoma desarrolladas recientemente utilizan enzimas nucleasas diseñadas para crear una reparación de ADN específica en un cromosoma para interrumpir o editar un gen cuando se repara la ruptura. El término relacionado biología sintética a veces se usa para referirse a la ingeniería genética extensiva de un organismo.

La ingeniería genética es ahora una herramienta de investigación de rutina con organismos modelo. Por ejemplo, los genes se agregan fácilmente a las bacterias y los linajes de ratones knockout con la función de un gen específico interrumpida se utilizan para investigar la función de ese gen. Muchos organismos han sido modificados genéticamente para aplicaciones en agricultura, biotecnología industrial y medicina.

En el caso de los organismos multicelulares, normalmente se manipula el embrión que crece hasta convertirse en el organismo modificado genéticamente adulto. Sin embargo, los genomas de las células de un organismo adulto se pueden editar utilizando técnicas de terapia génica para tratar enfermedades genéticas.