Intrón

Compartir Imprimir Citar

Un intrón (abreviatura de región intragénica) es cualquier secuencia de nucleótidos dentro de un gen que se elimina mediante empalme de ARN durante la maduración del producto de ARN final. En otras palabras, los intrones son regiones no codificantes de un transcrito de ARN, o del ADN que lo codifica, que se eliminan mediante corte y empalme antes de la traducción. La palabra intrón se deriva del término región intragénica , es decir, una región dentro de un gen. El término intrón se refiere tanto a la secuencia de ADN dentro de un gen como a la secuencia correspondiente en las transcripciones de ARN. Las secuencias que se unen en el ARN maduro final después del empalme del ARN son exones.

Los intrones se encuentran en los genes de la mayoría de los organismos y muchos virus y se pueden ubicar en una amplia gama de genes, incluidos los que generan proteínas, ARN ribosómico (ARNr) y ARN de transferencia (ARNt). Cuando las proteínas se generan a partir de genes que contienen intrones, el empalme del ARN tiene lugar como parte de la vía de procesamiento del ARN que sigue a la transcripción y precede a la traducción.

Descubrimiento y etimología

Los intrones se descubrieron por primera vez en genes que codifican proteínas de adenovirus y, posteriormente, se identificaron en genes que codifican genes de ARN de transferencia y ARN ribosomal. Ahora se sabe que los intrones se encuentran dentro de una amplia variedad de genes en todos los organismos, bacterias y virus dentro de todos los reinos biológicos.

El hecho de que los genes fueran divididos o interrumpidos por los intrones fue descubierto de forma independiente en 1977 por Phillip Allen Sharp y Richard J. Roberts, por lo que compartieron el Premio Nobel de Fisiología o Medicina en 1993. El término intrón fue introducido por el bioquímico estadounidense Walter Gilbert:

"La noción de cistrón [es decir, gen]... debe ser reemplazada por la de una unidad de transcripción que contiene regiones que se perderán del mensajero maduro, que sugiero que llamemos intrones (por regiones intragénicas), alternando con regiones que se expresará – exones". (Gilbert 1978)

El término intrón también se refiere a intracistrón, es decir, una pieza adicional de ADN que surge dentro de un cistrón.

Aunque los intrones a veces se denominan secuencias intermedias, el término "secuencia intermedia" puede referirse a cualquiera de varias familias de secuencias internas de ácidos nucleicos que no están presentes en el producto génico final, incluidas las inteínas, las regiones no traducidas (UTR) y los nucleótidos eliminados por el ARN. edición, además de intrones.

Distribución

Se observa que la frecuencia de intrones dentro de diferentes genomas varía ampliamente a lo largo del espectro de organismos biológicos. Por ejemplo, los intrones son extremadamente comunes dentro del genoma nuclear de los vertebrados con mandíbula (por ejemplo, humanos y ratones), donde los genes codificadores de proteínas casi siempre contienen múltiples intrones, mientras que los intrones son raros dentro de los genes nucleares de algunos microorganismos eucariotas, por ejemplo, panadero/cervecero. levadura (Saccharomyces cerevisiae). Por el contrario, los genomas mitocondriales de los vertebrados carecen por completo de intrones, mientras que los de los microorganismos eucariotas pueden contener muchos intrones.

Un caso particularmente extremo es el gen dhc7 de Drosophila que contiene un intrón de ≥3,6 megabases (Mb), que tarda aproximadamente tres días en transcribirse. En el otro extremo, un estudio reciente sugiere que el intrón metazoario más corto conocido es de 30 pares de bases (pb) pertenecientes al gen MST1L humano. Los intrones más cortos conocidos pertenecen a los ciliados heterótricos, como Stentor coeruleus, en el que la mayoría (> 95%) de los intrones tienen 15 o 16 pb de longitud.

Clasificación

El empalme de todas las moléculas de ARN que contienen intrones es superficialmente similar, como se describe anteriormente. Sin embargo, se identificaron diferentes tipos de intrones mediante el examen de la estructura del intrón mediante el análisis de la secuencia de ADN, junto con el análisis genético y bioquímico de las reacciones de corte y empalme del ARN.

Se han identificado al menos cuatro clases distintas de intrones:

Se propone que los intrones del grupo III sean una quinta familia, pero se sabe poco sobre el aparato bioquímico que media su empalme. Parecen estar relacionados con los intrones del grupo II y posiblemente con los intrones del espliceosoma.

Intrones spliceosomales

Los intrones pre-ARNm nucleares (intrones spliceosomales) se caracterizan por secuencias de intrones específicas ubicadas en los límites entre intrones y exones. Estas secuencias son reconocidas por moléculas de ARN esplicosomal cuando se inician las reacciones de empalme. Además, contienen un punto de ramificación, una secuencia de nucleótidos particular cerca del extremo 3' del intrón que se une covalentemente al extremo 5' del intrón durante el proceso de corte y empalme, generando un intrón ramificado (lariat). Aparte de estos tres elementos conservados brevemente, las secuencias de intrones de pre-ARNm nuclear son muy variables. Los intrones de pre-ARNm nuclear suelen ser mucho más largos que los exones que los rodean.

Intrones de ARNt

Los intrones de ARN de transferencia que dependen de las proteínas para su eliminación se producen en una ubicación específica dentro del bucle del anticodón de los precursores de ARNt no empalmados y son eliminados por una endonucleasa de empalme de ARNt. Luego, los exones se unen entre sí mediante una segunda proteína, la ligasa de empalme de ARNt. Tenga en cuenta que los intrones de autoempalme también se encuentran a veces dentro de los genes de ARNt.

Intrones del grupo I y del grupo II

Los intrones del grupo I y del grupo II se encuentran en genes que codifican proteínas (ARN mensajero), ARN de transferencia y ARN ribosómico en una amplia gama de organismos vivos. Después de la transcripción en ARN, los intrones del grupo I y del grupo II también realizan amplias interacciones internas que permiten para plegarse en una arquitectura tridimensional específica y compleja. Estas arquitecturas complejas permiten que algunos intrones del grupo I y del grupo II se auto empalmen, es decir, la molécula de ARN que contiene el intrón puede reorganizar su propia estructura covalente para eliminar con precisión el intrón y unir los exones en el orden correcto. En algunos casos, determinadas proteínas de unión a intrones están involucradas en el empalme, actuando de tal manera que ayudan al intrón a plegarse en la estructura tridimensional que es necesaria para la actividad de autoempalme. Los intrones del grupo I y del grupo II se distinguen por diferentes conjuntos de secuencias internas conservadas y estructuras plegadas, y por el hecho de que el corte y empalme de moléculas de ARN que contienen intrones del grupo II genera intrones ramificados (como los de los ARN esplicosomal), mientras que los intrones del grupo I usan un intrón no nucleótido de guanosina codificado (típicamente GTP) para iniciar el corte y empalme, agregándolo al extremo 5' del intrón extirpado.

Funciones biológicas y evolución.

Si bien los intrones no codifican productos proteicos, son parte integral de la regulación de la expresión génica. Algunos intrones mismos codifican ARN funcionales a través de un procesamiento adicional después del empalme para generar moléculas de ARN no codificantes. El empalme alternativo se usa ampliamente para generar múltiples proteínas a partir de un solo gen. Además, algunos intrones desempeñan funciones esenciales en una amplia gama de funciones reguladoras de la expresión génica, como la descomposición mediada por tonterías y la exportación de ARNm.

Los orígenes biológicos de los intrones son oscuros. Después del descubrimiento inicial de los intrones en los genes codificadores de proteínas del núcleo eucariótico, hubo un debate significativo sobre si los intrones en los organismos modernos se heredaron de un ancestro antiguo común (denominado hipótesis temprana de los intrones), o si aparecieron en genes bastante recientemente en el proceso evolutivo (denominada la hipótesis de los intrones tardíos). Otra teoría es que el empalmeosoma y la estructura intrón-exón de los genes es una reliquia del mundo del ARN (la hipótesis de los intrones primero). Todavía existe un debate considerable sobre hasta qué punto cuál de estas hipótesis es la más correcta. El consenso popular en este momento es que los intrones surgieron dentro del linaje eucariota como elementos egoístas.

Los primeros estudios de secuencias de ADN genómico de una amplia gama de organismos muestran que la estructura intrón-exón de genes homólogos en diferentes organismos puede variar ampliamente. Estudios más recientes de genomas eucarióticos completos ahora han demostrado que las longitudes y la densidad (intrones/gen) de los intrones varían considerablemente entre especies relacionadas. Por ejemplo, mientras que el genoma humano contiene una media de 8,4 intrones/gen (139.418 en el genoma), el hongo unicelular Encephalitozoon cuniculi contiene sólo 0,0075 intrones/gen (15 intrones en el genoma). Dado que los eucariotas surgieron de un ancestro común (descendencia común), debe haber una gran ganancia o pérdida de intrones durante el tiempo evolutivo.Se cree que este proceso está sujeto a la selección, con una tendencia hacia la ganancia de intrones en las especies más grandes debido a sus tamaños de población más pequeños, y lo contrario en las especies más pequeñas (particularmente unicelulares). Los factores biológicos también influyen en qué genes de un genoma pierden o acumulan intrones.

El empalme alternativo de exones dentro de un gen después de la escisión del intrón actúa para introducir una mayor variabilidad de secuencias de proteínas traducidas de un solo gen, lo que permite generar múltiples proteínas relacionadas a partir de un solo gen y una sola transcripción de ARNm precursor. El control del empalme alternativo del ARN lo realiza una red compleja de moléculas de señalización que responden a una amplia gama de señales intracelulares y extracelulares.

Los intrones contienen varias secuencias cortas que son importantes para un empalme eficiente, como sitios aceptores y donantes en cualquier extremo del intrón, así como un sitio de punto de ramificación, que son necesarios para el empalme adecuado por parte del spliceosoma. Se sabe que algunos intrones mejoran la expresión del gen en el que están contenidos mediante un proceso conocido como mejora mediada por intrones (IME).

Las regiones de ADN transcritas activamente forman con frecuencia bucles R que son vulnerables al daño del ADN. En genes de levadura altamente expresados, los intrones inhiben la formación de bucles R y la aparición de daños en el ADN. El análisis de todo el genoma tanto en levaduras como en seres humanos reveló que los genes que contienen intrones han disminuido los niveles de bucle R y han disminuido el daño en el ADN en comparación con los genes sin intrones de expresión similar. La inserción de un intrón dentro de un gen propenso al bucle R también puede suprimir la formación y recombinación del bucle R. Bonnet et al. (2017) especularon que la función de los intrones para mantener la estabilidad genética puede explicar su mantenimiento evolutivo en ciertos lugares, particularmente en genes altamente expresados.

Adaptación al hambre

La presencia física de intrones promueve la resistencia celular a la inanición a través de la represión mejorada por intrones de los genes de proteínas ribosómicas de las vías de detección de nutrientes.

Como elementos genéticos móviles

Los intrones pueden perderse o ganarse a lo largo del tiempo evolutivo, como lo muestran muchos estudios comparativos de genes ortólogos. Los análisis posteriores han identificado miles de ejemplos de eventos de pérdida y ganancia de intrones, y se ha propuesto que la aparición de eucariotas, o las etapas iniciales de la evolución eucariota, involucraron una invasión de intrones. Se han identificado dos mecanismos definitivos de pérdida de intrones, pérdida de intrones mediada por transcriptasa inversa (RTMIL) y deleciones genómicas, y se sabe que ocurren.Sin embargo, los mecanismos definitivos de la ganancia de intrones siguen siendo esquivos y controvertidos. Hasta el momento se han informado al menos siete mecanismos de ganancia de intrones: transposición de intrones, inserción de transposones, duplicación genómica en tándem, transferencia de intrones, ganancia de intrones durante la reparación de roturas de doble cadena (DSBR), inserción de un intrón del grupo II e intronización. En teoría, debería ser más fácil deducir el origen de los intrones obtenidos recientemente debido a la falta de mutaciones inducidas por el huésped, pero incluso los intrones obtenidos recientemente no surgieron de ninguno de los mecanismos antes mencionados. Por lo tanto, estos hallazgos plantean la cuestión de si los mecanismos propuestos de ganancia de intrones no logran describir el origen mecánico de muchos intrones nuevos porque no son mecanismos precisos de ganancia de intrones, o si hay otros procesos, aún por descubrir, que generan nuevos intrones. intrones.

En la transposición de intrones, el mecanismo de ganancia de intrones más comúnmente pretendido, se cree que un intrón empalmado invierte el empalme en su propio ARNm o en otro ARNm en una posición previamente sin intrones. Este ARNm que contiene intrones luego se transcribe de manera inversa y el ADNc que contiene intrones resultante puede causar la ganancia de intrones a través de una recombinación completa o parcial con su locus genómico original. Las inserciones de transposones también pueden dar como resultado la creación de intrones. Tal inserción podría intronizar el transposón sin interrumpir la secuencia de codificación cuando un transposón se inserta en la secuencia AGGT, lo que da como resultado la duplicación de esta secuencia en cada lado del transposón. Aún no se comprende por qué estos elementos se empalman, ya sea por casualidad o por alguna acción preferencial del transposón. Duplicación genómica en tándem, Debido a la similitud entre los sitios de empalme donantes y aceptores de consenso, que se parecen mucho a AGGT, la duplicación genómica en tándem de un segmento exónico que alberga una secuencia AGGT genera dos sitios de empalme potenciales. Cuando el spliceosoma lo reconozca, la secuencia entre el AGGT original y el duplicado se empalmará, dando como resultado la creación de un intrón sin alteración de la secuencia codificante del gen. La reparación de roturas de doble cadena a través de la unión de extremos no homólogos se identificó recientemente como una fuente de ganancia de intrones cuando los investigadores identificaron repeticiones directas cortas que flanquean el 43 % de los intrones ganados en Daphnia. la secuencia entre el AGGT original y el duplicado se empalmará, dando como resultado la creación de un intrón sin alteración de la secuencia codificante del gen. La reparación de roturas de doble cadena a través de la unión de extremos no homólogos se identificó recientemente como una fuente de ganancia de intrones cuando los investigadores identificaron repeticiones directas cortas que flanquean el 43 % de los intrones ganados en Daphnia. la secuencia entre el AGGT original y el duplicado se empalmará, dando como resultado la creación de un intrón sin alteración de la secuencia codificante del gen. La reparación de roturas de doble cadena a través de la unión de extremos no homólogos se identificó recientemente como una fuente de ganancia de intrones cuando los investigadores identificaron repeticiones directas cortas que flanquean el 43 % de los intrones ganados en Daphnia.Sin embargo, estos números deben compararse con el número de intrones conservados flanqueados por repeticiones en otros organismos, por relevancia estadística. Para la inserción del intrón del grupo II, se propuso el retrohoming de un intrón del grupo II en un gen nuclear para causar una ganancia de intrón empalmeosomal reciente.

Se ha planteado la hipótesis de que la transferencia de intrones da como resultado una ganancia de intrones cuando un parálogo o un pseudogen gana un intrón y luego transfiere este intrón a través de la recombinación a una ubicación sin intrones en su parálogo hermano. La intronización es el proceso por el cual las mutaciones crean nuevos intrones a partir de una secuencia anteriormente exónica. Por tanto, a diferencia de otros mecanismos propuestos de ganancia de intrones, este mecanismo no requiere la inserción o generación de ADN para crear un nuevo intrón.

El único mecanismo hipotético de ganancia reciente de intrones que carece de evidencia directa es el de la inserción de intrones del grupo II, que cuando se demuestra in vivo, suprime la expresión génica. Por lo tanto, es probable que los intrones del grupo II sean los presuntos ancestros de los intrones esplicosomales, que actúan como retroelementos específicos del sitio y ya no son responsables de la ganancia de intrones. La duplicación genómica en tándem es el único mecanismo propuesto que respalda la evidencia experimental in vivo: una duplicación en tándem intragénica corta puede insertar un nuevo intrón en un gen que codifica una proteína, dejando la secuencia peptídica correspondiente sin cambios.Este mecanismo también tiene una amplia evidencia indirecta que respalda la idea de que la duplicación genómica en tándem es un mecanismo predominante para la ganancia de intrones. La prueba de otros mecanismos propuestos in vivo, particularmente la ganancia de intrones durante DSBR, la transferencia de intrones y la intronización, es posible, aunque estos mecanismos deben demostrarse in vivo para solidificarlos como mecanismos reales de ganancia de intrones. Los análisis genómicos adicionales, especialmente cuando se ejecutan a nivel de población, pueden cuantificar la contribución relativa de cada mecanismo, posiblemente identificando sesgos específicos de especies que pueden arrojar luz sobre las distintas tasas de ganancia de intrones entre diferentes especies.