Secuencia regulatoria
Una secuencia reguladora es un segmento de una molécula de ácido nucleico que es capaz de aumentar o disminuir la expresión de genes específicos dentro de un organismo. La regulación de la expresión génica es una característica esencial de todos los organismos vivos y virus.
Descripción
En el ADN, la regulación de la expresión génica normalmente ocurre al nivel de la biosíntesis (transcripción) del ARN. Se logra mediante la unión específica de secuencia de proteínas (factores de transcripción) que activan o inhiben la transcripción. Los factores de transcripción pueden actuar como activadores, represores o ambos. Los represores a menudo actúan evitando que la ARN polimerasa forme un complejo productivo con la región de iniciación de la transcripción (promotor), mientras que los activadores facilitan la formación de un complejo productivo. Además, se ha demostrado que los motivos de ADN predicen modificaciones epigenómicas, lo que sugiere que los factores de transcripción desempeñan un papel en la regulación del epigenoma.
En el ARN, la regulación puede ocurrir a nivel de biosíntesis de proteínas (traducción), escisión de ARN, corte y empalme de ARN o terminación transcripcional. Las secuencias reguladoras se asocian frecuentemente con moléculas de ARN mensajero (ARNm), donde se utilizan para controlar la biogénesis o traducción del ARNm. Una variedad de moléculas biológicas pueden unirse al ARN para lograr esta regulación, incluidas proteínas (p. ej., represores de traducción y factores de empalme), otras moléculas de ARN (p. ej., miARN) y moléculas pequeñas, en el caso de los riboconmutadores.
Activación e implementación
Una secuencia de ADN reguladora no regula a menos que esté activada. Se activan diferentes secuencias reguladoras y luego implementan su regulación por diferentes mecanismos.
Activación e implementación de Enhancer
La expresión de genes en mamíferos puede aumentar cuando se transmiten señales a los promotores asociados con los genes. Las secuencias de ADN reguladoras en cis que se encuentran en regiones de ADN distantes de los promotores de los genes pueden tener efectos muy importantes en la expresión génica, y algunos genes experimentan un aumento de expresión de hasta 100 veces debido a tal cis- secuencia reguladora. Estas secuencias reguladoras cis incluyen potenciadores, silenciadores, aislantes y elementos de anclaje. Entre esta constelación de secuencias, los potenciadores y sus proteínas de factor de transcripción asociadas tienen un papel principal en la regulación de la expresión génica.
Los potenciadores son secuencias del genoma que son los principales elementos reguladores de genes. Los potenciadores controlan los programas de expresión génica específicos del tipo de célula, la mayoría de las veces recorriendo largas distancias para acercarse físicamente a los promotores de sus genes objetivo. En un estudio de las neuronas corticales del cerebro, se encontraron 24.937 bucles, lo que llevó potenciadores a los promotores. Múltiples potenciadores, cada uno a menudo a decenas o cientos de miles de nucleótidos de distancia de sus genes objetivo, enlazan con sus promotores de genes objetivo y se coordinan entre sí para controlar la expresión de su gen objetivo común.
La ilustración esquemática de esta sección muestra un potenciador dando vueltas para acercarse físicamente al promotor de un gen objetivo. El bucle está estabilizado por un dímero de una proteína conectora (p. ej., dímero de CTCF o YY1), con un miembro del dímero anclado a su motivo de unión en el potenciador y el otro miembro anclado a su motivo de unión en el promotor (representado por el zigzags rojos en la ilustración). Varias proteínas de factores de transcripción específicos de la función celular (en 2018, Lambert et al. indicaron que había alrededor de 1600 factores de transcripción en una célula humana) generalmente se unen a motivos específicos en un potenciador y una pequeña combinación de estos factores de transcripción unidos al potenciador, cuando se acercan a un promotor por un bucle de ADN, gobiernan el nivel de transcripción del gen objetivo. El mediador (coactivador) (un complejo que generalmente consta de unas 26 proteínas en una estructura que interactúa) comunica las señales reguladoras de los factores de transcripción unidos al ADN potenciadores directamente a la enzima ARN polimerasa II (RNAP II) unida al promotor.
Los potenciadores, cuando están activos, generalmente se transcriben de ambas cadenas de ADN con ARN polimerasas que actúan en dos direcciones diferentes, produciendo dos ARNe como se ilustra en la figura. Un potenciador inactivo puede unirse a un factor de transcripción inactivo. La fosforilación del factor de transcripción puede activarlo y ese factor de transcripción activado puede entonces activar el potenciador al que está unido (ver la pequeña estrella roja que representa la fosforilación de un factor de transcripción unido a un potenciador en la ilustración). Un potenciador activado comienza la transcripción de su ARN antes de activar un promotor para iniciar la transcripción del ARN mensajero de su gen objetivo.
Metilación y desmetilación de islas CpG
5-metilcitosina (5-mC) es una forma metilada de la citosina base del ADN (ver figura). 5-mC es un marcador epigenético que se encuentra predominantemente en las citosinas dentro de los dinucleótidos CpG, que consisten en una lectura de citosina seguida de una lectura de guanina en la dirección 5 'a 3' a lo largo de la cadena de ADN (sitios CpG). Aproximadamente 28 millones de dinucleótidos CpG ocurren en el genoma humano. En la mayoría de los tejidos de los mamíferos, en promedio, del 70% al 80% de las citosinas CpG están metiladas (formando 5-metil-CpG o 5-mCpG). Las citosinas metiladas dentro de las secuencias CpG a menudo ocurren en grupos, llamados islas CpG. Aproximadamente el 59 % de las secuencias promotoras tienen una isla CpG, mientras que solo aproximadamente el 6 % de las secuencias potenciadoras tienen una isla CpG. Las islas CpG constituyen secuencias reguladoras, ya que si las islas CpG están metiladas en el promotor de un gen esto puede reducir o silenciar la expresión génica.
La metilación del ADN regula la expresión génica a través de la interacción con proteínas del dominio de unión a metilo (MBD), como MeCP2, MBD1 y MBD2. Estas proteínas MBD se unen más fuertemente a las islas CpG altamente metiladas. Estas proteínas MBD tienen un dominio de unión a metil-CpG y un dominio de represión transcripcional. Se unen al ADN metilado y guían o dirigen complejos de proteínas con actividad de remodelación de cromatina y/o modificación de histonas a islas CpG metiladas. Las proteínas MBD generalmente reprimen la cromatina local mediante la catalización de la introducción de marcas de histonas represivas o la creación de un entorno de cromatina represiva general a través de la remodelación del nucleosoma y la reorganización de la cromatina.
Los factores de transcripción son proteínas que se unen a secuencias de ADN específicas para regular la expresión de un gen determinado. La secuencia de unión de un factor de transcripción en el ADN suele tener una longitud de unos 10 u 11 nucleótidos. Hay aproximadamente 1.400 factores de transcripción diferentes codificados en el genoma humano y constituyen aproximadamente el 6% de todos los genes codificadores de proteínas humanas. Aproximadamente el 94 % de los sitios de unión del factor de transcripción que están asociados con genes sensibles a señales se encuentran en potenciadores, mientras que solo aproximadamente el 6 % de dichos sitios se encuentran en promotores.
EGR1 es un factor de transcripción importante para la regulación de la metilación de las islas CpG. Un sitio de unión del factor de transcripción EGR1 se localiza con frecuencia en secuencias potenciadoras o promotoras. Hay alrededor de 12.000 sitios de unión para EGR1 en el genoma de los mamíferos y aproximadamente la mitad de los sitios de unión de EGR1 están ubicados en promotores y la otra mitad en potenciadores. La unión de EGR1 a su sitio de unión de ADN objetivo es insensible a la metilación de citosina en el ADN.
Si bien solo se detectan pequeñas cantidades de proteína EGR1 en células que no están estimuladas, la traducción de EGR1 en proteína una hora después de la estimulación es notablemente elevada. La expresión de EGR1 en varios tipos de células puede estimularse mediante factores de crecimiento, neurotransmisores, hormonas, estrés y lesiones. En el cerebro, cuando se activan las neuronas, las proteínas EGR1 se regulan al alza y se unen (reclutan) enzimas TET1 preexistentes, que se expresan en gran medida en las neuronas. Las enzimas TET pueden catalizar la desmetilación de la 5-metilcitosina. Cuando los factores de transcripción EGR1 llevan las enzimas TET1 a los sitios de unión de EGR1 en los promotores, las enzimas TET pueden desmetilar las islas CpG metiladas en esos promotores. Tras la desmetilación, estos promotores pueden iniciar la transcripción de sus genes diana. Cientos de genes en las neuronas se expresan diferencialmente después de la activación de la neurona a través del reclutamiento de EGR1 de TET1 a secuencias reguladoras metiladas en sus promotores.
Activación por rupturas de doble o simple hebra
Unas 600 secuencias reguladoras en los promotores y unas 800 secuencias reguladoras en los potenciadores parecen depender de roturas de doble cadena iniciadas por la topoisomerasa 2β (TOP2B) para su activación. La inducción de rupturas de doble cadena particulares es específica con respecto a la señal inductora. Cuando las neuronas se activan in vitro, solo se producen 22 roturas de doble cadena inducidas por TOP2B en sus genomas. Sin embargo, cuando el condicionamiento del miedo contextual se lleva a cabo en un ratón, este condicionamiento provoca cientos de DSB asociados a genes en la corteza prefrontal medial y el hipocampo, que son importantes para el aprendizaje y la memoria.
Dichas roturas de doble cadena inducidas por TOP2B están acompañadas por al menos cuatro enzimas de la vía de reparación del ADN de unión de extremos no homólogos (NHEJ, por sus siglas en inglés) (DNA-PKcs, KU70, KU80 y DNA LIGASE IV) (ver figura). Estas enzimas reparan las roturas de la doble hebra en aproximadamente 15 minutos a 2 horas. Las roturas de doble cadena en el promotor están asociadas con TOP2B y al menos con estas cuatro enzimas reparadoras. Estas proteínas están presentes simultáneamente en un solo nucleosoma promotor (hay alrededor de 147 nucleótidos en la secuencia de ADN envueltos alrededor de un solo nucleosoma) ubicado cerca del sitio de inicio de la transcripción de su gen objetivo.
La rotura de doble cadena introducida por TOP2B aparentemente libera la parte del promotor en un sitio de inicio de la transcripción unido a la ARN polimerasa para moverse físicamente a su potenciador asociado. Esto permite que el potenciador, con sus factores de transcripción unidos y proteínas mediadoras, interactúe directamente con la ARN polimerasa que se detuvo en el sitio de inicio de la transcripción para comenzar la transcripción.
Del mismo modo, las enzimas topoisomerasa I (TOP1) parecen estar ubicadas en muchos potenciadores, y esos potenciadores se activan cuando TOP1 introduce una rotura de cadena sencilla. TOP1 provoca roturas de una sola hebra en secuencias reguladoras de ADN potenciadoras concretas cuando lo indica un factor de transcripción de unión a potenciadores específico. Las roturas de topoisomerasa I están asociadas con diferentes factores de reparación del ADN que los que rodean las roturas de TOP2B. En el caso de TOP1, las roturas se asocian más inmediatamente con las enzimas de reparación del ADN MRE11, RAD50 y ATR.
Ejemplos
Los genomas se pueden analizar sistemáticamente para identificar regiones reguladoras. Las secuencias no codificantes conservadas a menudo contienen regiones reguladoras, por lo que suelen ser objeto de estos análisis.
- Caja CAAT
- CCAAT box
- Operador (biología)
- Pribnow box
- Caja de datos
- SECIS element, mRNA
- Señal de poliadenyación, mRNA
- Una caja
- Z-box
- C-box
- E-box
- G-box
Gen de la insulina
Las secuencias reguladoras del gen de la insulina son:
- A5
- Z
- elemento regulador negativo (NRE)
- C2
- E2
- A3
- elemento de respuesta cAMP
- A2
- CAAT boostr binding (CEB)
- C1
- E1
- G1
Contenido relacionado
Hexagonal II
Ferrari
DSL (desambiguación)