Promotor (genética)

Compartir Imprimir Citar
Promotor de la lactosa en acción
Promotor de la lactosa en acción

En genética, un promotor es una secuencia de ADN a la que se unen las proteínas para iniciar la transcripción de un solo transcrito de ARN del ADN corriente abajo del promotor. La transcripción de ARN puede codificar una proteína (ARNm), o puede tener una función en sí misma, como ARNt o ARNr. Los promotores están ubicados cerca de los sitios de inicio de la transcripción de los genes, corriente arriba en el ADN (hacia la región 5' de la hebra con sentido). Los promotores pueden tener entre 100 y 1000 pares de bases de largo, cuya secuencia depende en gran medida del gen y el producto de la transcripción, el tipo o clase de ARN polimerasa reclutada en el sitio y la especie de organismo.

Visión de conjunto

Para que tenga lugar la transcripción, la enzima que sintetiza el ARN, conocida como ARN polimerasa, debe unirse al ADN cerca de un gen. Los promotores contienen secuencias de ADN específicas, como elementos de respuesta que proporcionan un sitio de unión inicial seguro para la ARN polimerasa y para proteínas denominadas factores de transcripción que reclutan ARN polimerasa. Estos factores de transcripción tienen secuencias activadoras o represoras específicas de los nucleótidos correspondientes que se unen a promotores específicos y regulan la expresión génica.en bacteriasEl promotor es reconocido por la polimerasa de ARN y un factor sigma asociado, que a su vez son llevados al ADN del promotor por la unión de una proteína activadora a su propio sitio de unión de ADN cercano.En eucariotasEl proceso es más complicado y se necesitan al menos siete factores diferentes para la unión de una ARN polimerasa II al promotor.

Los promotores representan elementos críticos que pueden trabajar en conjunto con otras regiones reguladoras (potenciadores, silenciadores, elementos de borde/aislantes) para dirigir el nivel de transcripción de un gen dado. Se induce un promotor en respuesta a cambios en la abundancia o conformación de proteínas reguladoras en una célula, lo que permite activar factores de transcripción para reclutar ARN polimerasa.

Identificación de ubicación relativa

Como los promotores suelen estar inmediatamente adyacentes al gen en cuestión, las posiciones en el promotor se designan en relación con el sitio de inicio de la transcripción, donde comienza la transcripción del ADN para un gen en particular (es decir, las posiciones cadena arriba son números negativos que van desde -1, por ejemplo -100 es una posición 100 pares de bases aguas arriba).

Ubicación relativa en el núcleo celular

En el núcleo celular, parece que los promotores se distribuyen preferentemente en el borde de los territorios cromosómicos, probablemente para la coexpresión de genes en diferentes cromosomas. Además, en humanos, los promotores muestran ciertos rasgos estructurales característicos de cada cromosoma.

Elementos

Bacteriano

En las bacterias, el promotor contiene dos elementos de secuencia corta de aproximadamente 10 (Pribnow Box) y 35 nucleótidos cadena arriba del sitio de inicio de la transcripción.

Las secuencias promotoras anteriores son reconocidas únicamente por la holoenzima de ARN polimerasa que contiene sigma-70. Las holoenzimas de ARN polimerasa que contienen otros factores sigma reconocen diferentes secuencias promotoras centrales.

   <-- aguas arriba aguas abajo -->
-3'
           -35 -10 Gen a transcribir

Probabilidad de ocurrencia de cada nucleótido

para -10 secuencia
 TATAAT
77% 76% 60% 61% 56% 82%
para secuencia -35
 TTGACA
69% 79% 61% 56% 54% 54%

Bidireccional (procariota)

Los promotores pueden estar muy cerca del ADN. Dichos "promotores estrechamente espaciados" se han observado en el ADN de todas las formas de vida, desde humanos hasta procariotas, y están altamente conservados. Por lo tanto, pueden proporcionar algunas ventajas (actualmente desconocidas). Estos pares de promotores se pueden colocar en direcciones divergentes, en tándem y convergentes. También pueden estar regulados por factores de transcripción y difieren en varias características, como la distancia de nucleótidos entre ellos, la fuerza de los dos promotores, etc. El aspecto más importante de dos promotores muy próximos es que, muy probablemente, interfieran entre sí.. Varios estudios han explorado esto utilizando modelos analíticos y estocásticos.También hay estudios que midieron la expresión génica en genes sintéticos o de uno a unos pocos genes controlados por promotores bidireccionales.

Más recientemente, un estudio midió la mayoría de los genes controlados por promotores en tándem en E. coli. En ese estudio, se midió y luego se modelaron dos formas principales de interferencia. Una es cuando un RNAP está en el promotor aguas abajo, bloqueando el movimiento de los RNAP que se alargan desde el promotor aguas arriba. La otra es cuando los dos promotores están tan cerca que cuando un RNAP se encuentra en uno de los promotores, bloquea cualquier otro RNAP para que no llegue al otro promotor. Estos eventos son posibles porque el RNAP ocupa varios nucleótidos cuando se une al ADN, incluso en los sitios de inicio de la transcripción. Eventos similares ocurren cuando los promotores están en formaciones divergentes y convergentes. Los posibles eventos también dependen de la distancia entre ellos.

Dos promotores tandem in el ADN bacteriano
Dos promotores tandem in el ADN bacteriano

Eucariota

Los promotores eucarióticos son diversos y pueden ser difíciles de caracterizar, sin embargo, estudios recientes muestran que se dividen en más de 10 clases.

Los promotores de genes generalmente se encuentran aguas arriba del gen y pueden tener elementos reguladores a varias kilobases del sitio de inicio de la transcripción (potenciadores). En los eucariotas, el complejo transcripcional puede hacer que el ADN se doble sobre sí mismo, lo que permite colocar las secuencias reguladoras lejos del lugar real de la transcripción. Los promotores dependientes de la ARN-polimerasa-II eucariota pueden contener una caja TATA (secuencia de consenso TATAAA), que es reconocida por la proteína de unión a TATA del factor de transcripción general (TBP); y un elemento de reconocimiento B (BRE), que es reconocido por el factor de transcripción general TFIIB. El elemento TATA y BRE normalmente se encuentran cerca del sitio de inicio de la transcripción (normalmente entre 30 y 40 pares de bases).

Las secuencias reguladoras del promotor eucariótico normalmente se unen a proteínas llamadas factores de transcripción que están implicados en la formación del complejo transcripcional. Un ejemplo es E-box (secuencia CACGTG), que se une a factores de transcripción en la familia básica hélice-bucle-hélice (bHLH) (p. ej., BMAL1-Clock, cMyc). Algunos promotores que son el objetivo de múltiples factores de transcripción pueden alcanzar un estado hiperactivo, lo que lleva a una mayor actividad transcripcional.

Promotores de mamíferos

La expresión regulada al alza de genes en mamíferos se inicia cuando se transmiten señales a los promotores asociados con los genes. Las secuencias de ADN del promotor pueden incluir diferentes elementos, como islas CpG (presentes en aproximadamente el 70 % de los promotores), una caja TATA (presente en aproximadamente el 24 % de los promotores), iniciador (Inr) (presente en aproximadamente el 49 % de los promotores), aguas arriba y elementos de reconocimiento TFIIB aguas abajo (BREu y BREd) (presentes en aproximadamente el 22% de los promotores), y elemento promotor central aguas abajo (DPE) (presente en aproximadamente el 12% de los promotores). La presencia de múltiples sitios CpG metilados en islas CpG de promotores provoca un silenciamiento estable de genes. Sin embargo, los experimentos de Weingarten-Gabbay et al.mostró que la presencia o ausencia de los otros elementos tienen efectos relativamente pequeños en la expresión génica. Dos secuencias, la caja TATA e Inr, causaron aumentos pequeños pero significativos en la expresión (45% y 28% de aumentos, respectivamente). Los elementos BREu y BREd redujeron significativamente la expresión en un 35 % y un 20 %, respectivamente, y el elemento DPE no detectó ningún efecto sobre la expresión.

Los módulos reguladores cis que se localizan en regiones de ADN distantes de los promotores de los genes pueden tener efectos muy importantes en la expresión génica, y algunos genes experimentan un aumento de expresión de hasta 100 veces debido a dicho módulo regulador cis. Estos módulos reguladores cis incluyen potenciadores, silenciadores, aisladores y elementos de anclaje. Entre esta constelación de elementos, los potenciadores y sus factores de transcripción asociados tienen un papel destacado en la regulación de la expresión génica.

Los potenciadores son regiones del genoma que son los principales elementos reguladores de genes. Los potenciadores controlan los programas de expresión génica específicos del tipo de célula, la mayoría de las veces recorriendo largas distancias para acercarse físicamente a los promotores de sus genes objetivo. En un estudio de las neuronas corticales del cerebro, se encontraron 24.937 bucles, lo que llevó potenciadores a los promotores. Múltiples potenciadores, cada uno a menudo a decenas o cientos de miles de nucleótidos de distancia de sus genes objetivo, enlazan con sus promotores de genes objetivo y se coordinan entre sí para controlar la expresión de su gen objetivo común.

La ilustración esquemática de esta sección muestra un potenciador dando vueltas para acercarse físicamente al promotor de un gen objetivo. El bucle está estabilizado por un dímero de una proteína conectora (p. ej., dímero de CTCF o YY1), con un miembro del dímero anclado a su motivo de unión en el potenciador y el otro miembro anclado a su motivo de unión en el promotor (representado por el zigzags rojos en la ilustración). Varios factores de transcripción específicos de la función celular (hay alrededor de 1600 factores de transcripción en una célula humana) generalmente se unen a motivos específicos en un potenciadory una pequeña combinación de estos factores de transcripción unidos a potenciadores, cuando se acercan a un promotor mediante un bucle de ADN, gobiernan el nivel de transcripción del gen objetivo. El mediador (coactivador) (un complejo que generalmente consta de unas 26 proteínas en una estructura que interactúa) comunica las señales reguladoras de los factores de transcripción unidos al ADN potenciadores directamente a la enzima ARN polimerasa II (pol II) unida al promotor.

Los potenciadores, cuando están activos, generalmente se transcriben de ambas cadenas de ADN con ARN polimerasas que actúan en dos direcciones diferentes, produciendo dos ARNe como se ilustra en la Figura. Un potenciador inactivo puede unirse a un factor de transcripción inactivo. La fosforilación del factor de transcripción puede activarlo y ese factor de transcripción activado puede entonces activar el potenciador al que está unido (ver la pequeña estrella roja que representa la fosforilación del factor de transcripción unido al potenciador en la ilustración). Un potenciador activado comienza la transcripción de su ARN antes de activar un promotor para iniciar la transcripción del ARN mensajero de su gen objetivo.

Bidireccional (mamífero)

Los promotores bidireccionales son regiones intergénicas cortas (<1 kbp) de ADN entre los extremos 5' de los genes en un par de genes bidireccionales. Un "par de genes bidireccional" se refiere a dos genes adyacentes codificados en cadenas opuestas, con sus extremos 5' orientados uno hacia el otro. Los dos genes a menudo están funcionalmente relacionados, y la modificación de su región promotora compartida les permite ser co-regulados y por lo tanto co-expresados. Los promotores bidireccionales son una característica común de los genomas de mamíferos. Alrededor del 11% de los genes humanos están emparejados bidireccionalmente.

Los genes emparejados bidireccionalmente en la base de datos Gene Ontology compartieron al menos una categoría funcional asignada por la base de datos con sus socios el 47% del tiempo. El análisis de micromatrices ha demostrado que los genes emparejados bidireccionalmente se coexpresan en mayor grado que los genes aleatorios o los genes unidireccionales vecinos. Aunque la coexpresión no indica necesariamente la coregulación, se ha demostrado que la metilación de las regiones promotoras bidireccionales regula a la baja ambos genes y la desmetilación regula al alza ambos genes. Hay excepciones a esto, sin embargo. En algunos casos (alrededor del 11%), solo se expresa un gen de un par bidireccional.En estos casos, el promotor está implicado en la supresión del gen no expresado. El mecanismo detrás de esto podría ser la competencia por las mismas polimerasas o la modificación de la cromatina. La transcripción divergente podría cambiar los nucleosomas para regular al alza la transcripción de un gen, o eliminar los factores de transcripción unidos para regular a la baja la transcripción de un gen.

Algunas clases funcionales de genes tienen más probabilidades de estar emparejadas bidireccionalmente que otras. Los genes implicados en la reparación del ADN tienen cinco veces más probabilidades de ser regulados por promotores bidireccionales que por promotores unidireccionales. Las proteínas chaperonas son tres veces más probables y los genes mitocondriales son más del doble de probables. Muchos genes metabólicos celulares y de limpieza básicos están regulados por promotores bidireccionales. La sobrerrepresentación de genes de reparación de ADN emparejados bidireccionalmente asocia estos promotores con el cáncer. El cuarenta y cinco por ciento de los oncogenes somáticos humanos parecen estar regulados por promotores bidireccionales, significativamente más que los genes que no causan cáncer. La hipermetilación de los promotores entre los pares de genes WNT9A/CD558500, CTDSPL/BC040563 y KCNK15/BF195580 se ha asociado con tumores.

Se han observado ciertas características de secuencia en promotores bidireccionales, incluida la falta de cajas TATA, una abundancia de islas CpG y una simetría alrededor del punto medio de Cs y As dominantes en un lado y Gs y Ts en el otro. Recientemente se demostró que un motivo con la secuencia de consenso de TCTCGCGAGA, también llamado elemento CGCG, impulsa la transcripción bidireccional impulsada por PolII en las islas CpG.Las cajas CCAAT son comunes, como lo están en muchos promotores que carecen de cajas TATA. Además, los motivos NRF-1, GABPA, YY1 y ACTACAnnTCCC están representados en promotores bidireccionales a tasas significativamente más altas que en los promotores unidireccionales. La ausencia de cajas TATA en promotores bidireccionales sugiere que las cajas TATA desempeñan un papel en la determinación de la direccionalidad de los promotores, pero los contraejemplos de promotores bidireccionales poseen cajas TATA y promotores unidireccionales sin ellas indican que no pueden ser el único factor.

Aunque el término "promotor bidireccional" se refiere específicamente a regiones promotoras de genes que codifican ARNm, los ensayos de luciferasa han demostrado que más de la mitad de los genes humanos no tienen un sesgo direccional fuerte. La investigación sugiere que los ARN no codificantes se asocian con frecuencia con las regiones promotoras de los genes que codifican el ARNm. Se ha planteado la hipótesis de que el reclutamiento y la iniciación de la ARN polimerasa II suelen comenzar de forma bidireccional, pero la transcripción divergente se detiene en un punto de control más adelante durante la elongación. Los posibles mecanismos detrás de esta regulación incluyen secuencias en la región promotora, modificación de la cromatina y la orientación espacial del ADN.

Subgenómico

Un promotor subgenómico es un promotor que se agrega a un virus para un gen heterólogo específico, lo que da como resultado la formación de ARNm solo para ese gen. Muchos virus de ARN de sentido positivo producen estos ARNm subgenómicos (sgRNA) como una de las técnicas de infección comunes utilizadas por estos virus y generalmente transcriben genes virales tardíos. Los promotores subgenómicos van desde 24 nucleótidos (virus Sindbis) hasta más de 100 nucleótidos (virus de la vena amarilla necrótica de la remolacha) y generalmente se encuentran aguas arriba del inicio de la transcripción.

Regulación del mecanismo de transcripción de los promotores genéticos en mamíferos
Regulación del mecanismo de transcripción de los promotores genéticos en mamíferos

Detección

Se ha desarrollado una amplia variedad de algoritmos para facilitar la detección de promotores en la secuencia genómica, y la predicción de promotores es un elemento común de muchos métodos de predicción de genes. Una región promotora está ubicada antes de las secuencias de consenso -35 y -10. Cuanto más cerca esté la región promotora de las secuencias consenso, más a menudo tendrá lugar la transcripción de ese gen. No existe un patrón establecido para las regiones promotoras como lo hay para las secuencias consenso.

Cambio evolutivo

Los cambios en las secuencias del promotor son críticos en la evolución, como lo indica el número relativamente estable de genes en muchos linajes. Por ejemplo, la mayoría de los vertebrados tienen aproximadamente el mismo número de genes que codifican proteínas (alrededor de 20.000) que a menudo están muy conservados en secuencia, por lo que gran parte del cambio evolutivo debe provenir de cambios en la expresión génica.

De nuevo origen de los promotores

Dadas las secuencias cortas de la mayoría de los elementos promotores, los promotores pueden evolucionar rápidamente a partir de secuencias aleatorias. Por ejemplo, en E. coli, ~60 % de las secuencias aleatorias pueden desarrollar niveles de expresión comparables al promotor lac de tipo salvaje con una sola mutación, y ~10 % de las secuencias aleatorias pueden servir como promotores activos incluso sin evolución.

Vinculante

El inicio de la transcripción es un proceso secuencial de varios pasos que implica varios mecanismos: ubicación del promotor, unión reversible inicial de la ARN polimerasa, cambios conformacionales en la ARN polimerasa, cambios conformacionales en el ADN, unión del nucleósido trifosfato (NTP) al promotor funcional de la ARN polimerasa. inicio complejo, no productivo y productivo de la síntesis de ARN.

El proceso de unión del promotor es crucial en la comprensión del proceso de expresión génica.

Localización

Aunque la holoenzima de la ARN polimerasa muestra una alta afinidad por sitios no específicos del ADN, esta característica no permite aclarar el proceso de localización del promotor. Este proceso de ubicación del promotor se ha atribuido a la estructura de la holoenzima al ADN y sigma 4 a los complejos de ADN.

Enfermedades asociadas con la función aberrante

La mayoría de las enfermedades tienen una causa heterogénea, lo que significa que una "enfermedad" suele ser muchas enfermedades diferentes a nivel molecular, aunque los síntomas que se presentan y la respuesta al tratamiento pueden ser idénticos. La forma en que las enfermedades de diferente origen molecular responden a los tratamientos se aborda parcialmente en la disciplina de la farmacogenómica.

No se enumeran aquí los muchos tipos de cánceres que involucran una regulación transcripcional aberrante debido a la creación de genes quiméricos a través de la translocación cromosómica patológica. Es importante destacar que la intervención en el número o la estructura de las proteínas unidas al promotor es una clave para tratar una enfermedad sin afectar la expresión de genes no relacionados que comparten elementos con el gen objetivo. Algunos genes cuyo cambio no es deseable son capaces de influir en el potencial de una célula para volverse cancerosa.

Islas CpG en promotores

En humanos, alrededor del 70% de los promotores ubicados cerca del sitio de inicio de la transcripción de un gen (promotores proximales) contienen una isla CpG. Las islas CpG tienen generalmente de 200 a 2000 pares de bases de largo, tienen un contenido de pares de bases C:G >50% y tienen regiones de ADN donde un nucleótido de citosina es seguido por un nucleótido de guanina y esto ocurre con frecuencia en la secuencia lineal de bases a lo largo de su Dirección 5' → 3'.

Los promotores distales también contienen con frecuencia islas CpG, como el promotor del gen de reparación de ADN ERCC1, donde el promotor que contiene islas CpG se encuentra aproximadamente 5400 nucleótidos cadena arriba de la región codificante del gen ERCC1. Las islas CpG también ocurren con frecuencia en promotores de ARN no codificantes funcionales, como los microARN.

La metilación de islas CpG silencia genes de forma estable

En humanos, la metilación del ADN ocurre en la posición 5' del anillo de pirimidina de los residuos de citosina dentro de los sitios CpG para formar 5-metilcitosinas. La presencia de múltiples sitios CpG metilados en islas CpG de promotores provoca un silenciamiento estable de genes. El silenciamiento de un gen puede ser iniciado por otros mecanismos, pero esto a menudo es seguido por la metilación de los sitios CpG en la isla promotora CpG para provocar el silenciamiento estable del gen.

Promotor CpG hiper/hipometilación en cáncer

Generalmente, en la progresión hacia el cáncer, se silencian o activan cientos de genes. Aunque el silenciamiento de algunos genes en los cánceres ocurre por mutación, una gran proporción del silenciamiento de genes cancerígenos es el resultado de una metilación alterada del ADN (ver Metilación del ADN en el cáncer). La metilación del ADN que causa el silenciamiento en el cáncer ocurre típicamente en múltiples sitios CpG en las islas CpG que están presentes en los promotores de los genes que codifican proteínas.

Las expresiones alteradas de los microARN también silencian o activan muchos genes en progresión hacia el cáncer (ver microARN en el cáncer). La expresión alterada de microARN se produce a través de hiper/hipometilación de sitios CpG en islas CpG en promotores que controlan la transcripción de los microARN.

El silenciamiento de los genes de reparación del ADN a través de la metilación de las islas CpG en sus promotores parece ser especialmente importante en la progresión hacia el cáncer (ver metilación de los genes de reparación del ADN en el cáncer).

Secuencias canónicas y de tipo salvaje

El uso del término secuencia canónica para referirse a un promotor suele ser problemático y puede dar lugar a malentendidos acerca de las secuencias promotoras. Canónico implica perfecto, en algún sentido.

En el caso de un sitio de unión del factor de transcripción, puede haber una única secuencia que se una a la proteína con mayor fuerza en condiciones celulares específicas. Esto podría llamarse canónico.

Sin embargo, la selección natural puede favorecer una unión menos energética como una forma de regular la producción transcripcional. En este caso, podemos llamar a la secuencia más común en una población la secuencia de tipo salvaje. Puede que ni siquiera sea la secuencia más ventajosa bajo las condiciones imperantes.

La evidencia reciente también indica que varios genes (incluido el protooncogén c-myc) tienen motivos G-quadruplex como posibles señales reguladoras.

Enfermedades que pueden estar asociadas a variaciones

Algunos casos de muchas enfermedades genéticas están asociados con variaciones en los promotores o factores de transcripción.

Ejemplos incluyen:

Constitutivo vs regulado

Algunos promotores se denominan constitutivos porque están activos en todas las circunstancias en la célula, mientras que otros están regulados y se activan en la célula solo en respuesta a estímulos específicos.

Uso del término

Cuando se refieren a un promotor, algunos autores en realidad quieren decir promotor + operador; es decir, el promotor lac es inducible por IPTG, lo que significa que además del promotor lac, también está presente el operador lac. Si el operador lac no estuviera presente, el IPTG no tendría un efecto inducible. Otro ejemplo es el sistema Tac-Promoter (Ptac). Observe cómo tac se escribe como un promotor de tac, mientras que, de hecho, tac es tanto un promotor como un operador.