Repetición invertida
Una repetición invertida (o IR) es una secuencia monocatenaria de nucleótidos seguida corriente abajo por su complemento inverso. La secuencia intermedia de nucleótidos entre la secuencia inicial y el complemento inverso puede tener cualquier longitud, incluido el cero. Por ejemplo, 5'---TTACGnnnnnnCGTAA---3' es un invertido repetir secuencia. Cuando la longitud intermedia es cero, la secuencia compuesta es una secuencia palindrómica.
Tanto las repeticiones invertidas como las repeticiones directas constituyen tipos de secuencias de nucleótidos que ocurren repetitivamente. Estas secuencias de ADN repetidas a menudo van desde un par de nucleótidos hasta un gen completo, mientras que la proximidad de las secuencias repetidas varía entre matrices en tándem simples y ampliamente dispersas. Las secuencias cortas repetidas en tándem pueden existir desde unas pocas copias en una pequeña región hasta miles de copias dispersas por todo el genoma de la mayoría de los eucariotas. Las secuencias repetidas con alrededor de 10 a 100 pares de bases se conocen como minisatélites, mientras que las secuencias repetidas más cortas que tienen principalmente de 2 a 4 pares de bases se conocen como microsatélites. Las repeticiones más comunes incluyen las repeticiones de dinucleótidos, que tienen las bases AC en una cadena de ADN y GT en la cadena complementaria. Algunos elementos del genoma con secuencias únicas funcionan como exones, intrones y ADN regulador. Aunque los loci más familiares de las secuencias repetitivas son el centrómero y el telómero, una gran parte de las secuencias repetidas en el genoma se encuentran entre el ADN no codificante.
Las repeticiones invertidas tienen varias funciones biológicas importantes. Definen los límites en los transposones e indican regiones capaces de aparearse de bases autocomplementarias (regiones dentro de una sola secuencia que pueden aparearse entre sí). Estas propiedades juegan un papel importante en la inestabilidad del genoma y contribuyen no solo a la evolución celular y la diversidad genética, sino también a la mutación y la enfermedad. Para estudiar estos efectos en detalle, se han desarrollado varios programas y bases de datos para ayudar en el descubrimiento y la anotación de repeticiones invertidas en varios genomas.
Comprender las repeticiones invertidas
Ejemplo de una repetición invertida
Comenzando con esta secuencia inicial:
5'-TTACG-3'
El complemento creado por el emparejamiento de bases es:
3'-AATGC-5'
El complemento inverso es:
5'-CGTAA-3'
Y, la secuencia de repetición invertida es:
5'---TTACGnnnnnnCGTAA---3'
"nnnnnn" representa cualquier número de nucleótidos intermedios.
Vs. repetición directa
Una repetición directa ocurre cuando una secuencia se repite con el mismo patrón aguas abajo. No hay inversión ni complemento inverso asociado con una repetición directa. La secuencia de nucleótidos escrita en negrita significa la secuencia repetida. Puede o no tener nucleótidos intermedios.
- 5 ́ TTACGnnnnTTACG 3 ́
- 3 ́ AATGCnnnnAATGC 5 ́
Lingüísticamente, una repetición directa típica es comparable a una rima, como en "time on a dime".
Vs. repetición en tándem
Una repetición directa con ningún nucleótido intermedio entre la secuencia inicial y su copia descendente es una repetición en tándem. La secuencia de nucleótidos escrita en negrita significa la secuencia repetida.
- 5 ́ TTACGTTACG 3 ́
- 3 ́ AATGCAATGC 5 ́
Lingüísticamente, una repetición típica en tándem es comparable a tartamudear o repetir palabras deliberadamente, como en "bye-bye".
Vs. palíndromo
Una secuencia repetida invertida con ningún nucleótido intermedio entre la secuencia inicial y su complemento inverso corriente abajo es un palíndromo.
EJEMPLO:
Paso 1: comience con una repetición invertida: 5' TTACGnnnnnnCGTAA 3'
Paso 2: elimine los nucleótidos intermedios: 5' TTACGCGTAA 3'
Esta secuencia resultante es palindrómica porque es el complemento inverso de sí misma.
- 5' TTACGCGTAA 3 ' secuencia de prueba (desde el paso 2 con nucleótidos intervenidos eliminados)
- 3' AATGCGCATT 5 ' complemento de la secuencia de prueba
- 5' TTACGCGTAA 3 ' complemento inverso Esto es lo mismo que la secuencia de prueba anterior, y por lo tanto, es un palindromo.
Características biológicas y funcionalidad
Condiciones que favorecen la síntesis
Las diversas repeticiones de todo el genoma se derivan de elementos transponibles, que ahora se entiende que "saltan" sobre diferentes localizaciones genómicas, sin transferir sus copias originales. El traslado posterior de las mismas secuencias durante numerosas generaciones asegura su multiplicidad en todo el genoma. La recombinación limitada de las secuencias entre dos elementos de secuencia distintos conocida como recombinación conservadora específica del sitio (CSSR) da como resultado inversiones del segmento de ADN, según la disposición de las secuencias de reconocimiento de recombinación en el ADN del donante y el ADN del receptor. Nuevamente, la orientación de dos de los sitios de recombinación dentro de la molécula de ADN donante en relación con la asimetría de las secuencias de escisión de ADN que intervienen, conocida como región de cruce, es fundamental para la formación de repeticiones invertidas o repeticiones directas. Por lo tanto, la recombinación que ocurre en un par de sitios invertidos invertirá la secuencia de ADN entre los dos sitios. Se han observado cromosomas muy estables con un número comparativamente menor de repeticiones invertidas que de repeticiones directas, lo que sugiere una relación entre la estabilidad cromosómica y el número de repeticiones.
Regiones donde la presencia es obligatoria
Se han observado repeticiones terminales invertidas en el ADN de varios transposones eucarióticos, aunque su origen sigue siendo desconocido. Las repeticiones invertidas se encuentran principalmente en los orígenes de la replicación del organismo celular y los orgánulos que van desde plásmidos de fagos, mitocondrias y virus eucariotas hasta células de mamíferos. Los orígenes de replicación del fago G4 y otros fagos relacionados comprenden un segmento de casi 139 bases de nucleótidos que incluyen tres repeticiones invertidas que son esenciales para el cebado de la replicación.
En el genoma
En gran medida, las porciones de repeticiones de nucleótidos se observan con bastante frecuencia como parte de combinaciones raras de ADN. Las tres repeticiones principales que se encuentran en gran medida en construcciones de ADN particulares incluyen las repeticiones invertidas de homopurina-homopirimidina muy precisas, que también se conocen como palíndromos H, una ocurrencia común en las conformaciones H de triple hélice que pueden comprender las tríadas de nucleótidos TAT o CGC. Los otros podrían describirse como repeticiones invertidas largas que tienen la tendencia a producir horquillas y cruciformes, y finalmente repeticiones directas en tándem, que comúnmente existen en estructuras descritas como bucle deslizado, cruciforme y Z-DNA zurdo.
Común en diferentes organismos
Estudios anteriores sugieren que las repeticiones son una característica común de los eucariotas, a diferencia de los procariotas y las arqueas. Otros informes sugieren que, independientemente de la escasez comparativa de elementos repetidos en los genomas procarióticos, contienen cientos o incluso miles de repeticiones grandes. El análisis genómico actual parece sugerir la existencia de un gran exceso de repeticiones invertidas perfectas en muchos genomas procarióticos en comparación con los genomas eucarióticos.
Para la cuantificación y comparación de repeticiones invertidas entre varias especies, concretamente en arqueas, véase
Repeticiones invertidas en pseudonudos
Los pseudonudos son motivos estructurales comunes que se encuentran en el ARN. Están formados por dos bucles de vástago anidados de manera que el vástago de una estructura se forma a partir del bucle de la otra. Existen múltiples topologías de plegado entre los pseudonudos y una gran variación en la longitud de los bucles, lo que los convierte en un grupo estructuralmente diverso.
Las repeticiones invertidas son un componente clave de los pseudonudos, como se puede ver en la ilustración de un pseudonudo natural que se encuentra en el componente de ARN de la telomerasa humana. Cuatro conjuntos diferentes de repeticiones invertidas están involucrados en esta estructura. Los conjuntos 1 y 2 son el vástago del vástago-bucle A y son parte del bucle del vástago-bucle B. De manera similar, los conjuntos 3 y 4 son el vástago del vástago-bucle B y son parte del bucle del vástago-bucle A.
Los pseudonudos desempeñan una serie de funciones diferentes en biología. El pseudonudo de la telomerasa en la ilustración es fundamental para la actividad de esa enzima. La ribozima del virus de la hepatitis delta (VHD) se pliega en una estructura de doble pseudonudo y autoescinde su genoma circular para producir un ARN de longitud de genoma único. Los pseudonudos también desempeñan un papel en el cambio de marco ribosómico programado que se encuentra en algunos virus y es necesario en la replicación de los retrovirus.
En riboconmutadores
Las repeticiones invertidas juegan un papel importante en los riboconmutadores, que son elementos reguladores del ARN que controlan la expresión de los genes que producen el ARNm, del que forman parte. En la ilustración se muestra un ejemplo simplificado del riboswitch de mononucleótido de flavina (FMN). Este ribointerruptor existe en la transcripción de ARNm y tiene varias estructuras de bucle de tallo aguas arriba de la región codificante. Sin embargo, en la ilustración solo se muestran los bucles de plica clave, que se ha simplificado mucho para ayudar a mostrar el papel de las repeticiones invertidas. Hay múltiples repeticiones invertidas en este riboswitch como se indica en verde (fondo amarillo) y azul (fondo naranja).
En ausencia de FMN, la estructura Anti-terminación es la conformación preferida para la transcripción de ARNm. Se crea mediante el emparejamiento de bases de la región de repetición invertida rodeada con un círculo rojo. Cuando FMN está presente, puede unirse al bucle y evitar la formación de la estructura Anti-terminación. Esto permite que dos conjuntos diferentes de repeticiones invertidas formen pares de bases y formen la estructura de Terminación. El bucle de vástago en el 3' end es un terminador transcripcional porque la secuencia inmediatamente siguiente es una cadena de uracilos (U). Si este bucle de tallo se forma (debido a la presencia de FMN) a medida que la cadena de ARN en crecimiento emerge del complejo de ARN polimerasa, creará suficiente tensión estructural para hacer que la cadena de ARN se disocie y, por lo tanto, termine la transcripción. La disociación ocurre fácilmente porque el apareamiento de bases entre las U en el ARN y las A en la hebra molde es el más débil de todos los apareamientos de bases. Por lo tanto, a niveles de concentración más altos, FMN regula a la baja su propia transcripción al aumentar la formación de la estructura de terminación.
Mutaciones y enfermedades
Las repeticiones invertidas a menudo se describen como "puntos de acceso" Inestabilidad genómica de eucariotas y procariotas. Se considera que las repeticiones largas invertidas influyen en gran medida en la estabilidad del genoma de varios organismos. Esto se ejemplifica en E. coli, donde las secuencias genómicas con largas repeticiones invertidas rara vez se replican, sino que se eliminan con rapidez. Nuevamente, las largas repeticiones invertidas observadas en la levadura favorecen en gran medida la recombinación dentro de los mismos cromosomas y los adyacentes, lo que da como resultado una tasa de eliminación igualmente muy alta. Finalmente, también se observó una tasa muy alta de deleción y recombinación en regiones de cromosomas de mamíferos con repeticiones invertidas. Las diferencias reportadas en la estabilidad de los genomas de organismos interrelacionados son siempre una indicación de una disparidad en las repeticiones invertidas. La inestabilidad resulta de la tendencia de las repeticiones invertidas a plegarse en estructuras de ADN con forma de horquilla o cruciformes. Estas estructuras especiales pueden dificultar o confundir la replicación del ADN y otras actividades genómicas. Por lo tanto, las repeticiones invertidas conducen a configuraciones especiales tanto en el ARN como en el ADN que, en última instancia, pueden causar mutaciones y enfermedades.
La ilustración muestra una repetición invertida sometida a extrusión cruciforme. El ADN en la región de la repetición invertida se desenrolla y luego se recombina, formando una unión de cuatro vías con dos estructuras de bucle de tallo. La estructura cruciforme se produce porque las secuencias repetidas invertidas se emparejan entre sí en su propia hebra.
Los cruciformes extruidos pueden provocar mutaciones de cambio de marco cuando una secuencia de ADN tiene repeticiones invertidas en forma de palíndromo combinado con regiones de repeticiones directas en cualquier lado. Durante la transcripción, el deslizamiento y la disociación parcial de la polimerasa de la hebra molde pueden provocar mutaciones tanto por deleción como por inserción. La eliminación se produce cuando una parte de la hebra plantilla desenrollada forma un bucle de tallo que se "salta" por la maquinaria de transcripción. La inserción ocurre cuando se forma un bucle de tallo en una porción disociada de la hebra naciente (recién sintetizada), lo que hace que una porción de la hebra molde se transcriba dos veces.
Deficiencia de antitrombina por mutación puntual
Las repeticiones invertidas imperfectas pueden dar lugar a mutaciones a través del cambio intracatenario e intercatenario. La región codificante del gen de la antitrombina III es un ejemplo de una repetición invertida imperfecta, como se muestra en la figura de la derecha. La estructura de bucle de tallo se forma con una protuberancia en la parte inferior porque la G y la T no se emparejan. Un evento de cambio de hebra podría resultar en que la G (en la protuberancia) sea reemplazada por una A que elimine la "imperfección" en la repetición invertida y proporciona una estructura de bucle de tallo más fuerte. Sin embargo, el reemplazo también crea una mutación puntual que convierte el codón GCA en ACA. Si el evento de cambio de cadena es seguido por una segunda ronda de replicación del ADN, la mutación puede fijarse en el genoma y provocar una enfermedad. Específicamente, la mutación sin sentido daría lugar a un gen defectuoso y una deficiencia de antitrombina que podría provocar el desarrollo de tromboembolismo venoso (coágulos de sangre dentro de una vena).
Osteogénesis imperfecta a partir de una mutación de cambio de marco
Las mutaciones en el gen del colágeno pueden provocar la enfermedad osteogénesis imperfecta, que se caracteriza por huesos quebradizos. En la ilustración, un bucle de tallo formado a partir de una repetición invertida imperfecta se muta con una inserción de nucleótido de timina (T) como resultado de un cambio entre hebras o dentro de ellas. La adición de la T crea un emparejamiento de bases "match up" con la adenina (A) que antes era un "golpe" en el lado izquierdo del tallo. Si bien esta adición fortalece el tallo y perfecciona la repetición invertida, también crea una mutación de cambio de marco en la secuencia de nucleótidos que altera el marco de lectura y dará como resultado una expresión incorrecta del gen.
Programas y bases de datos
La siguiente lista proporciona información y enlaces externos a varios programas y bases de datos para repeticiones invertidas:
- no B DB Una base de datos para anotaciones integradas y análisis de motivos de formación de ADN no B. Esta base de datos es proporcionada por The Advanced Biomedical Computing Center (ABCC) en entonces Frederick National Laboratory for Cancer Research (FNLCR). Cubre las conformaciones de A-DNA y Z-DNA de otro modo conocidas como "ADN no B" porque no son la forma más común de B-DNA de un doble-ayuda mano derecha de Watson-Crick. Estos "ADN no B" incluyen Z-DNA de mano izquierda, cruciform, triplex, tetraplex y estructuras de horquilla. Las búsquedas se pueden realizar en una variedad de "tipos de repetición" (incluyendo repeticiones invertidas) y en varias especies.
- Repeticiones invertidas Database Boston University. Esta base de datos es una aplicación web que permite la consulta y análisis de repeticiones realizadas en el proyecto PUBLIC DATABASE. Los científicos también pueden analizar sus propias secuencias con el algoritmo de Finder de Repeticiones Invertidas.
- P-MITE: a Plant MITE database — esta base de datos para Miniature Inverted-repeat Transposable Elements (MITEs) contiene secuencias de genomas vegetales. Las secuencias se pueden buscar o descargar desde la base de datos.
- EMBOSS es la "European Molecular Biology Open Software Suite" que funciona en sistemas operativos como UNIX y UNIX. Los archivos de documentación y fuente de programa están disponibles en el sitio web de EMBOSS. Las aplicaciones relacionadas específicamente con las repeticiones invertidas se enumeran a continuación:
- EMBOSS einverted: Encuentra repeticiones invertidas en secuencias de nucleótido. Los valores del umbral se pueden establecer para limitar el alcance de la búsqueda.
- EMBOSS palindrome: Encuentra palindromas tales como regiones de lazo de tallo en secuencias de nucleótido. El programa encontrará secuencias que incluyen secciones de desajustes y brechas que pueden corresponder a bultos en un bucle de tallo.
Contenido relacionado
Enzima restrictiva
Fosfato de alta energía
Terápsido