Base par

Compartir Imprimir Citar
Depiction of the adenine–thymine Watson–Crick base pair

Un par de bases (pb) es una unidad fundamental de ácidos nucleicos de doble cadena que consta de dos nucleobases unidas entre sí por enlaces de hidrógeno. Forman los componentes básicos de la doble hélice del ADN y contribuyen a la estructura plegada tanto del ADN como del ARN. Dictado por patrones de enlaces de hidrógeno específicos, "Watson–Crick" (o "Watson-Crick-Franklin") pares de bases (guanina-citosina y adenina-timina) permiten que la hélice de ADN mantenga una estructura helicoidal regular que depende sutilmente de su secuencia de nucleótidos. La naturaleza complementaria de esta estructura basada en pares proporciona una copia redundante de la información genética codificada dentro de cada hebra de ADN. La estructura regular y la redundancia de datos proporcionada por la doble hélice del ADN hacen que el ADN sea muy adecuado para el almacenamiento de información genética, mientras que el emparejamiento de bases entre el ADN y los nucleótidos entrantes proporciona el mecanismo a través del cual la ADN polimerasa replica el ADN y la ARN polimerasa transcribe el ADN en ARN. Muchas proteínas de unión al ADN pueden reconocer patrones específicos de apareamiento de bases que identifican regiones reguladoras particulares de los genes.

Los pares de bases intramoleculares pueden ocurrir dentro de los ácidos nucleicos monocatenarios. Esto es particularmente importante en las moléculas de ARN (p. ej., ARN de transferencia), donde los pares de bases de Watson-Crick (guanina-citosina y adenina-uracilo) permiten la formación de hélices cortas de doble cadena y una amplia variedad de interacciones que no son de Watson-Crick. (p. ej., G–U o A–A) permiten que los ARN se plieguen en una amplia gama de estructuras tridimensionales específicas. Además, el emparejamiento de bases entre el ARN de transferencia (ARNt) y el ARN mensajero (ARNm) forma la base para los eventos de reconocimiento molecular que dan como resultado que la secuencia de nucleótidos del ARNm se traduzca en la secuencia de aminoácidos de las proteínas a través del código genético.

El tamaño de un gen individual o del genoma completo de un organismo a menudo se mide en pares de bases porque el ADN suele ser de doble cadena. Por lo tanto, el número de pares de bases totales es igual al número de nucleótidos en una de las hebras (con la excepción de las regiones de telómeros monocatenarias no codificantes). Se estima que el genoma humano haploide (23 cromosomas) tiene una longitud aproximada de 3200 millones de bases y contiene entre 20 000 y 25 000 genes distintos que codifican proteínas. Una kilobase (kb) es una unidad de medida en biología molecular equivalente a 1000 pares de bases de ADN o ARN. El número total de pares de bases de ADN en la Tierra se estima en 5,0×1037 con un peso de 50 mil millones de toneladas. En comparación, se ha estimado que la masa total de la biosfera es de hasta 4 TtC (billones de toneladas de carbono).

Enlace de hidrógeno y estabilidad

Base pair GC.svg
Base pair AT.svg
Top, a G.C par base con tres bonos de hidrógeno. Bottom, un A.T par base con dos bonos de hidrógeno. Los enlaces de hidrógeno no refrigerantes entre las bases se muestran como líneas desgarradas. Las líneas de peluca se apoyan en la conexión con el azúcar de la pentase y apuntan en la dirección del groove menor.

El enlace de hidrógeno es la interacción química que subyace en las reglas de emparejamiento de bases descritas anteriormente. La correspondencia geométrica apropiada de los donantes y aceptores de enlaces de hidrógeno permite que solo el "derecho" parejas para formar de manera estable. El ADN con alto contenido de GC es más estable que el ADN con bajo contenido de GC. Pero, contrariamente a la creencia popular, los enlaces de hidrógeno no estabilizan significativamente el ADN; la estabilización se debe principalmente a las interacciones de apilamiento.

Las nucleobases más grandes, adenina y guanina, son miembros de una clase de estructuras químicas de doble anillo llamadas purinas; las nucleobases más pequeñas, citosina y timina (y uracilo), son miembros de una clase de estructuras químicas de un solo anillo llamadas pirimidinas. Las purinas son complementarias solo con las pirimidinas: los apareamientos pirimidina-pirimidina son energéticamente desfavorables porque las moléculas están demasiado separadas para que se establezcan enlaces de hidrógeno; Los apareamientos purina-purina son energéticamente desfavorables porque las moléculas están demasiado cerca, lo que lleva a una repulsión superpuesta. El apareamiento de bases purina-pirimidina de AT o GC o UA (en ARN) da como resultado una estructura dúplex adecuada. Los únicos otros emparejamientos de purina-pirimidina serían AC, GT y UG (en ARN); estos emparejamientos son desajustes porque los patrones de donantes y aceptores de hidrógeno no se corresponden. El emparejamiento GU, con dos enlaces de hidrógeno, ocurre con bastante frecuencia en el ARN (ver par de bases oscilantes).

Las moléculas de ADN y ARN emparejadas son comparativamente estables a temperatura ambiente, pero las dos cadenas de nucleótidos se separarán por encima de un punto de fusión determinado por la longitud de las moléculas, el grado de emparejamiento incorrecto (si lo hay) y el contenido de GC. Un mayor contenido de GC da como resultado temperaturas de fusión más altas; por lo tanto, no sorprende que los genomas de organismos extremófilos como Thermus thermophilus sean particularmente ricos en GC. Por el contrario, las regiones de un genoma que necesitan separarse con frecuencia, por ejemplo, las regiones promotoras de los genes que se transcriben con frecuencia, son comparativamente pobres en GC (por ejemplo, consulte el cuadro TATA). El contenido de GC y la temperatura de fusión también deben tenerse en cuenta al diseñar cebadores para reacciones de PCR.

Ejemplos

Las siguientes secuencias de ADN ilustran patrones de pares de doble cadena. Por convención, la hebra superior se escribe desde el extremo 5′ hasta el extremo 3′; por lo tanto, la hebra inferior se escribe de 3 'a 5'.

Una secuencia de ADN pintada de base:
ATCGATTGAGCTCTAGCG
TAGCTAACTCGAGATCGC
La secuencia correspondiente del ARN, en la que el uracil es sustituido por la timina en el hilo del ARN:
AUCGAUUGAGCUCUAGCG
UAGCUAACUCGAGAUCGC

Análogos de bases e intercaladores

Los análogos químicos de los nucleótidos pueden tomar el lugar de los nucleótidos adecuados y establecer un emparejamiento de bases no canónico, lo que genera errores (principalmente mutaciones puntuales) en la replicación y la transcripción del ADN. Esto se debe a su química isostérica. Un análogo de base mutagénico común es el 5-bromouracilo, que se parece a la timina pero puede aparearse con la guanina en su forma de enol.

Otras sustancias químicas, conocidas como intercaladores de ADN, encajan en el espacio entre las bases adyacentes en una sola hebra e inducen mutaciones de cambio de marco "enmascarando" como base, lo que hace que la maquinaria de replicación del ADN salte o inserte nucleótidos adicionales en el sitio intercalado. La mayoría de los intercaladores son compuestos poliaromáticos grandes y son cancerígenos conocidos o sospechosos. Los ejemplos incluyen bromuro de etidio y acridina.

Reparación de errores de coincidencia

Los pares de bases no coincidentes pueden generarse por errores de replicación del ADN y como intermediarios durante la recombinación homóloga. El proceso de reparación de desajustes normalmente debe reconocer y reparar correctamente un pequeño número de desajustes de bases dentro de una larga secuencia de pares de bases de ADN normales. Para reparar los desajustes formados durante la replicación del ADN, se han desarrollado varios procesos de reparación distintivos para distinguir entre la hebra molde y la hebra recién formada, de modo que solo se elimine el nucleótido incorrecto recién insertado (para evitar generar una mutación). Las proteínas empleadas en la reparación de errores de emparejamiento durante la replicación del ADN y la importancia clínica de los defectos en este proceso se describen en el artículo Reparación de errores de emparejamiento de ADN. El proceso de corrección de errores de emparejamiento durante la recombinación se describe en el artículo conversión de genes.

Par de bases no naturales (UBP)

Un par de bases no naturales (UBP) es una subunidad diseñada (o nucleobase) de ADN que se crea en un laboratorio y no ocurre en la naturaleza. Se han descrito secuencias de ADN que utilizan nucleobases recién creadas para formar un tercer par de bases, además de los dos pares de bases que se encuentran en la naturaleza, A-T (adenina-timina) y G-C (guanina-citosina). Algunos grupos de investigación han estado buscando un tercer par base para el ADN, incluidos los equipos dirigidos por Steven A. Benner, Philippe Marliere, Floyd E. Romesberg e Ichiro Hirao. Se han informado algunos pares de bases nuevos basados en enlaces de hidrógeno alternativos, interacciones hidrofóbicas y coordinación de metales.

En 1989, Steven Benner (entonces trabajaba en el Instituto Federal Suizo de Tecnología en Zúrich) y su equipo lideraron con formas modificadas de citosina y guanina en moléculas de ADN in vitro. Los nucleótidos, que codificaban ARN y proteínas, se replicaron con éxito in vitro. Desde entonces, el equipo de Benner ha estado tratando de diseñar células que puedan crear bases extrañas desde cero, obviando la necesidad de una materia prima.

En 2002, el grupo de Ichiro Hirao en Japón desarrolló un par de bases no naturales entre 2-amino-8-(2-tienil)purina(s) y piridina-2-ona (y) que funciona en la transcripción y traducción, para la incorporación específica de sitio de aminoácidos no estándar en proteínas. En 2006, crearon 7-(2-tienil)imidazo[4,5-b]piridina (Ds) y pirrol-2-carbaldehído (Pa) como tercer par de bases para la replicación y la transcripción. Posteriormente, Ds y 4-[3-(6-aminohexanamido)-1-propinil]-2-nitropirrol (Px) se descubrieron como un par de alta fidelidad en la amplificación por PCR. En 2013, aplicaron el par Ds-Px a la generación de aptámeros de ADN mediante selección in vitro (SELEX) y demostraron que la expansión del alfabeto genético aumenta significativamente las afinidades de los aptámeros de ADN con las proteínas diana.

En 2012, un grupo de científicos estadounidenses dirigido por Floyd Romesberg, biólogo químico del Instituto de Investigación Scripps en San Diego, California, publicó que su equipo diseñó un par de bases no naturales (UBP). Los dos nuevos nucleótidos artificiales o par de bases no naturales (UBP) se denominaron d5SICS y dNaM. Más técnicamente, estos nucleótidos artificiales que contienen nucleobases hidrofóbicas presentan dos anillos aromáticos fusionados que forman un complejo (d5SICS-dNaM) o un par de bases en el ADN. Su equipo diseñó una variedad de pruebas in vitro o "en probeta" plantillas que contenían el par de bases no naturales y confirmaron que se replicaba de manera eficiente con alta fidelidad en prácticamente todos los contextos de secuencia utilizando las modernas técnicas estándar in vitro, es decir, la amplificación por PCR de ADN y las aplicaciones basadas en PCR. Sus resultados muestran que para PCR y aplicaciones basadas en PCR, el par de bases no naturales d5SICS-dNaM es funcionalmente equivalente a un par de bases naturales, y cuando se combina con los otros dos pares de bases naturales utilizados por todos los organismos, A-T y G-C, proporcionan un "alfabeto genético" de seis letras totalmente funcional y ampliado.

En 2014, el mismo equipo del Instituto de Investigación Scripps informó que sintetizó un tramo de ADN circular conocido como plásmido que contiene pares de bases naturales T-A y C-G junto con el mejor rendimiento que el laboratorio UBP Romesberg había diseñado e insertado en células de la bacteria común E. coli que reprodujo con éxito los pares de bases no naturales a través de múltiples generaciones. La transfección no obstaculizó el crecimiento de E. coli y no mostró signos de perder sus pares de bases no naturales debido a sus mecanismos naturales de reparación del ADN. Este es el primer ejemplo conocido de un organismo vivo que transmite un código genético ampliado a las generaciones posteriores. Romesberg dijo que él y sus colegas crearon 300 variantes para refinar el diseño de nucleótidos que serían lo suficientemente estables y se replicarían tan fácilmente como los naturales cuando las células se dividen. Esto se logró en parte mediante la adición de un gen de algas de apoyo que expresa un transportador de trifosfato de nucleótidos que importa de manera eficiente los trifosfatos de d5SICSTP y dNaMTP en E. bacterias coli. Luego, las vías naturales de replicación bacteriana las utilizan para replicar con precisión un plásmido que contiene d5SICS–dNaM. Otros investigadores se sorprendieron de que las bacterias replicaran estas subunidades de ADN hechas por humanos.

La incorporación exitosa de un tercer par de bases es un avance significativo hacia el objetivo de expandir en gran medida el número de aminoácidos que puede codificar el ADN, de los 20 aminoácidos existentes a 172 teóricamente posibles, expandiendo así el potencial para organismos vivos para producir nuevas proteínas. Las cadenas artificiales de ADN aún no codifican nada, pero los científicos especulan que podrían diseñarse para fabricar nuevas proteínas que podrían tener usos industriales o farmacéuticos. Los expertos dijeron que el ADN sintético que incorpora el par de bases no naturales plantea la posibilidad de formas de vida basadas en un código de ADN diferente.

Emparejamiento de bases no canónicas

Parejas base Wobble
Comparación de Hoogsteen a los pares de base Watson-Crick.

Además del emparejamiento canónico, algunas condiciones también pueden favorecer el emparejamiento de bases con orientación de base alternativa, y número y geometría de enlaces de hidrógeno. Estos emparejamientos se acompañan de alteraciones en la forma de la columna vertebral local.

El más común de estos es el apareamiento oscilante de bases que se produce entre los ARNt y los ARNm en la posición de la tercera base de muchos codones durante la transcripción y durante la carga de los ARNt por parte de algunas sintetasas de ARNt. También se han observado en las estructuras secundarias de algunas secuencias de ARN.

Además, el emparejamiento de bases de Hoogsteen (típicamente escrito como A•U/T y G•C) puede existir en algunas secuencias de ADN (p. ej., dinucleótidos CA y TA) en equilibrio dinámico con el emparejamiento estándar de Watson-Crick. También se han observado en algunos complejos proteína-ADN.

Además de estos pares de bases alternativos, se observa una amplia gama de enlaces de hidrógeno base-base en la estructura secundaria y terciaria del ARN. Estos enlaces a menudo son necesarios para la forma precisa y compleja de un ARN, así como para su unión a los socios de interacción.

Medidas de longitud

Las siguientes abreviaturas se usan comúnmente para describir la longitud de una molécula de ARN/D:

Para el ADN/ARN monocatenario, se utilizan unidades de nucleótidos, abreviado nt (o knt, Mnt, Gnt), ya que no están emparejados. Para distinguir entre unidades de almacenamiento informático y bases, se pueden utilizar kbp, Mbp, Gbp, etc. para pares de bases.

El centimorgan también se usa a menudo para implicar la distancia a lo largo de un cromosoma, pero el número de pares de bases a los que corresponde varía ampliamente. En el genoma humano, el centimorgan es de aproximadamente 1 millón de pares de bases.