Región de codificación

format_list_bulleted Contenido keyboard_arrow_down
ImprimirCitar
Porción de la secuencia del gen que códigos para la proteína

La región codificante de un gen, también conocida como secuencia codificante (CDS), es la porción de un gen' s ADN o ARN que codifica proteínas. El estudio de la longitud, la composición, la regulación, el empalme, las estructuras y las funciones de las regiones codificantes en comparación con las regiones no codificantes en diferentes especies y períodos de tiempo puede proporcionar una cantidad significativa de información importante sobre la organización de genes y la evolución de procariotas y eucariotas. Esto puede ayudar aún más en el mapeo del genoma humano y el desarrollo de la terapia génica.

Definición

Aunque este término a veces también se usa indistintamente con exón, no es exactamente lo mismo: el exón se compone de la región de codificación, así como del 3' y 5' regiones no traducidas del ARN, por lo que un exón estaría parcialmente formado por regiones codificantes. El 3' y 5' Las regiones no traducidas del ARN, que no codifican proteínas, se denominan regiones no codificantes y no se analizan en esta página.

A menudo hay confusión entre las regiones de codificación y los exomas y existe una clara distinción entre estos términos. Mientras que el exoma se refiere a todos los exones dentro de un genoma, la región codificante se refiere a una sección singular del ADN o ARN que codifica específicamente para un determinado tipo de proteína.

Historia

En 1978, Walter Gilbert publicó "Por qué los genes en pedazos" que primero comenzó a explorar la idea de que el gen es un mosaico, que cada hebra completa de ácido nucleico no está codificada de forma continua, sino que está interrumpida por "silencio"; regiones no codificantes. Esta fue la primera indicación de que debía haber una distinción entre las partes del genoma que codifican proteínas, ahora llamadas regiones codificantes, y las que no lo hacen.

Composición

Tipos de mutación de puntos: Las transiciones (azul) son elevadas en comparación con las transversiones (rojo) en regiones de codificación ricas en GC.

La evidencia sugiere que existe una interdependencia general entre los patrones de composición de base y la disponibilidad de la región de codificación. Se cree que la región de codificación contiene un contenido de GC más alto que las regiones no codificantes. Hay más investigaciones que descubrieron que cuanto más larga es la cadena de codificación, mayor es el contenido de GC. Las hebras de codificación cortas siguen siendo comparativamente pobres en GC, similar al bajo contenido de GC de los codones de terminación de la traducción de la composición de bases como TAG, TAA y TGA.

Las áreas ricas en GC también son donde el tipo de mutación puntual de relación se altera ligeramente: hay más transiciones, que son cambios de purina a purina o de pirimidina a pirimidina, en comparación con transversiones, que son cambios de purina a pirimidina o de pirimidina a purina Es menos probable que las transiciones cambien el aminoácido codificado y sigan siendo una mutación silenciosa (especialmente si ocurren en el tercer nucleótido de un codón) que suele ser beneficiosa para el organismo durante la traducción y la formación de proteínas.

Esto indica que las regiones codificantes esenciales (ricas en genes) tienen un mayor contenido de GC y son más estables y resistentes a la mutación en comparación con las regiones accesorias y no esenciales (pobres en genes). Sin embargo, aún no está claro si esto se produjo a través de una mutación neutral y aleatoria o a través de un patrón de selección. También existe un debate sobre si los métodos utilizados, como las ventanas de genes, para determinar la relación entre el contenido de GC y la región de codificación son precisos e imparciales.

Estructura y función

Transcripción: RNA Polymerase (RNAP) utiliza un hilo de ADN de plantilla y comienza la codificación en la secuencia de promotores (verde) y termina en la secuencia de terminación (rojo) para abarcar toda la región de codificación en el pre-mRNA (teal). El pre-mRNA está polimerizado de 5' a 3' y el ADN de la plantilla de 3' a 5'
Un electron-micrógrafo de hilos de ADN decorados por cientos de moléculas RNAP demasiado pequeñas para ser resueltas. Cada RNAP está transcribiendo una cadena de ARN, que se puede ver ramificar del ADN. "Comenzar" indica el final de 3' del ADN, donde RNAP inicia la transcripción; "End" indica el final de 5', donde las moléculas de ARN más largas se transcriben completamente.

En el ADN, la región codificante está flanqueada por la secuencia promotora en el extremo 5' extremo de la hebra plantilla y la secuencia de terminación en el 3' fin. Durante la transcripción, la ARN polimerasa (RNAP) se une a la secuencia promotora y se mueve a lo largo de la hebra molde hasta la región codificante. Luego, RNAP agrega nucleótidos de ARN complementarios a la región codificante para formar el ARNm, sustituyendo la timina por uracilo. Esto continúa hasta que el RNAP alcanza la secuencia de terminación.

Después de la transcripción y maduración, el ARNm maduro formado abarca múltiples partes importantes para su eventual traducción a proteína. La región de codificación en un ARNm está flanqueada por el 5' región no traducida (5'-UTR) y 3' región no traducida (3'-UTR), la región 5' tapa y cola Poly-A. Durante la traducción, el ribosoma facilita la unión de los ARNt a la región codificante, 3 nucleótidos a la vez (codones). Los tRNA transfieren sus aminoácidos asociados a la cadena polipeptídica en crecimiento, eventualmente formando la proteína definida en la región codificante del ADN inicial.

La región de codificación (teal) está flanqueada por regiones no traducidas, la tapa de 5' y la cola de poli(A) que juntos forman la madura mRNA.

Regulación

La región codificante se puede modificar para regular la expresión génica.

La alquilación es una forma de regulación de la región codificante. El gen que se habría transcrito se puede silenciar apuntando a una secuencia específica. Las bases de esta secuencia se bloquearían utilizando grupos alquilo, que crean el efecto silenciador.

Mientras que la regulación de la expresión génica gestiona la abundancia de ARN o proteína que se produce en una célula, la regulación de estos mecanismos puede controlarse mediante una secuencia reguladora que se encuentra antes de que comience el marco de lectura abierto en una hebra de ADN. La secuencia reguladora determinará entonces la ubicación y el momento en que se producirá la expresión para una región codificante de proteína.

El empalme de ARN determina en última instancia qué parte de la secuencia se traduce y se expresa, y este proceso implica eliminar intrones y unir exones. Sin embargo, el lugar donde se corta el spliceosoma de ARN se guía por el reconocimiento de los sitios de empalme, en particular el 5' sitio de empalme, que es uno de los sustratos para el primer paso en el empalme. Las regiones codificantes están dentro de los exones, que se unen de forma covalente para formar el ARN mensajero maduro.

Mutaciones

Las mutaciones en la región codificante pueden tener efectos muy diversos sobre el fenotipo del organismo. Si bien algunas mutaciones en esta región de ADN/ARN pueden generar cambios ventajosos, otras pueden ser perjudiciales y, a veces, incluso letales para la supervivencia de un organismo. Por el contrario, es posible que los cambios en la región no codificante no siempre den como resultado cambios detectables en el fenotipo.

Tipos de mutación

Ejemplos de las diversas formas de mutaciones puntuales que puede existir dentro de las regiones de codificación. Tales alteraciones pueden o no tener cambios fenotípicos, dependiendo de si codifican o no para diferentes aminoácidos durante la traducción.

Hay varias formas de mutaciones que pueden ocurrir en las regiones de codificación. Una forma son las mutaciones silenciosas, en las que un cambio en los nucleótidos no da como resultado ningún cambio en el aminoácido después de la transcripción y traducción. También existen mutaciones sin sentido, donde las alteraciones de la base en la región codificante codifican un codón de terminación prematuro, lo que produce una proteína final más corta. Las mutaciones puntuales, o cambios de un solo par de bases en la región codificante, que codifican diferentes aminoácidos durante la traducción, se denominan mutaciones sin sentido. Otros tipos de mutaciones incluyen mutaciones de cambio de marco, como inserciones o eliminaciones.

Formación

Algunas formas de mutaciones son hereditarias (mutaciones de la línea germinal) o se transmiten de un padre a su descendencia. Tales regiones codificantes mutadas están presentes en todas las células dentro del organismo. Otras formas de mutaciones se adquieren (mutaciones somáticas) durante la vida de un organismo y pueden no ser constantes de una célula a otra. Estos cambios pueden ser causados por mutágenos, carcinógenos u otros agentes ambientales (ej. UV). Las mutaciones adquiridas también pueden ser el resultado de errores de copia durante la replicación del ADN y no se transmiten a la descendencia. Los cambios en la región de codificación también pueden ser de novo (nuevos); Se cree que tales cambios ocurren poco después de la fertilización, lo que resulta en una mutación presente en el ADN de la descendencia mientras que está ausente tanto en el esperma como en el óvulo.

Prevención

Existen múltiples mecanismos de transcripción y traducción para prevenir la letalidad debida a mutaciones nocivas en la región codificante. Dichas medidas incluyen la revisión por parte de algunas ADN polimerasas durante la replicación, la reparación de errores de emparejamiento después de la replicación y la 'hipótesis del bamboleo'. que describe la degeneración de la tercera base dentro de un codón de ARNm.

Regiones de codificación restringidas (CCR)

Si bien es bien sabido que el genoma de un individuo puede tener grandes diferencias en comparación con el genoma de otro, investigaciones recientes han descubierto que algunas regiones codificantes están muy limitadas o son resistentes a la mutación entre individuos de la misma especie. Esto es similar al concepto de restricción entre especies en secuencias conservadas. Los investigadores denominaron a estas secuencias altamente restringidas regiones codificantes restringidas (CCR) y también descubrieron que tales regiones pueden estar involucradas en la selección de alta purificación. En promedio, hay aproximadamente 1 mutación que altera proteínas cada 7 bases de codificación, pero algunos CCR pueden tener más de 100 bases en secuencia sin que se observen mutaciones que alteren proteínas, algunos incluso sin mutaciones sinónimas. Estos patrones de restricción entre genomas pueden proporcionar pistas sobre las fuentes de enfermedades raras del desarrollo o, potencialmente, incluso de letalidad embrionaria. Las variantes clínicamente validadas y las mutaciones de novo en los CCR se han relacionado previamente con trastornos como la encefalopatía epiléptica infantil, el retraso en el desarrollo y la enfermedad cardíaca grave.

Detección de secuencias de codificación

El karyograma esquemático de un humano, mostrando una visión general del genoma humano en la banda G (que incluye Giemsa-staining), donde las regiones de ADN de codificación se producen en mayor medida en regiones más livianas (GC ricas).

Si bien la identificación de marcos de lectura abiertos dentro de una secuencia de ADN es sencilla, la identificación de secuencias de codificación no lo es, porque la célula traduce solo un subconjunto de todos los marcos de lectura abiertos a proteínas. Actualmente, la predicción de CDS utiliza el muestreo y la secuenciación del ARNm de las células, aunque todavía existe el problema de determinar qué partes de un ARNm determinado se traducen realmente a proteína. La predicción de CDS es un subconjunto de la predicción de genes, esta última también incluye la predicción de secuencias de ADN que codifican no solo proteínas sino también otros elementos funcionales como genes de ARN y secuencias reguladoras.

Tanto en procariotas como en eucariotas, la superposición de genes ocurre con relativa frecuencia tanto en virus de ADN como de ARN como una ventaja evolutiva para reducir el tamaño del genoma mientras se conserva la capacidad de producir varias proteínas a partir de las regiones codificantes disponibles. Tanto para el ADN como para el ARN, las alineaciones por pares pueden detectar regiones codificantes superpuestas, incluidos marcos de lectura abiertos cortos en virus, pero requerirían una hebra codificante conocida para comparar la posible hebra codificante superpuesta. Un método alternativo que utilice secuencias genómicas únicas no requeriría secuencias genómicas múltiples para ejecutar comparaciones, pero requeriría una superposición de al menos 50 nucleótidos para ser sensible.

Contenido relacionado

Hamamelidales

Hamamelidales es un orden de plantas con flores aceptado anteriormente en varios sistemas de taxonomía de plantas, incluido el sistema Cronquist publicado en...

Biofísica

La biofísica es una ciencia interdisciplinar que aplica enfoques y métodos tradicionalmente utilizados en física para estudiar fenómenos biológicos. La...

Camilo Golgi

Camillo Golgi fue un biólogo y patólogo italiano conocido por sus trabajos sobre el sistema nervioso central. Estudió medicina en la Universidad de Pavía...
Más resultados...
Tamaño del texto:
undoredo
format_boldformat_italicformat_underlinedstrikethrough_ssuperscriptsubscriptlink
save