Estructura de las proteínas

format_list_bulleted Contenido keyboard_arrow_down
ImprimirCitar

La estructura de las proteínas es la disposición tridimensional de los átomos en una molécula de cadena de aminoácidos. Las proteínas son polímeros, específicamente polipéptidos, formados a partir de secuencias de aminoácidos, los monómeros del polímero. Un monómero de un solo aminoácido también puede denominarse residuo que indica una unidad repetitiva de un polímero. Las proteínas se forman a partir de aminoácidos que experimentan reacciones de condensación, en las que los aminoácidos pierden una molécula de agua por reacción para unirse entre sí con un enlace peptídico. Por convención, una cadena de menos de 30 aminoácidos a menudo se identifica como un péptido, en lugar de una proteína.Para poder realizar su función biológica, las proteínas se pliegan en una o más conformaciones espaciales específicas impulsadas por una serie de interacciones no covalentes, como enlaces de hidrógeno, interacciones iónicas, fuerzas de Van der Waals y empaquetamiento hidrofóbico. Para comprender las funciones de las proteínas a nivel molecular, a menudo es necesario determinar su estructura tridimensional. Este es el tema del campo científico de la biología estructural, que emplea técnicas como la cristalografía de rayos X, la espectroscopia de RMN, la criomicroscopía electrónica (crio-EM) y la interferometría de polarización dual para determinar la estructura de las proteínas.

Las estructuras de proteínas varían en tamaño desde decenas hasta varios miles de aminoácidos. Por tamaño físico, las proteínas se clasifican como nanopartículas, entre 1 y 100 nm. Se pueden formar complejos proteicos muy grandes a partir de subunidades proteicas. Por ejemplo, muchos miles de moléculas de actina se ensamblan en un microfilamento.

Una proteína suele sufrir cambios estructurales reversibles al realizar su función biológica. Las estructuras alternativas de la misma proteína se denominan conformaciones diferentes y las transiciones entre ellas se denominan cambios conformacionales.

Niveles de estructura proteica

Hay cuatro niveles distintos de estructura proteica.

Estructura primaria

La estructura primaria de una proteína se refiere a la secuencia de aminoácidos en la cadena polipeptídica. La estructura primaria se mantiene unida por enlaces peptídicos que se forman durante el proceso de biosíntesis de proteínas. Los dos extremos de la cadena polipeptídica se denominan terminal carboxilo (terminal C) y terminal amino (terminal N) según la naturaleza del grupo libre en cada extremo. El conteo de residuos siempre comienza en el extremo N-terminal (NH 2-group), que es el extremo donde el grupo amino no está involucrado en un enlace peptídico. La estructura primaria de una proteína está determinada por el gen correspondiente a la proteína. Una secuencia específica de nucleótidos en el ADN se transcribe en ARNm, que el ribosoma lee en un proceso llamado traducción. La secuencia de aminoácidos en la insulina fue descubierta por Frederick Sanger, estableciendo que las proteínas tienen secuencias de aminoácidos definitorias.La secuencia de una proteína es exclusiva de esa proteína y define la estructura y función de la proteína. La secuencia de una proteína se puede determinar mediante métodos como la degradación de Edman o la espectrometría de masas en tándem. A menudo, sin embargo, se lee directamente de la secuencia del gen utilizando el código genético. Se recomienda estrictamente usar las palabras "residuos de aminoácidos" cuando se habla de proteínas porque cuando se forma un enlace peptídico, se pierde una molécula de agua y, por lo tanto, las proteínas están formadas por residuos de aminoácidos. Las modificaciones postraduccionales, como las fosforilaciones y las glicosilaciones, generalmente también se consideran parte de la estructura primaria y no se pueden leer del gen. Por ejemplo, la insulina se compone de 51 aminoácidos en 2 cadenas. Una cadena tiene 31 aminoácidos y la otra tiene 20 aminoácidos.

Estructura secundaria

La estructura secundaria se refiere a subestructuras locales muy regulares en la cadena principal del polipéptido real. Dos tipos principales de estructura secundaria, la hélice α y la hebra β o láminas β, fueron sugeridas en 1951 por Linus Pauling et al.Estas estructuras secundarias están definidas por patrones de enlaces de hidrógeno entre los grupos peptídicos de la cadena principal. Tienen una geometría regular y están restringidos a valores específicos de los ángulos diédricos ψ y φ en la gráfica de Ramachandran. Tanto la hélice α como la hoja β representan una forma de saturar todos los donantes y aceptores de enlaces de hidrógeno en la columna vertebral del péptido. Algunas partes de la proteína están ordenadas pero no forman estructuras regulares. No deben confundirse con la espiral aleatoria, una cadena polipeptídica desplegada que carece de una estructura tridimensional fija. Varias estructuras secundarias secuenciales pueden formar una "unidad supersecundaria".

Estructura terciaria

La estructura terciaria se refiere a la estructura tridimensional creada por una sola molécula de proteína (una sola cadena polipeptídica). Puede incluir uno o varios dominios. Las hélices α y las láminas plegadas β se pliegan en una estructura globular compacta. El plegamiento es impulsado por interacciones hidrofóbicas no específicas, el entierro de residuos hidrofóbicos del agua, pero la estructura es estable solo cuando las partes de un dominio de proteína están bloqueadas en su lugar por interacciones terciarias específicas, como puentes salinos, enlaces de hidrógeno, y el apretado empaquetamiento de cadenas laterales y enlaces disulfuro. Los enlaces disulfuro son extremadamente raros en las proteínas citosólicas, ya que el citosol (líquido intracelular) es generalmente un entorno reductor.

Estructura cuaternaria

La estructura cuaternaria es la estructura tridimensional que consiste en la agregación de dos o más cadenas polipeptídicas individuales (subunidades) que funcionan como una sola unidad funcional (multímero). El multímero resultante se estabiliza mediante las mismas interacciones no covalentes y enlaces disulfuro que en la estructura terciaria. Hay muchas organizaciones de estructuras cuaternarias posibles.Los complejos de dos o más polipéptidos (es decir, múltiples subunidades) se denominan multímeros. Específicamente, se llamaría dímero si contiene dos subunidades, trímero si contiene tres subunidades, tetrámero si contiene cuatro subunidades y pentámero si contiene cinco subunidades. Las subunidades se relacionan con frecuencia entre sí mediante operaciones de simetría, como un eje doble en un dímero. Los multímeros formados por subunidades idénticas se denominan con el prefijo "homo-" y los formados por diferentes subunidades se denominan con el prefijo "hetero-", por ejemplo, un heterotetrámero, como los dos alfa y los dos beta. cadenas de hemoglobina.

Dominios, motivos y pliegues en la estructura de proteínas.

Las proteínas se describen con frecuencia como formadas por varias unidades estructurales. Estas unidades incluyen dominios, motivos y pliegues. A pesar del hecho de que hay alrededor de 100.000 proteínas diferentes expresadas en sistemas eucariotas, hay muchos menos dominios, motivos estructurales y pliegues diferentes.

Dominio estructural

Un dominio estructural es un elemento de la estructura general de la proteína que se autoestabiliza y, a menudo, se pliega independientemente del resto de la cadena proteica. Muchos dominios no son exclusivos de los productos proteicos de un gen o una familia de genes, sino que aparecen en una variedad de proteínas. Los dominios a menudo se nombran y destacan porque ocupan un lugar destacado en la función biológica de la proteína a la que pertenecen; por ejemplo, el "dominio de unión al calcio de la calmodulina". Debido a que son independientemente estables, los dominios pueden "intercambiarse" mediante ingeniería genética entre una proteína y otra para producir proteínas quimeras. Una combinación conservadora de varios dominios que ocurren en diferentes proteínas, como el dominio de proteína tirosina fosfatasa y el par de dominios C2, se denominó "un superdominio" que puede evolucionar como una sola unidad.

Motivos estructurales y de secuencia

Los motivos estructurales y de secuencia se refieren a segmentos cortos de estructura tridimensional de proteína o secuencia de aminoácidos que se encontraron en una gran cantidad de proteínas diferentes.

Estructura supersecundaria

La estructura supersecundaria se refiere a una combinación específica de elementos de estructura secundaria, como unidades β-α-β o un motivo hélice-giro-hélice. Algunos de ellos también pueden denominarse motivos estructurales.

Pliegue de proteína

Un pliegue de proteína se refiere a la arquitectura general de la proteína, como un haz de hélice, un barril β, un pliegue de Rossmann o diferentes "pliegues" proporcionados en la base de datos de Clasificación Estructural de Proteínas. Un concepto relacionado es la topología de proteínas.

Dinámica de proteínas y conjuntos conformacionales.

Las proteínas no son objetos estáticos, sino que pueblan conjuntos de estados conformacionales. Las transiciones entre estos estados generalmente ocurren en nanoescala y se han relacionado con fenómenos funcionalmente relevantes como la señalización alostérica y la catálisis enzimática. La dinámica de proteínas y los cambios conformacionales permiten que las proteínas funcionen como máquinas biológicas a nanoescala dentro de las células, a menudo en forma de complejos de múltiples proteínas.Los ejemplos incluyen proteínas motoras, como la miosina, que es responsable de la contracción muscular, la cinesina, que mueve la carga dentro de las células lejos del núcleo a lo largo de los microtúbulos, y la dineína, que mueve la carga dentro de las células hacia el núcleo y produce el latido axonémico de los cilios móviles y flagelos "[E]n efecto, [el cilio móvil] es una nanomáquina compuesta por quizás más de 600 proteínas en complejos moleculares, muchas de las cuales también funcionan de forma independiente como nanomáquinas... Los enlazadores flexibles permiten que los dominios de proteínas móviles conectados por ellos recluten su enlace socios e inducen alostería de largo alcance a través de la dinámica del dominio de la proteína".

Las proteínas a menudo se consideran estructuras terciarias relativamente estables que experimentan cambios conformacionales después de verse afectadas por interacciones con otras proteínas o como parte de la actividad enzimática. Sin embargo, las proteínas pueden tener diversos grados de estabilidad y algunas de las variantes menos estables son proteínas intrínsecamente desordenadas. Estas proteínas existen y funcionan en un estado relativamente "desordenado" que carece de una estructura terciaria estable. Como resultado, son difíciles de describir mediante una única estructura terciaria fija. Los conjuntos conformacionales se han ideado como una forma de proporcionar una representación más precisa y "dinámica" del estado conformacional de las proteínas intrínsecamente desordenadas.

Los archivos de conjuntos de proteínas son una representación de una proteína que se puede considerar que tiene una estructura flexible. La creación de estos archivos requiere determinar cuál de las diversas conformaciones de proteínas teóricamente posibles existen realmente. Un enfoque es aplicar algoritmos computacionales a los datos de proteínas para tratar de determinar el conjunto de conformaciones más probable para un archivo de conjunto. Hay varios métodos para preparar datos para la base de datos de conjuntos de proteínas que se dividen en dos metodologías generales: enfoques de dinámica molecular (DM) y de grupo (diagramados en la figura). El enfoque basado en grupos utiliza la secuencia de aminoácidos de la proteína para crear un grupo masivo de conformaciones aleatorias. Luego, este grupo se somete a más procesamiento computacional que crea un conjunto de parámetros teóricos para cada conformación en función de la estructura. Se seleccionan los subconjuntos conformacionales de este grupo cuyos parámetros teóricos promedio coinciden estrechamente con los datos experimentales conocidos para esta proteína. El enfoque alternativo de dinámica molecular toma múltiples conformaciones aleatorias a la vez y las somete a todos a datos experimentales. Aquí los datos experimentales están sirviendo como limitaciones que deben colocarse en las conformaciones (por ejemplo, distancias conocidas entre átomos). Solo se aceptan conformaciones que logren permanecer dentro de los límites establecidos por los datos experimentales. Este enfoque a menudo aplica grandes cantidades de datos experimentales a las conformaciones, lo que es una tarea muy exigente desde el punto de vista computacional. El enfoque alternativo de dinámica molecular toma múltiples conformaciones aleatorias a la vez y las somete a todos a datos experimentales. Aquí los datos experimentales están sirviendo como limitaciones que deben colocarse en las conformaciones (por ejemplo, distancias conocidas entre átomos). Solo se aceptan conformaciones que logren permanecer dentro de los límites establecidos por los datos experimentales. Este enfoque a menudo aplica grandes cantidades de datos experimentales a las conformaciones, lo que es una tarea muy exigente desde el punto de vista computacional. El enfoque alternativo de dinámica molecular toma múltiples conformaciones aleatorias a la vez y las somete a todos a datos experimentales. Aquí los datos experimentales están sirviendo como limitaciones que deben colocarse en las conformaciones (por ejemplo, distancias conocidas entre átomos). Solo se aceptan conformaciones que logren permanecer dentro de los límites establecidos por los datos experimentales. Este enfoque a menudo aplica grandes cantidades de datos experimentales a las conformaciones, lo que es una tarea muy exigente desde el punto de vista computacional.

Los conjuntos conformacionales se generaron para varias proteínas altamente dinámicas y parcialmente desplegadas, como Sic1/Cdc4, p15 PAF, MKK7, Beta-sinucleína y P27.

Plegamiento de proteínas

A medida que se traduce, los polipéptidos salen del ribosoma principalmente como una espiral aleatoria y se pliegan a su estado original. En general, se supone que la estructura final de la cadena proteica está determinada por su secuencia de aminoácidos (dogma de Anfinsen).

Estabilidad de proteínas

La estabilidad termodinámica de las proteínas representa la diferencia de energía libre entre los estados de las proteínas plegadas y desplegadas. Esta diferencia de energía libre es muy sensible a la temperatura, por lo que un cambio en la temperatura puede resultar en un desdoblamiento o desnaturalización. La desnaturalización de la proteína puede dar como resultado la pérdida de la función y la pérdida del estado nativo. La energía libre de estabilización de las proteínas globulares solubles normalmente no supera los 50 kJ/mol. Teniendo en cuenta la gran cantidad de enlaces de hidrógeno que tienen lugar para la estabilización de estructuras secundarias y la estabilización del núcleo interno a través de interacciones hidrofóbicas, la energía libre de estabilización surge como una pequeña diferencia entre grandes números.

Determinación de la estructura de proteínas

Alrededor del 90 % de las estructuras de proteínas disponibles en Protein Data Bank se han determinado mediante cristalografía de rayos X. Este método permite medir la distribución de densidad tridimensional (3-D) de los electrones en la proteína, en estado cristalizado, y de ese modo inferir las coordenadas 3-D de todos los átomos que se determinarán con una resolución determinada. Aproximadamente el 9% de las estructuras proteicas conocidas se han obtenido mediante técnicas de resonancia magnética nuclear (RMN). Para complejos de proteínas más grandes, la microscopía crioelectrónica puede determinar las estructuras de las proteínas. La resolución suele ser más baja que la de la cristalografía de rayos X o RMN, pero la resolución máxima aumenta constantemente. Esta técnica sigue siendo particularmente valiosa para complejos de proteínas muy grandes, como las proteínas de la cubierta de virus y las fibras amiloides.

La composición general de la estructura secundaria se puede determinar mediante dicroísmo circular. La espectroscopia vibratoria también se puede utilizar para caracterizar la conformación de péptidos, polipéptidos y proteínas. La espectroscopia infrarroja bidimensional se ha convertido en un método valioso para investigar las estructuras de péptidos y proteínas flexibles que no pueden estudiarse con otros métodos. A menudo se obtiene una imagen más cualitativa de la estructura de la proteína mediante proteólisis, que también es útil para detectar muestras de proteínas más cristalizables. Las implementaciones novedosas de este enfoque, incluida la proteólisis paralela rápida (FASTpp), pueden probar la fracción estructurada y su estabilidad sin necesidad de purificación.Una vez que se ha determinado experimentalmente la estructura de una proteína, se pueden realizar computacionalmente más estudios detallados, utilizando simulaciones dinámicas moleculares de esa estructura.

Bases de datos de estructuras de proteínas

Una base de datos de estructuras de proteínas es una base de datos que se modela en torno a las diversas estructuras de proteínas determinadas experimentalmente. El objetivo de la mayoría de las bases de datos de estructuras de proteínas es organizar y anotar las estructuras de proteínas, proporcionando a la comunidad biológica acceso a los datos experimentales de una manera útil. Los datos incluidos en las bases de datos de estructuras de proteínas a menudo incluyen coordenadas 3D, así como información experimental, como las dimensiones de las celdas unitarias y los ángulos para estructuras determinadas por cristalografía de rayos X. Aunque la mayoría de los casos, en este caso proteínas o determinaciones específicas de la estructura de una proteína, también contienen información de secuencias y algunas bases de datos incluso proporcionan medios para realizar consultas basadas en secuencias, el atributo principal de una base de datos de estructuras es la información estructural, mientras que las bases de datos de secuencias se centran en información de secuencia, y no contienen información estructural para la mayoría de las entradas. Las bases de datos de estructura de proteínas son fundamentales para muchos esfuerzos en biología computacional, como el diseño de fármacos basado en estructuras, tanto en el desarrollo de los métodos computacionales utilizados como en el suministro de un gran conjunto de datos experimentales utilizados por algunos métodos para proporcionar información sobre la función de una proteína.

Clasificaciones estructurales de las proteínas.

Las estructuras de proteínas se pueden agrupar en función de su similitud estructural, clase topológica o un origen evolutivo común. La base de datos de clasificación estructural de proteínas y la base de datos CATH proporcionan dos clasificaciones estructurales diferentes de proteínas. Cuando la similitud estructural es grande, es posible que las dos proteínas hayan divergido de un ancestro común, y la estructura compartida entre proteínas se considera evidencia de homología. La similitud de estructura se puede utilizar para agrupar proteínas en superfamilias de proteínas. Si la estructura compartida es significativa pero la fracción compartida es pequeña, el fragmento compartido puede ser la consecuencia de un evento evolutivo más dramático, como la transferencia horizontal de genes, y ya no se justifica unir proteínas que comparten estos fragmentos en superfamilias de proteínas.La topología de una proteína también se puede utilizar para clasificar proteínas. La teoría de nudos y la topología de circuitos son dos marcos de topología desarrollados para la clasificación de pliegues de proteínas en función del cruce de cadenas y los contactos intracadenas, respectivamente.

Predicción computacional de la estructura de la proteína

La generación de una secuencia de proteína es mucho más fácil que la determinación de la estructura de una proteína. Sin embargo, la estructura de una proteína da mucha más información sobre la función de la proteína que su secuencia. Por lo tanto, se han desarrollado varios métodos para la predicción computacional de la estructura de la proteína a partir de su secuencia. Los métodos de predicción ab initio usan solo la secuencia de la proteína. Los métodos de modelado de subprocesos y homología pueden construir un modelo tridimensional para una proteína de estructura desconocida a partir de estructuras experimentales de proteínas relacionadas evolutivamente, denominadas familia de proteínas.

Contenido relacionado

Compuesto no estequiométrico

En química, los compuestos no estequiométricos son compuestos químicos, casi siempre compuestos inorgánicos sólidos, que tienen una composición...

Glucógeno

El glucógeno es un polisacárido de glucosa multiramificado que sirve como una forma de almacenamiento de energía en animales, hongos y bacterias. La...

Reducción-oxidación (Redox)

Reducción-oxidación es un tipo de reacción química en la que se modifican los estados de oxidación de los átomos. Las reacciones redox se caracterizan...
Más resultados...
Tamaño del texto:
undoredo
format_boldformat_italicformat_underlinedstrikethrough_ssuperscriptsubscriptlink
save