Ingeniería de proteínas
La ingeniería de proteínas es el proceso de desarrollar proteínas útiles o valiosas mediante el diseño y la producción de polipéptidos no naturales, a menudo mediante la alteración de las secuencias de aminoácidos que se encuentran en la naturaleza. Es una disciplina joven, con mucha investigación en curso sobre la comprensión del plegamiento de proteínas y el reconocimiento de los principios de diseño de proteínas. Se ha utilizado para mejorar la función de muchas enzimas para la catálisis industrial. También es un mercado de productos y servicios, con un valor estimado de $ 168 mil millones para 2017.
Hay dos estrategias generales para la ingeniería de proteínas: el diseño racional de proteínas y la evolución dirigida. Estos métodos no son mutuamente excluyentes; los investigadores a menudo aplicarán ambos. En el futuro, un conocimiento más detallado de la estructura y la función de las proteínas, y los avances en el cribado de alto rendimiento, pueden ampliar en gran medida las capacidades de la ingeniería de proteínas. Eventualmente, incluso se pueden incluir aminoácidos no naturales, a través de métodos más nuevos, como el código genético expandido, que permite codificar nuevos aminoácidos en el código genético.
Enfoques
Diseño racional
En el diseño racional de proteínas, un científico utiliza un conocimiento detallado de la estructura y función de una proteína para realizar los cambios deseados. En general, esto tiene la ventaja de ser económico y técnicamente fácil, ya que los métodos de mutagénesis dirigida al sitio están bien desarrollados. Sin embargo, su principal inconveniente es que el conocimiento estructural detallado de una proteína a menudo no está disponible e, incluso cuando está disponible, puede ser muy difícil predecir los efectos de varias mutaciones, ya que la información estructural suele proporcionar una imagen estática de la estructura de una proteína. Sin embargo, programas como Folding@home y Foldit han utilizado técnicas de crowdsourcing para obtener información sobre los motivos de plegamiento de las proteínas.
Algoritmos computacionales de diseño de proteínas buscan identificar nuevas secuencias de aminoácidos que tienen poca energía cuando se pliegan a la estructura objetivo preespecificada. Si bien el espacio de conformación de la secuencia que debe buscarse es grande, el requisito más desafiante para el diseño computacional de proteínas es una función de energía rápida pero precisa que pueda distinguir las secuencias óptimas de las subóptimas similares.
Alineación de secuencias múltiples
Sin información estructural sobre una proteína, el análisis de secuencias suele ser útil para dilucidar información sobre la proteína. Estas técnicas implican la alineación de secuencias de proteínas diana con otras secuencias de proteínas relacionadas. Esta alineación puede mostrar qué aminoácidos se conservan entre especies y son importantes para la función de la proteína. Estos análisis pueden ayudar a identificar los aminoácidos de puntos calientes que pueden servir como sitios de destino para las mutaciones. El alineamiento de secuencias múltiples utiliza bases de datos como PREFAB, SABMARK, OXBENCH, IRMBASE y BALIBASE para cruzar secuencias de proteínas diana con secuencias conocidas. Las técnicas de alineación de secuencias múltiples se enumeran a continuación.
Este método comienza realizando una alineación por pares de secuencias utilizando los métodos k-tuple o Needleman-Wunsch. Estos métodos calculan una matriz que representa la similitud por pares entre los pares de secuencias. Los puntajes de similitud se transforman luego en puntajes de distancia que se utilizan para producir un árbol guía utilizando el método de unión de vecinos. Este árbol guía se emplea luego para producir una alineación de secuencias múltiples.
Clusa omega
Este método es capaz de alinear hasta 190 000 secuencias utilizando el método k-tuple. Las siguientes secuencias se agrupan utilizando los métodos mBed y k-means. A continuación, se construye un árbol guía utilizando el método UPGMA que utiliza el paquete de alineación HH. Este árbol guía se utiliza para generar múltiples alineaciones de secuencias.
MAFFT
Este método utiliza la transformada rápida de Fourier (FFT) que convierte secuencias de aminoácidos en una secuencia compuesta por valores de volumen y polaridad para cada residuo de aminoácido. Esta nueva secuencia se utiliza para encontrar regiones homólogas.
K-Alinear
Este método utiliza el algoritmo de coincidencia de cadenas aproximado de Wu-Manber para generar múltiples alineaciones de secuencias.
Comparación de secuencias múltiples por expectativa de registro (MUSCLE)
Este método utiliza las distancias Kmer y Kimura para generar múltiples alineaciones de secuencias.
T-Café
Este método utiliza funciones objetivas de consistencia basadas en árboles para la evolución de la alineación. Se ha demostrado que este método es entre un 5 y un 10 % más preciso que el Clustal W.
Análisis coevolutivo
El análisis coevolutivo también se conoce como mutación correlacionada, covariación o cosustitución. Este tipo de diseño racional implica cambios evolutivos recíprocos en loci que interactúan evolutivamente. Generalmente, este método comienza con la generación de múltiples alineaciones de secuencia seleccionadas para la secuencia objetivo. Esta alineación luego se somete a un refinamiento manual que implica la eliminación de secuencias con muchos espacios vacíos, así como secuencias con baja identidad de secuencia. Este paso aumenta la calidad de la alineación. A continuación, la alineación procesada manualmente se utiliza para mediciones coevolutivas adicionales utilizando distintos algoritmos de mutación correlacionados. Estos algoritmos dan como resultado una matriz de puntuación de coevolución. Esta matriz se filtra aplicando varias pruebas de significancia para extraer valores significativos de coevolución y eliminar el ruido de fondo. Las mediciones coevolutivas se evalúan más a fondo para evaluar su rendimiento y rigor. Finalmente, los resultados de este análisis coevolutivo se validan experimentalmente.
Predicción estructural
De novo la síntesis de proteínas se beneficia del conocimiento de las estructuras proteicas existentes. Este conocimiento de la estructura proteica existente ayuda en la predicción de nuevas estructuras proteicas. Los métodos para la predicción de la estructura de proteínas pertenecen a una de las cuatro clases siguientes: ab initio, métodos basados en fragmentos, modelado de homología y enhebrado de proteínas.
Desde el principio
Estos métodos implican el modelado libre sin utilizar ninguna información estructural sobre la plantilla. Los métodos ab initio tienen como objetivo la predicción de las estructuras nativas de las proteínas correspondientes al mínimo global de su energía libre. algunos ejemplos de métodos ab initio son AMBER, GROMOS, GROMACS, CHARMM, OPLS y ENCEPP12. Los pasos generales para los métodos ab initio comienzan con la representación geométrica de la proteína de interés. A continuación, se desarrolla un modelo de función de energía potencial para la proteína. Este modelo se puede crear utilizando potenciales de mecánica molecular o funciones potenciales derivadas de la estructura de proteínas. Tras el desarrollo de un modelo potencial, se aplican a la proteína técnicas de búsqueda de energía que incluyen simulaciones de dinámica molecular, simulaciones de Monte Carlo y algoritmos genéticos.
Basado en fragmentos
Estos métodos utilizan información de bases de datos con respecto a las estructuras para hacer coincidir las estructuras homólogas con las secuencias de proteínas creadas. Estas estructuras homólogas se ensamblan para dar estructuras compactas utilizando procedimientos de puntuación y optimización, con el objetivo de lograr la puntuación de energía potencial más baja. Los servidores web para información de fragmentos son I-TASSER, ROSETTA, ROSETTA @ home, FRAGFOLD, CABS fold, PROFESY, CREF, QUARK, UNDERTAKER, HMM y ANGLOR.
Modelado de homología
Estos métodos se basan en la homología de proteínas. Estos métodos también se conocen como modelos comparativos. El primer paso en el modelado de homología es generalmente la identificación de secuencias molde de estructura conocida que son homólogas a la secuencia de consulta. A continuación, la secuencia de consulta se alinea con la secuencia de la plantilla. Siguiendo la alineación, las regiones conservadas estructuralmente se modelan usando la estructura de la plantilla. A esto le sigue el modelado de cadenas laterales y bucles que son distintos de la plantilla. Finalmente, la estructura modelada se somete a refinamiento y evaluación de calidad. Los servidores que están disponibles para datos de modelado de homología se enumeran aquí: SWISS MODEL, MODELLER, ReformAlign, PyMOD, TIP-STRUCTFAST, COMPASS, 3d-PSSM, SAMT02, SAMT99, HHPRED, FAGUE, 3D-JIGSAW, META-PP, ROSETTA y I-TASSER.
Enhebrado de proteínas
El enhebrado de proteínas se puede usar cuando no se puede encontrar un homólogo confiable para la secuencia de consulta. Este método comienza con la obtención de una secuencia de consulta y una biblioteca de estructuras de plantilla. A continuación, la secuencia de consulta se enhebra sobre estructuras de plantilla conocidas. Estos modelos candidatos se puntúan mediante funciones de puntuación. Estos se puntúan en función de los modelos de energía potencial tanto de la secuencia de consulta como de la plantilla. A continuación, se selecciona la coincidencia con el modelo de energía potencial más bajo. Los métodos y servidores para recuperar datos de subprocesos y realizar cálculos se enumeran aquí: GenTHREADER, pGenTHREADER, pDomTHREADER, ORFEUS, PROSPECT, BioShell-Threading, FFASO3, RaptorX, HHPred, servidor LOOPP, Sparks-X, SEGMER, THREADER2, ESYPRED3D, LIBRA, TOPITS, RAPTOR, COTH, MUSTER.
Para obtener más información sobre el diseño racional, consulte la mutagénesis dirigida al sitio.
Encuadernación multivalente
La unión multivalente se puede utilizar para aumentar la especificidad y la afinidad de la unión mediante efectos de avidez. Tener múltiples dominios de unión en una sola biomolécula o complejo aumenta la probabilidad de que ocurran otras interacciones a través de eventos de unión individuales. La avidez o la afinidad efectiva pueden ser mucho más altas que la suma de las afinidades individuales, lo que proporciona una herramienta rentable y rentable para la unión dirigida.
Proteínas multivalentes
Las proteínas multivalentes son relativamente fáciles de producir mediante modificaciones postraduccionales o multiplicando la secuencia de ADN que codifica la proteína. La principal ventaja de las proteínas multivalentes y multiespecíficas es que pueden aumentar la afinidad efectiva por un objetivo de una proteína conocida. En el caso de un objetivo no homogéneo, el uso de una combinación de proteínas que da como resultado una unión multiespecífica puede aumentar la especificidad, lo que tiene una alta aplicabilidad en la terapia con proteínas.
El ejemplo más común de unión multivalente son los anticuerpos, y existe una amplia investigación para los anticuerpos biespecíficos. Las aplicaciones de los anticuerpos biespecíficos cubren un amplio espectro que incluye diagnóstico, imaginología, profilaxis y terapia.
Evolución dirigida
En la evolución dirigida, la mutagénesis aleatoria, p. mediante PCR propensa a errores o mutagénesis de saturación de secuencias, se aplica a una proteína y se usa un régimen de selección para seleccionar variantes que tengan las características deseadas. Luego se aplican más rondas de mutación y selección. Este método imita la evolución natural y, en general, produce resultados superiores al diseño racional. Un proceso adicional, denominado mezcla de ADN, mezcla y combina piezas de variantes exitosas para producir mejores resultados. Tales procesos imitan la recombinación que ocurre naturalmente durante la reproducción sexual. Las ventajas de la evolución dirigida son que no requiere un conocimiento estructural previo de una proteína, ni es necesario poder predecir qué efecto tendrá una determinada mutación. De hecho, los resultados de los experimentos de evolución dirigida a menudo sorprenden porque los cambios deseados a menudo son causados por mutaciones que no se esperaba que tuvieran algún efecto. El inconveniente es que requieren un cribado de alto rendimiento, que no es factible para todas las proteínas. Se deben mutar grandes cantidades de ADN recombinante y los productos deben examinarse para detectar los rasgos deseados. La gran cantidad de variantes a menudo requiere equipos robóticos costosos para automatizar el proceso. Además, no todas las actividades deseadas se pueden seleccionar fácilmente.
La evolución darwiniana natural se puede imitar de forma eficaz en el laboratorio para adaptar las propiedades de las proteínas a diversas aplicaciones, incluida la catálisis. Existen muchas tecnologías experimentales para producir bibliotecas de proteínas grandes y diversas y para examinar o seleccionar variantes funcionales plegadas. Las proteínas plegadas surgen con una frecuencia sorprendente en el espacio de secuencias aleatorias, una ocurrencia explotable en la evolución de aglutinantes y catalizadores selectivos. Si bien es más conservador que la selección directa desde el espacio profundo de la secuencia, el rediseño de proteínas existentes mediante mutagénesis aleatoria y selección/cribado es un método particularmente sólido para optimizar o alterar las propiedades existentes. También representa un excelente punto de partida para lograr objetivos de ingeniería más ambiciosos. Combinar la evolución experimental con los métodos computacionales modernos es probablemente la estrategia más amplia y fructífera para generar macromoléculas funcionales desconocidas en la naturaleza.
Los principales desafíos del diseño de bibliotecas mutantes de alta calidad han mostrado un progreso significativo en el pasado reciente. Este progreso ha sido en forma de mejores descripciones de los efectos de las cargas mutacionales en los rasgos de las proteínas. Además, los enfoques computacionales han mostrado grandes avances en el espacio de secuencias innumerablemente grande a tamaños de cribado más manejables, creando así bibliotecas inteligentes de mutantes. El tamaño de la biblioteca también se ha reducido a tamaños más seleccionables mediante la identificación de residuos beneficiosos clave utilizando algoritmos para la recombinación sistemática. Finalmente, se ha dado un paso importante hacia la reingeniería eficiente de las enzimas con el desarrollo de modelos y algoritmos estadísticos más precisos que cuantifican y predicen los efectos mutacionales acoplados en las funciones de las proteínas.
En general, la evolución dirigida se puede resumir como un proceso iterativo de dos pasos que implica la generación de bibliotecas de proteínas mutantes y procesos de selección de alto rendimiento para seleccionar variantes con características mejoradas. Esta técnica no requiere un conocimiento previo de la relación entre estructura y función de la proteína. La evolución dirigida utiliza mutagénesis aleatoria o enfocada para generar bibliotecas de proteínas mutantes. Las mutaciones aleatorias se pueden introducir utilizando PCR propensa a errores o mutagénesis de saturación del sitio. Los mutantes también pueden generarse usando la recombinación de múltiples genes homólogos. La naturaleza ha desarrollado un número limitado de secuencias beneficiosas. La evolución dirigida hace posible identificar secuencias de proteínas no descubiertas que tienen funciones novedosas. Esta capacidad depende de la capacidad de las proteínas para tolerar las sustituciones de residuos de aminoácidos sin comprometer el plegamiento o la estabilidad.
Los métodos de evolución dirigida se pueden categorizar ampliamente en dos estrategias, métodos asexuales y sexuales.
Métodos asexuales
Los métodos asexuales no generan enlaces cruzados entre genes parentales. Los genes individuales se utilizan para crear bibliotecas mutantes utilizando diversas técnicas mutagénicas. Estos métodos asexuales pueden producir mutagénesis aleatoria o focalizada.
Mutagénesis aleatoria
Los métodos mutagénicos aleatorios producen mutaciones al azar en todo el gen de interés. La mutagénesis aleatoria puede introducir los siguientes tipos de mutaciones: transiciones, transversiones, inserciones, deleciones, inversiones, missense y nonsense. A continuación se muestran ejemplos de métodos para producir mutagénesis aleatoria.
PCR propenso a errores
La PCR propensa a errores utiliza el hecho de que la ADN polimerasa Taq carece de 3' a 5' actividad exonucleasa. Esto da como resultado una tasa de error de 0,001-0,002% por nucleótido por replicación. Este método comienza con la elección del gen, o el área dentro de un gen, que se desea mutar. A continuación, el grado de error requerido se calcula según el tipo y el grado de actividad que se desea generar. Este grado de error determina la estrategia de PCR propensa a errores que se va a emplear. Después de la PCR, los genes se clonan en un plásmido y se introducen en sistemas celulares competentes. Luego, estas células se analizan en busca de los rasgos deseados. Luego, los plásmidos se aíslan para obtener colonias que muestran características mejoradas y luego se usan como plantillas en la siguiente ronda de mutagénesis. La PCR propensa a errores muestra sesgos para ciertas mutaciones en relación con otras. Tales como sesgos por transiciones sobre transversiones.
Las tasas de error en PCR se pueden aumentar de las siguientes maneras:
- Aumentar la concentración de cloruro de magnesio, que estabiliza la unión de base no complementaria.
- Añadir cloruro de manganeso para reducir la especificidad del par base.
- Aumento y desequilibrado de la dNTPs.
- Adición de análogos base como dITP, 8 oxo-dGTP y dPTP.
- Aumentar la concentración de polimerasa Taq.
- Aumente el tiempo de extensión.
- Aumentar el tiempo del ciclo.
- Usar menos precisa polimerasa Taq.
Consulte también la reacción en cadena de la polimerasa para obtener más información.
PCR propenso a errores de círculo rodante
Este método de PCR se basa en la amplificación por círculo rodante, que se basa en el método que utilizan las bacterias para amplificar el ADN circular. Este método da como resultado dúplex de ADN lineales. Estos fragmentos contienen repeticiones en tándem de ADN circular llamados concatámeros, que pueden transformarse en cepas bacterianas. Las mutaciones se introducen clonando primero la secuencia diana en un plásmido apropiado. A continuación, el proceso de amplificación comienza utilizando cebadores de hexámeros aleatorios y polimerasa de ADN Φ29 en condiciones de amplificación de círculo rodante propensas a errores. Las condiciones adicionales para producir una amplificación de círculo rodante propensa a errores son 1,5 pM de ADN molde, 1,5 mM de MnCl2 y un tiempo de reacción de 24 horas. Se agrega MnCl2 a la mezcla de reacción para promover mutaciones puntuales aleatorias en las hebras de ADN. Las tasas de mutación se pueden incrementar aumentando la concentración de MnCl2, o disminuyendo la concentración de la plantilla de ADN. La amplificación por círculo rodante propensa a errores es ventajosa en relación con la PCR propensa a errores debido a su uso de cebadores de hexámeros aleatorios universales, en lugar de cebadores específicos. Además, los productos de reacción de esta amplificación no necesitan ser tratados con ligasas o endonucleasas. Esta reacción es isotérmica.
Mutagénesis química
La mutagénesis química implica el uso de agentes químicos para introducir mutaciones en secuencias genéticas. A continuación se muestran ejemplos de mutágenos químicos.
El bisulfato de sodio es eficaz para mutar secuencias genómicas ricas en G/C. Esto se debe a que el bisulfato de sodio cataliza la desaminación de la citosina no metilada a uracilo.
El metanosulfonato de etilo alquila residuos de guanidina. Esta alteración provoca errores durante la replicación del ADN.
El ácido nitroso provoca la transversión por desaminación de la adenina y la citosina.
El enfoque dual de la mutagénesis química aleatoria es un proceso iterativo de dos pasos. En primer lugar, implica la mutagénesis química in vivo del gen de interés a través de EMS. A continuación, el gen tratado se aísla y se clona en un vector de expresión no tratado para evitar mutaciones en el esqueleto del plásmido. Esta técnica preserva las propiedades genéticas de los plásmidos.
Glicosilasas dirigidas a matrices incrustadas para mutagénesis (TaGTEAM)
Este método se ha utilizado para crear mutagénesis in vivo dirigida en levadura. Este método implica la fusión de una 3-metiladenina ADN glicosilasa con el dominio de unión a ADN tetR. Se ha demostrado que esto aumenta las tasas de mutación en más de 800 veces en regiones del genoma que contienen sitios tetO.
Mutagénesis por inserción y eliminación aleatoria
Este método implica la alteración de la longitud de la secuencia a través de la eliminación e inserción simultáneas de fragmentos de bases de longitud arbitraria. Se ha demostrado que este método produce proteínas con nuevas funcionalidades mediante la introducción de nuevos sitios de restricción, codones específicos, codones de cuatro bases para aminoácidos no naturales.
Mutagénesis aleatoria basada en transposones
Recientemente se han informado muchos métodos para la mutagénesis aleatoria basada en transposones. Estos métodos incluyen, entre otros, los siguientes: permutación circular aleatoria PERMUTE, truncamiento aleatorio de proteínas, sustitución aleatoria de tripletes de nucleótidos, inserción aleatoria de dominios/etiquetas/múltiples aminoácidos, mutagénesis de exploración de codones y mutagénesis de exploración de múltiples codones. Todas estas técnicas antes mencionadas requieren el diseño de transposones mini-Mu. Thermo Scientific fabrica kits para el diseño de estos transposones.
Métodos de mutagénesis aleatoria que alteran la longitud del ADN objetivo
Estos métodos involucran la alteración de la longitud del gen a través de mutaciones de inserción y eliminación. Un ejemplo es el método de inserción repetida en tándem (TRINS). Esta técnica da como resultado la generación de repeticiones en tándem de fragmentos aleatorios del gen objetivo a través de la amplificación del círculo rodante y la incorporación simultánea de estas repeticiones en el gen objetivo.
Cepas mutantes
Las cepas mutantes son líneas celulares bacterianas que son deficientes en uno o más mecanismos de reparación del ADN. Un ejemplo de cadena mutadora es E. coli XL1-RED. Esta cepa subordinada de E. coli es deficiente en las rutas de reparación de ADN MutS, MutD, MutT. El uso de cepas mutantes es útil para introducir muchos tipos de mutación; sin embargo, estas cepas muestran enfermedades progresivas del cultivo debido a la acumulación de mutaciones en el genoma de las propias cepas.
Mutagénesis enfocada
Los métodos mutagénicos enfocados producen mutaciones en residuos de aminoácidos predeterminados. Estas técnicas requieren una comprensión de la relación secuencia-función de la proteína de interés. La comprensión de esta relación permite la identificación de residuos que son importantes en la estabilidad, la estereoselectividad y la eficiencia catalítica. A continuación se muestran ejemplos de métodos que producen mutagénesis enfocada.
Mutagénesis de saturación del sitio
La mutagénesis de saturación del sitio es un método basado en PCR que se utiliza para detectar aminoácidos con funciones significativas en la función de las proteínas. Las dos técnicas más comunes para realizar esto son la PCR única de plásmido completo y la PCR de extensión superpuesta.
La PCR única de plásmido completo también se conoce como mutagénesis dirigida al sitio (SDM). Los productos SDM se someten a digestión con endonucleasa Dpn. Esta digestión da como resultado la escisión de solo la cadena parental, porque la cadena parental contiene un GmATC que está metilado en N6 de adenina. SDM no funciona bien para plásmidos grandes de más de diez kilobases. Además, este método solo es capaz de reemplazar dos nucleótidos a la vez.
La PCR de extensión superpuesta requiere el uso de dos pares de cebadores. Un cebador de cada conjunto contiene una mutación. Se realiza una primera ronda de PCR utilizando estos conjuntos de cebadores y se forman dos dúplex de ADN de doble cadena. Luego se realiza una segunda ronda de PCR en la que estos dúplex se desnaturalizan y se hibridan nuevamente con los conjuntos de cebadores para producir heterodúplex, en los que cada cadena tiene una mutación. Cualquier brecha en estos heterodúplex recién formados se llena con polimerasas de ADN y se amplifica aún más.
Mutagénesis de saturación de secuencia (SeSaM)
La mutagénesis por saturación de secuencia da como resultado la aleatorización de la secuencia objetivo en cada posición de nucleótido. Este método comienza con la generación de fragmentos de ADN de longitud variable unidos a bases universales mediante el uso de transferasas molde en el extremo 3'. términos A continuación, estos fragmentos se extienden en toda su longitud utilizando una plantilla monocatenaria. Las bases universales se reemplazan con una base estándar aleatoria, lo que provoca mutaciones. Existen varias versiones modificadas de este método, como SeSAM-Tv-II, SeSAM-Tv+ y SeSAM-III.
Reacciones de un solo cebador en paralelo (SPRINP)
Este método de mutagénesis de saturación del sitio implica dos reacciones de PCR separadas. La primera de las cuales usa solo cebadores directos, mientras que la segunda reacción usa solo cebadores inversos. Esto evita la formación de dímeros de cebadores.
Mutagénesis enfocada libre de ligasa y mega cebada
Esta técnica mutagénica de saturación del sitio comienza con un oligonucleótido mutagénico y un cebador flanqueante universal. Estos dos reactivos se utilizan para un ciclo de PCR inicial. Los productos de este primer ciclo de PCR se utilizan como megacebadores para la siguiente PCR.
Ω-PCR
Este método mutagénico de saturación del sitio se basa en la PCR de extensión superpuesta. Se utiliza para introducir mutaciones en cualquier sitio de un plásmido circular.
PFunkel-ominchange-OSCARR
Este método utiliza mutagénesis dirigida al sitio definida por el usuario en uno o varios sitios simultáneamente. OSCARR es un acrónimo de metodología simple de un recipiente para la aleatorización y recombinación de cassettes. Esta aleatorización y recombinación da como resultado la aleatorización de los fragmentos deseados de una proteína. Omnichange es una mutagénesis de saturación multisitio independiente de secuencia que puede saturar hasta cinco codones independientes en un gen.
Mutagénesis trímero-dímero
Este método elimina los codones redundantes y los codones de terminación.
Mutagénesis en casete
Este es un método basado en PCR. La mutagénesis en casete comienza con la síntesis de un casete de ADN que contiene el gen de interés, que está flanqueado a ambos lados por sitios de restricción. La endonucleasa que escinde estos sitios de restricción también escinde sitios en el plásmido objetivo. El casete de ADN y el plásmido objetivo se tratan con endonucleasas para escindir estos sitios de restricción y crear extremos cohesivos. A continuación, los productos de esta escisión se ligan entre sí, lo que da como resultado la inserción del gen en el plásmido objetivo. Se utiliza una forma alternativa de mutagénesis de cassette denominada mutagénesis de cassette combinatoria para identificar las funciones de residuos de aminoácidos individuales en la proteína de interés. A continuación, la mutagénesis de conjunto recursiva utiliza información de la mutagénesis de casete combinatoria anterior. La mutagénesis del casete de codones le permite insertar o reemplazar un solo codón en un sitio particular en el ADN de doble cadena.
Métodos sexuales
Los métodos sexuales de evolución dirigida implican la recombinación in vitro que imita la recombinación in vivo natural. Generalmente, estas técnicas requieren una alta homología de secuencia entre las secuencias parentales. Estas técnicas se usan a menudo para recombinar dos genes parentales diferentes, y estos métodos crean cruces entre estos genes.
Recombinación homóloga in vitro
La recombinación homóloga se puede clasificar como in vivo o in vitro. La recombinación homóloga in vitro imita la recombinación natural in vivo. Estos métodos de recombinación in vitro requieren una alta homología de secuencia entre las secuencias parentales. Estas técnicas aprovechan la diversidad natural de los genes parentales recombinándolos para producir genes quiméricos. La quimera resultante muestra una mezcla de características parentales.
Mezcla de ADN
Esta técnica in vitro fue una de las primeras técnicas en la era de la recombinación. Comienza con la digestión de genes parentales homólogos en pequeños fragmentos por DNase1. Estos pequeños fragmentos luego se purifican a partir de genes parentales no digeridos. A continuación, los fragmentos purificados se vuelven a ensamblar mediante PCR sin cebador. Esta PCR involucra fragmentos homólogos de diferentes genes parentales que se preparan entre sí, lo que da como resultado un ADN quimérico. A continuación, el ADN quimérico del tamaño original se amplifica utilizando cebadores terminales terminales en PCR normal.
Recombinación in vitro de cebado aleatorio (RPR)
Este método de recombinación homóloga in vitro comienza con la síntesis de muchos fragmentos de genes cortos que exhiben mutaciones puntuales utilizando cebadores de secuencia aleatoria. Estos fragmentos se vuelven a ensamblar en genes parentales completos mediante PCR sin cebador. Estas secuencias reensambladas luego se amplifican mediante PCR y se someten a procesos de selección adicionales. Este método es ventajoso en relación con la mezcla aleatoria de ADN porque no se utiliza DNase1, por lo que no hay sesgo para la recombinación junto a un nucleótido de pirimidina. Este método también es ventajoso debido a su uso de cebadores aleatorios sintéticos que son uniformes en longitud y carecen de sesgos. Finalmente, este método es independiente de la longitud de la secuencia de la plantilla de ADN y requiere una pequeña cantidad de ADN parental.
PCR específica de gen metagenómico truncado
Este método genera genes quiméricos directamente a partir de muestras metagenómicas. Comienza con el aislamiento del gen deseado mediante un cribado funcional a partir de una muestra de ADN metagenómico. A continuación, se diseñan y utilizan cebadores específicos para amplificar los genes homólogos de diferentes muestras ambientales. Finalmente, se generan bibliotecas quiméricas para recuperar los clones funcionales deseados mezclando estos genes homólogos amplificados.
Proceso de prórroga escalonada (StEP)
Este método in vitro se basa en el cambio de plantilla para generar genes quiméricos. Este método basado en PCR comienza con una desnaturalización inicial de la plantilla, seguida de la hibridación de los cebadores y un tiempo de extensión corto. Todos los ciclos posteriores generan recocido entre los fragmentos cortos generados en ciclos anteriores y diferentes partes de la plantilla. Estos fragmentos cortos y las plantillas se hibridan entre sí en función de la complementariedad de secuencias. Este proceso de hibridación de fragmentos de ADN molde se conoce como cambio de molde. Estos fragmentos recocidos servirán luego como cebadores para una mayor extensión. Este método se lleva a cabo hasta que se obtiene la secuencia del gen quimérico de longitud parental. La ejecución de este método solo requiere cebadores flanqueantes para comenzar. Tampoco hay necesidad de la enzima Dnase1.
Quimeragénesis aleatoria en plantillas transitorias (RACHITT)
Se ha demostrado que este método genera bibliotecas de genes quiméricos con un promedio de 14 cruces por gen quimérico. Comienza alineando fragmentos de una hebra superior parental en la hebra inferior de una plantilla que contiene uracilo de un gen homólogo. 5' y 3' los colgajos salientes se escinden y los huecos se llenan mediante las actividades exonucleasa y endonucleasa de las ADN polimerasas Pfu y taq. A continuación, el molde que contiene uracilo se elimina del heterodúplex mediante tratamiento con una ADN glcosilasa de uracilo, seguido de una amplificación adicional mediante PCR. Este método es ventajoso porque genera quimeras con una frecuencia de cruce relativamente alta. Sin embargo, es algo limitado debido a la complejidad y la necesidad de generar ADN monocatenario y ADN molde monocatenario que contiene uracilo.
Mezcla sintética
La mezcla aleatoria de oligonucleótidos degenerados sintéticos agrega flexibilidad a los métodos de mezcla aleatoria, ya que se pueden incluir oligonucleótidos que contienen codones óptimos y mutaciones beneficiosas.
Recombinación homóloga in vivo
La clonación realizada en levadura implica el reensamblaje dependiente de PCR de vectores de expresión fragmentados. Estos vectores reensamblados luego se introducen y se clonan en levadura. El uso de levadura para clonar el vector evita la toxicidad y la contraselección que se produciría mediante la ligadura y la propagación en E. coli.
Proceso de recombinación organizada mutagénica por agrupamiento homólogo in vivo (MORPHING)
Este método introduce mutaciones en regiones específicas de genes mientras deja otras partes intactas al utilizar la alta frecuencia de recombinación homóloga en la levadura.
Evolución continua asistida por fagos (PACE)
Este método utiliza un bacteriófago con un ciclo de vida modificado para transferir genes en evolución de un huésped a otro. El ciclo de vida del fago está diseñado de tal manera que la transferencia se correlaciona con la actividad de interés de la enzima. Este método es ventajoso porque requiere una intervención humana mínima para la evolución continua del gen.
Métodos de recombinación no homóloga in vitro
Estos métodos se basan en el hecho de que las proteínas pueden exhibir una identidad estructural similar pero carecen de homología de secuencia.
Mezcla de exones
La combinación de exones es la combinación de exones de diferentes proteínas mediante eventos de recombinación que ocurren en los intrones. El barajado de exones ortólogos implica la combinación de exones de genes ortólogos de diferentes especies. El barajado de dominios ortólogos implica el barajado de dominios proteicos completos de genes ortólogos de diferentes especies. El barajado de exones parálogos implica el barajado de exones de diferentes genes de la misma especie. El barajado de dominios parálogos implica el barajado de dominios proteicos completos a partir de proteínas parálogas de la misma especie. El barajado de homólogos funcionales implica el barajado de dominios no homólogos que están relacionados funcionalmente. Todos estos procesos son con amplificación de los exones deseados de diferentes genes utilizando oligonucleótidos sintéticos quiméricos. Estos productos de amplificación luego se vuelven a ensamblar en genes de longitud completa utilizando PCR sin cebador. Durante estos ciclos de PCR, los fragmentos actúan como moldes y cebadores. Esto da como resultado genes quiméricos de longitud completa, que luego se someten a exploración.
Truncamiento incremental para la creación de enzimas híbridas (ITCHY)
Los fragmentos de genes parentales se crean mediante digestión controlada por exonucleasa III. Estos fragmentos se hacen romos usando endonucleasa y se ligan para producir genes híbridos. TIOITCHY es una técnica de ITCHY modificada que utilizó análogos de trifosfato de nucleótidos como los dNTP de fosfotioato α. La incorporación de estos nucleótidos bloquea la digestión por exonucleasa III. Esta inhibición de la digestión por la exonucleasa III se llama spiking. El enriquecimiento se puede lograr truncando primero los genes con exonucleasa para crear fragmentos con salientes monocatenarios cortos. Estos fragmentos luego sirven como moldes para la amplificación por la ADN polimerasa en presencia de pequeñas cantidades de dNTP de fosfotioato. Estos fragmentos resultantes luego se ligan entre sí para formar genes de longitud completa. Como alternativa, los genes parentales intactos pueden amplificarse mediante PCR en presencia de dNTP normales y dNTP de fosfotioato. Estos productos de amplificación de longitud completa se someten luego a digestión por una exonucleasa. La digestión continuará hasta que la exonucleasa encuentre un α-pdNTP, lo que dará como resultado fragmentos de diferente longitud. Estos fragmentos luego se ligan entre sí para generar genes quiméricos.
RASPANTE
Este método genera bibliotecas de genes híbridos que inhiben los entrecruzamientos múltiples al combinar la mezcla aleatoria de ADN e ITCHY. Este método comienza con la construcción de dos bibliotecas ITCHY independientes. El primero con el gen A en el N-terminal. Y el otro que tiene el gen B en el N-terminal. Estos fragmentos de genes híbridos se separan mediante digestión con enzimas de restricción o PCR con cebadores terminales mediante electroforesis en gel de agarosa. Estos fragmentos aislados luego se mezclan y se digieren más utilizando DNase1. Los fragmentos digeridos luego se vuelven a ensamblar mediante PCR sin cebador con cambio de plantilla.
Extensión recombinada en plantillas truncadas (RETT)
Este método genera bibliotecas de genes híbridos mediante el cambio de plantilla de polinucleótidos que crecen unidireccionalmente en presencia de fragmentos de ADN monocatenario como plantillas para quimeras. Este método comienza con la preparación de fragmentos de ADN monocatenario mediante transcripción inversa a partir del ARNm objetivo. Los cebadores específicos de genes luego se hibridan con el ADN monocatenario. Estos genes luego se extienden durante un ciclo de PCR. A este ciclo le sigue el cambio de plantilla y la hibridación de los fragmentos cortos obtenidos a partir de la extensión del cebador anterior a otros fragmentos de ADN monocatenario. Este proceso se repite hasta que se obtiene ADN monocatenario de longitud completa.
Recombinación de proteínas independiente de homología de secuencia (SHIPREC)
Este método genera recombinación entre genes con poca o ninguna homología de secuencia. Estas quimeras se fusionan a través de una secuencia enlazadora que contiene varios sitios de restricción. Esta construcción luego se digiere usando DNase1. Los fragmentos se fabrican con extremos romos usando nucleasa S1. Estos fragmentos de extremos romos se juntan en una secuencia circular mediante ligación. Esta construcción circular luego se linealiza usando enzimas de restricción para los cuales los sitios de restricción están presentes en la región enlazadora. Esto da como resultado una biblioteca de genes quiméricos en la que la contribución de los genes a 5' y 3' end se invertirá en comparación con la construcción inicial.
Quimeragénesis dirigida al sitio independiente de secuencia (SISDC)
Este método da como resultado una biblioteca de genes con cruces múltiples de varios genes parentales. Este método no requiere identidad de secuencia entre los genes parentales. Esto requiere uno o dos aminoácidos conservados en cada posición de cruce. Comienza con la alineación de las secuencias parentales y la identificación de las regiones de consenso que sirven como sitios de cruce. A esto le sigue la incorporación de etiquetas específicas que contienen sitios de restricción, seguida de la eliminación de las etiquetas mediante digestión con Bac1, lo que da como resultado genes con extremos cohesivos. Estos fragmentos de genes se mezclan y ligan en un orden apropiado para formar bibliotecas quiméricas.
Recombinación homodúplex degenerada (DHR)
Este método comienza con la alineación de genes homólogos, seguida de la identificación de regiones de polimorfismo. A continuación, la hebra superior del gen se divide en pequeños oligonucleótidos degenerados. La hebra inferior también se digiere en oligonucleótidos para que sirvan como andamios. Estos fragmentos se combinan en solución donde los oligonucleótidos de la cadena superior se ensamblan en los oligonucleótidos de la cadena inferior. Los huecos entre estos fragmentos se rellenan con polimerasa y se ligan.
PCR multirrecombinante aleatoria (RM-PCR)
Este método implica la mezcla aleatoria de varios fragmentos de ADN sin homología, en una sola PCR. Esto da como resultado la reconstrucción de proteínas completas mediante el ensamblaje de módulos que codifican diferentes unidades estructurales.
Recombinación de ADN fácil de usar (USERec)
Este método comienza con la amplificación de fragmentos de genes que necesitan ser recombinados, utilizando dNTP de uracilo. Esta solución de amplificación también contiene cebadores, PfuTurbo y ADN polimerasa Cx Hotstart. Los productos amplificados se incuban a continuación con la enzima USER. Esta enzima cataliza la eliminación de residuos de uracilo del ADN creando brechas de un solo par de bases. Los fragmentos tratados con la enzima USER se mezclan y ligan utilizando ADN ligasa T4 y se someten a digestión con Dpn1 para eliminar el ADN molde. Estos fragmentos de cadena Dingle resultantes se someten a amplificación mediante PCR y se transforman en E. coli.
Recombinación aleatoria Golden Gate (GGS)
Este método le permite recombinar al menos 9 fragmentos diferentes en un vector aceptor mediante el uso de una enzima de restricción de tipo 2 que corta fuera de los sitios de restricción. Comienza con la subclonación de fragmentos en vectores separados para crear secuencias flanqueantes de Bsa1 en ambos lados. A continuación, estos vectores se escinden utilizando la enzima de restricción de tipo II Bsa1, que genera salientes monocatenarios de cuatro nucleótidos. Los fragmentos con salientes complementarios se hibridan y ligan usando ADN ligasa T4. Finalmente, estas construcciones se transforman luego en células de E. coli, que se analizan en cuanto a los niveles de expresión.
Método de recombinación de ADN basado en tioato de fósforo (PRTec)
Este método se puede utilizar para recombinar elementos estructurales o dominios de proteínas completos. Este método se basa en la química del fosforotioato que permite la escisión específica de los enlaces fosforotiodiéster. El primer paso del proceso comienza con la amplificación de los fragmentos que deben recombinarse junto con la columna vertebral del vector. Esta amplificación se logra utilizando cebadores con nucleótidos fosforotiolados en 5' termina Los productos de PCR amplificados se escinden en una solución de etanol y yodo a altas temperaturas. A continuación, estos fragmentos se hibridan a temperatura ambiente y se transforman en E. coli, que repara cualquier muesca.
Integrón
Este sistema se basa en un sistema de recombinación específico del sitio natural en E. coli. Este sistema se denomina sistema de integrones y produce una mezcla natural de genes. Este método se utilizó para construir y optimizar un operón biosintético de triptófano funcional en E. coli deficiente en trp mediante la entrega de casetes de recombinación individuales o genes trpA-E junto con elementos reguladores con el sistema integrón.
Mezcla basada en ligadura en Y (YLBS)
Este método genera hebras de ADN monocatenarias, que abarcan una secuencia de un solo bloque ya sea en el 5" o 3' extremo, secuencias complementarias en una región de bucle de tallo y una región de rama D que sirve como un sitio de unión de cebador para PCR. Cantidades equivalentes de ambos 5' y 3' las hebras se mezclan y forman un híbrido debido a la complementariedad en la región del tallo. Híbridos con fosforilados libres 5' terminar en 3' luego se ligan las medias hebras con hilos de 3' libres. termina en 5' medias hebras usando ADN ligasa T4 en presencia de ATP 0,1 mM. Los productos ligados luego se amplifican mediante dos tipos de PCR para generar pre 5' medio y pre 3' la mitad de los productos de PCR. Estos productos de PCR se convierten en hebras simples a través de la unión de avidina-biotina al 5' extremo de los primos que contenían secuencias madre que estaban marcadas con biotina. A continuación, biotinilado 5' hebras medias y no biotiniladas 3' las medias hebras se utilizan como 5' y 3' medias hebras para el siguiente ciclo de ligadura en Y.
Diseño semi-racional
El diseño semirracional utiliza información sobre la secuencia, la estructura y la función de una proteína, junto con algoritmos predictivos. Juntos, estos se utilizan para identificar los residuos de aminoácidos objetivo que tienen más probabilidades de influir en la función de la proteína. Las mutaciones de estos residuos de aminoácidos clave crean bibliotecas de proteínas mutantes que tienen más probabilidades de tener propiedades mejoradas.
Los avances en la ingeniería de enzimas semirracional y el diseño de enzimas de novo brindan a los investigadores nuevas estrategias poderosas y efectivas para manipular biocatalizadores. La integración de enfoques basados en secuencias y estructuras en el diseño de bibliotecas ha demostrado ser una gran guía para el rediseño de enzimas. En general, los métodos computacionales de novo y de rediseño actuales no se comparan con las variantes evolucionadas en el rendimiento catalítico. Aunque la optimización experimental se puede producir utilizando la evolución dirigida, se lograrán mejoras adicionales en la precisión de las predicciones de estructuras y una mayor capacidad catalítica con mejoras en los algoritmos de diseño. Se pueden incluir mejoras funcionales adicionales en simulaciones futuras mediante la integración de la dinámica de proteínas.
Los estudios bioquímicos y biofísicos, junto con el ajuste fino de los marcos predictivos, serán útiles para evaluar experimentalmente la importancia funcional de las características de diseño individuales. Una mejor comprensión de estas contribuciones funcionales dará retroalimentación para la mejora de futuros diseños.
Es probable que la evolución dirigida no sea reemplazada como el método elegido para la ingeniería de proteínas, aunque el diseño computacional de proteínas ha cambiado fundamentalmente la forma en que la ingeniería de proteínas puede manipular biomacromoléculas. Se pueden generar bibliotecas más pequeñas, más enfocadas y funcionalmente ricas mediante el uso de métodos que incorporan marcos predictivos para la ingeniería de proteínas basada en hipótesis. Las nuevas estrategias de diseño y los avances técnicos han iniciado un alejamiento de los protocolos tradicionales, como la evolución dirigida, que representa la estrategia más efectiva para identificar candidatos de alto rendimiento en bibliotecas enfocadas. La síntesis de bibliotecas de genes completos está reemplazando los protocolos de barajado y mutagénesis para la preparación de bibliotecas. También se aplican cada vez más ensayos de detección de bajo rendimiento altamente específicos en lugar de los monumentales esfuerzos de detección y selección de millones de candidatos. Juntos, estos desarrollos están preparados para llevar la ingeniería de proteínas más allá de la evolución dirigida y hacia estrategias prácticas y más eficientes para adaptar biocatalizadores.
Técnicas de cribado y selección
Una vez que una proteína ha pasado por evolución dirigida, diseño de ración o diseño de semi-ración, las bibliotecas de proteínas mutantes deben examinarse para determinar qué mutantes muestran propiedades mejoradas. Los métodos de presentación de fagos son una opción para detectar proteínas. Este método implica la fusión de genes que codifican los polipéptidos variantes con genes de proteínas de la cubierta del fago. Las variantes de proteínas expresadas en las superficies de los fagos se seleccionan uniéndose a dianas inmovilizadas in vitro. Los fagos con variantes de proteínas seleccionadas luego se amplifican en bacterias, seguido de la identificación de clones positivos mediante un ensayo inmunoabsorbente ligado a enzimas. Estos fagos seleccionados se someten luego a la secuenciación del ADN.
Los sistemas de visualización de la superficie celular también se pueden utilizar para seleccionar bibliotecas de polipéptidos mutantes. Los genes mutantes de la biblioteca se incorporan en vectores de expresión que luego se transforman en células huésped apropiadas. Estas células huésped se someten a otros métodos de selección de alto rendimiento para identificar las células con los fenotipos deseados.
Se han desarrollado sistemas de visualización sin células para aprovechar la traducción de proteínas in vitro o la traducción sin células. Estos métodos incluyen presentación de ARNm, presentación de ribosomas, presentación de ADN covalente y no covalente y compartimentación in vitro.
Ingeniería enzimática
La ingeniería enzimática es la aplicación de modificar la estructura de una enzima (y, por lo tanto, su función) o modificar la actividad catalítica de enzimas aisladas para producir nuevos metabolitos, para permitir nuevas vías (catalizadas) para que ocurran las reacciones. o convertir de unos ciertos compuestos a otros (biotransformación). Estos productos son útiles como productos químicos, farmacéuticos, combustibles, alimentos o aditivos agrícolas.
Un reactor enzimático consta de un recipiente que contiene un medio de reacción que se utiliza para realizar una conversión deseada por medios enzimáticos. Las enzimas utilizadas en este proceso están libres en la solución. También los microorganismos son uno de origen importante para las enzimas genuinas.
Ejemplos de proteínas diseñadas
Se han utilizado métodos informáticos para diseñar una proteína con un nuevo pliegue, denominada Top7, y sensores para moléculas no naturales. La ingeniería de proteínas de fusión ha producido rilonacept, un fármaco que ha obtenido la aprobación de la Administración de Drogas y Alimentos (FDA) para tratar el síndrome periódico asociado a la criopirina.
Otro método informático, IPRO, diseñó con éxito el cambio de la especificidad del cofactor de Candida boidinii xilosa reductasa. Rediseño y optimización de proteínas iterativas (IPRO) rediseña proteínas para aumentar o dar especificidad a sustratos y cofactores nativos o novedosos. Esto se hace perturbando repetidamente al azar la estructura de las proteínas alrededor de posiciones de diseño específicas, identificando la combinación de rotámeros de energía más baja y determinando si el nuevo diseño tiene una energía de unión más baja que los anteriores.
El diseño asistido por computación también se ha utilizado para diseñar propiedades complejas de un conjunto de nanoproteínas altamente ordenado. Una jaula de proteínas, la bacterioferritina de E. coli (EcBfr), que naturalmente muestra inestabilidad estructural y un comportamiento de autoensamblaje incompleto al poblar dos estados de oligomerización, es la proteína modelo en este estudio. A través del análisis computacional y la comparación con sus homólogos, se descubrió que esta proteína tiene una interfaz dimérica más pequeña que el promedio en su eje de simetría doble debido principalmente a la existencia de una bolsa de agua interfacial centrada en dos residuos de asparagina con puente de agua.. Para investigar la posibilidad de diseñar EcBfr para la estabilidad estructural modificada, se utiliza un método computacional semiempírico para explorar virtualmente las diferencias de energía de los 480 posibles mutantes en la interfaz dimérica en relación con el EcBfr de tipo salvaje. Este estudio computacional también converge en las asparaginas con puente de agua. Reemplazar estas dos asparaginas con aminoácidos hidrofóbicos da como resultado proteínas que se pliegan en monómeros alfa-helicoidales y se ensamblan en jaulas, como lo demuestra el dicroísmo circular y la microscopía electrónica de transmisión. Tanto la desnaturalización térmica como la química confirman que todas las proteínas rediseñadas, de acuerdo con los cálculos, poseen mayor estabilidad. Una de las tres mutaciones cambia la población a favor del estado de oligomerización de orden superior en solución, como se muestra tanto por cromatografía de exclusión por tamaño como por electroforesis en gel nativo.
Se desarrolló con éxito un método in silico, PoreDesigner, para rediseñar la proteína del canal bacteriano (OmpF) para reducir su tamaño de poro de 1 nm a cualquier dimensión subnm deseada. Los experimentos de transporte en los poros diseñados más estrechos revelaron un rechazo completo de la sal cuando se ensamblaron en matrices biomiméticas de polímeros en bloque.
Contenido relacionado
IPM
Agroecología
Gaviota (desambiguación)