Proteoma
El proteoma es el conjunto completo de proteínas que es o puede ser expresado por un genoma, célula, tejido u organismo en un momento determinado. Es el conjunto de proteínas expresadas en un determinado tipo de célula u organismo, en un momento dado, en condiciones definidas. La proteómica es el estudio del proteoma.
Tipos de proteomas
Si bien el proteoma generalmente se refiere al proteoma de un organismo, los organismos multicelulares pueden tener proteomas muy diferentes en diferentes células, por lo que es importante distinguir los proteomas en células y organismos.
Un proteoma celular es la colección de proteínas que se encuentran en un tipo de célula particular bajo un conjunto particular de condiciones ambientales, como la exposición a la estimulación hormonal.
También puede ser útil considerar el proteoma completo de un organismo, que puede conceptualizarse como el conjunto completo de proteínas de todos los diversos proteomas celulares. Esto es muy aproximadamente el equivalente proteico del genoma.
El término proteoma también se ha utilizado para referirse al conjunto de proteínas en determinados sistemas subcelulares, como los orgánulos. Por ejemplo, el proteoma mitocondrial puede constar de más de 3000 proteínas distintas.
Las proteínas de un virus pueden denominarse proteoma viral. Por lo general, los proteomas virales se predicen a partir del genoma viral, pero se han realizado algunos intentos para determinar todas las proteínas expresadas a partir de un genoma viral, es decir, el proteoma viral. Más a menudo, sin embargo, la proteómica del virus analiza los cambios de las proteínas del huésped tras la infección del virus, de modo que en efecto se estudian dos proteomas (del virus y su huésped).
Importancia en el cáncer
El proteoma se puede utilizar para analizar comparativamente diferentes líneas celulares de cáncer. Se han utilizado estudios proteómicos para identificar la probabilidad de metástasis en las líneas celulares de cáncer de vejiga KK47 e YTS1 y se encontró que tenían 36 proteínas no reguladas y 74 reguladas a la baja. Las diferencias en la expresión de proteínas pueden ayudar a identificar nuevos mecanismos de señalización del cáncer.
Se han encontrado biomarcadores de cáncer mediante análisis proteómicos basados en espectrometría de masas. El uso de la proteómica o el estudio del proteoma es un paso adelante en la medicina personalizada para adaptar cócteles de fármacos al perfil proteómico y genómico específico del paciente. El análisis de líneas celulares de cáncer de ovario mostró que los biomarcadores putativos para el cáncer de ovario incluyen "α-enolasa (ENOA), factor de elongación Tu, mitocondrial (EFTU), gliceraldehído-3-fosfato deshidrogenasa (G3P), proteína de estrés-70, mitocondrial (GRP75), apolipoproteína A-1 (APOA1), peroxirredoxina (PRDX2) y anexina A (ANXA)".
Los análisis proteómicos comparativos de 11 líneas celulares demostraron la similitud entre los procesos metabólicos de cada línea celular; 11.731 proteínas fueron completamente identificadas a partir de este estudio. Las proteínas de limpieza tienden a mostrar una mayor variabilidad entre las líneas celulares.
Todavía no se comprende bien la resistencia a ciertos medicamentos contra el cáncer. El análisis proteómico se ha utilizado para identificar proteínas que pueden tener propiedades farmacológicas contra el cáncer, específicamente para el irinotecán, un fármaco contra el cáncer de colon. Los estudios de la línea celular de adenocarcinoma LoVo demostraron que 8 proteínas no estaban reguladas y 7 proteínas estaban reguladas a la baja. Las proteínas que mostraron una expresión diferencial estuvieron involucradas en procesos como la transcripción, la apoptosis y la proliferación/diferenciación celular, entre otros.
El proteoma en sistemas bacterianos
Se han realizado análisis proteómicos en diferentes tipos de bacterias para evaluar sus reacciones metabólicas a diferentes condiciones. Por ejemplo, en bacterias como Clostridium y Bacillus, se utilizaron análisis proteómicos para investigar cómo diferentes proteínas ayudan a que cada una de estas esporas bacterianas germine después de un período prolongado de latencia. Para comprender mejor cómo eliminar adecuadamente las esporas, se debe realizar un análisis proteómico.
Historia
Marc Wilkins acuñó el término proteoma en 1994 en un simposio sobre "Electroforesis 2D: de los mapas de proteínas a los genomas" celebrada en Siena en Italia. Apareció impresa en 1995, con la publicación de parte de su tesis doctoral. Wilkins usó el término para describir el complemento completo de proteínas expresadas por un genoma, célula, tejido u organismo.
Tamaño y contenido
Los genomas de virus y procariotas codifican un proteoma relativamente bien definido, ya que cada proteína se puede predecir con gran confianza, en función de su marco de lectura abierto (en virus que van de ~3 a ~1000, en bacterias que van desde alrededor de 500 proteínas hasta alrededor de 10,000). Sin embargo, la mayoría de los algoritmos de predicción de proteínas utilizan ciertos límites, como 50 o 100 aminoácidos, por lo que estas predicciones a menudo pasan por alto las proteínas pequeñas. En los eucariotas, esto se vuelve mucho más complicado, ya que se puede producir más de una proteína a partir de la mayoría de los genes debido al corte y empalme alternativo (por ejemplo, el proteoma humano codifica alrededor de 20 000 proteínas, pero algunas estimaciones predijeron 92 179 proteínas, de las cuales 71 173 son variantes de corte y empalme).
Proteoformas. Hay diferentes factores que pueden añadir variabilidad a las proteínas. Los SAP (polimorfismos de un solo aminoácido) y los polimorfismos de un solo nucleótido no sinónimos (nsSNP) pueden conducir a diferentes "proteoformas" o "proteomorfos". Estimaciones recientes han encontrado ~135 000 cSNP no sinónimos validados actualmente alojados en SwissProt. En dbSNP, hay 4,7 millones de cSNP candidatos, pero solo ~670 000 cSNP se han validado en el conjunto de 1000 genomas como cSNP no sinónimos que cambian la identidad de un aminoácido en una proteína.
Proteoma oscuro. El término proteoma oscuro acuñado por Perdigão y sus colegas define regiones de proteínas que no tienen una homología de secuencia detectable con otras proteínas de estructura tridimensional conocida y, por lo tanto, no pueden modelarse por homología. Para 546 000 proteínas Swiss-Prot, se encontró que entre el 44 % y el 54 % del proteoma en eucariotas y virus era "oscuro", en comparación con solo ~14 % en arqueas y bacterias.
Proteoma humano. Actualmente, varios proyectos tienen como objetivo mapear el proteoma humano, incluido Human Proteome Map, ProteomicsDB, isoform.io y The Human Proteome Project (HPP). Al igual que el proyecto del genoma humano, estos proyectos buscan encontrar y recopilar evidencia de todos los genes de codificación de proteínas previstos en el genoma humano. El Mapa del Proteoma Humano actualmente (octubre de 2020) reclama 17.294 proteínas y ProteomicsDB 15.479, utilizando diferentes criterios. El 16 de octubre de 2020, el HPP publicó un plan de alta rigurosidad que cubre más del 90 % de los genes codificadores de proteínas predichos. Las proteínas se identifican a partir de una amplia gama de tejidos y tipos de células fetales y adultas, incluidas las células hematopoyéticas.
Métodos para estudiar el proteoma
El análisis de proteínas resulta ser más difícil que el análisis de secuencias de ácidos nucleicos. Si bien solo hay 4 nucleótidos que forman el ADN, hay al menos 20 aminoácidos diferentes que pueden formar una proteína. Además, actualmente no se conoce ninguna tecnología de alto rendimiento para hacer copias de una sola proteína. Hay numerosos métodos disponibles para estudiar proteínas, conjuntos de proteínas o el proteoma completo. De hecho, las proteínas a menudo se estudian indirectamente, p. utilizando métodos computacionales y análisis de genomas. A continuación se dan sólo algunos ejemplos.
Técnicas de separación y electroforesis
La proteómica, el estudio del proteoma, se ha practicado en gran medida a través de la separación de proteínas mediante electroforesis en gel bidimensional. En la primera dimensión, las proteínas se separan mediante enfoque isoeléctrico, que resuelve las proteínas en función de la carga. En la segunda dimensión, las proteínas se separan por peso molecular usando SDS-PAGE. El gel se tiñe con azul brillante de Coomassie o plata para visualizar las proteínas. Las manchas en el gel son proteínas que han migrado a lugares específicos.
Espectrometría de masas
La espectrometría de masas es uno de los métodos clave para estudiar el proteoma. Algunos métodos de espectrometría de masas importantes incluyen espectrometría de masas Orbitrap, MALDI (desorción/ionización láser asistida por matriz) y ESI (ionización por electropulverización). La toma de huellas dactilares de la masa peptídica identifica una proteína dividiéndola en péptidos cortos y luego deduce la identidad de la proteína comparando las masas peptídicas observadas con una base de datos de secuencias. La espectrometría de masas en tándem, por otro lado, puede obtener información de secuencia de péptidos individuales aislándolos, colisionándolos con un gas no reactivo y luego catalogando los iones de fragmentos producidos.
En mayo de 2014, se publicó en Nature un borrador del mapa del proteoma humano. Este mapa se generó utilizando espectrometría de masas por transformada de Fourier de alta resolución. Este estudio perfiló 30 muestras humanas histológicamente normales que dieron como resultado la identificación de proteínas codificadas por 17.294 genes. Esto representa alrededor del 84% del total de genes codificadores de proteínas anotados.
Cromatografía
La cromatografía líquida es una herramienta importante en el estudio del proteoma. Permite una separación muy sensible de diferentes tipos de proteínas en función de su afinidad por una matriz. Algunos métodos más nuevos para la separación e identificación de proteínas incluyen el uso de columnas capilares monolíticas, cromatografía de alta temperatura y electrocromatografía capilar.
Secado
La transferencia Western se puede utilizar para cuantificar la abundancia de ciertas proteínas. Mediante el uso de anticuerpos específicos para la proteína de interés, es posible sondear la presencia de proteínas específicas de una mezcla de proteínas.
Ensayos de complementación de proteínas y pantallas de interacción
Los ensayos de complementación de fragmentos de proteínas se utilizan a menudo para detectar interacciones proteína-proteína. El ensayo de dos híbridos de levadura es el más popular de ellos, pero existen numerosas variaciones, tanto utilizados in vitro como in vivo. Los ensayos desplegables son un método para determinar con qué tipos de proteínas interactúa una proteína.
Predicción de estructura de proteínas
La predicción de la estructura de la proteína se puede utilizar para proporcionar predicciones tridimensionales de la estructura de la proteína de proteomas completos. En 2022, una colaboración a gran escala entre EMBL-EBI y DeepMind proporcionó estructuras previstas para más de 200 millones de proteínas de todo el árbol de la vida. Proyectos más pequeños también han utilizado la predicción de la estructura de proteínas para ayudar a mapear el proteoma de organismos individuales, por ejemplo, isoform.io brinda cobertura de múltiples isoformas de proteínas para más de 20,000 genes en el genoma humano.
Bases de datos de proteínas
El Atlas de Proteínas Humanas contiene información sobre las proteínas humanas en células, tejidos y órganos. Todos los datos en el recurso de conocimiento son de acceso abierto para permitir que los científicos tanto en la academia como en la industria accedan libremente a los datos para la exploración del proteoma humano. La organización ELIXIR ha seleccionado el atlas de proteínas como recurso central debido a su importancia fundamental para una comunidad más amplia de ciencias de la vida.
La base de datos Plasma Proteome contiene información sobre 10 500 proteínas del plasma sanguíneo. Debido a que el rango de contenido de proteínas en el plasma es muy amplio, es difícil detectar proteínas que tienden a ser escasas en comparación con proteínas abundantes. Existe un límite analítico que posiblemente puede ser una barrera para las detecciones de proteínas con concentraciones ultrabajas.
Las bases de datos como neXtprot y UniProt son recursos centrales para los datos proteómicos humanos.
Contenido relacionado
Tritón liso
Bilatería
Stephen Schneider (científico)