Tipificación de secuencia multilocus
tipificación de secuencias multilocus (MLST) es una técnica de biología molecular para la tipificación de múltiples loci, que utiliza secuencias de ADN de fragmentos internos de múltiples genes constitutivos para caracterizar aislados de especies microbianas.
El primer esquema MLST que se desarrolló fue para Neisseria meningitidis, el agente causante de la meningitis meningocócica y la septicemia. Desde su introducción para la investigación de la historia evolutiva, MLST se ha utilizado no sólo para patógenos humanos sino también para patógenos vegetales.
Principio
MLST mide directamente las variaciones de la secuencia de ADN en un conjunto de genes básicos y caracteriza las cepas por sus perfiles alélicos únicos. El principio de MLST es simple: la técnica implica una amplificación por PCR seguida de una secuenciación de ADN. Las diferencias de nucleótidos entre cepas se pueden comprobar en un número variable de genes según el grado de discriminación deseado.
El flujo de trabajo de MLST implica: 1) recopilación de datos, 2) análisis de datos y 3) análisis de secuencia multilocus. En el paso de recopilación de datos, la identificación definitiva de la variación se obtiene mediante la determinación de la secuencia de nucleótidos de los fragmentos genéticos. En el paso de análisis de datos, a todas las secuencias únicas se les asignan números de alelo, se combinan en un perfil alélico y se les asigna un tipo de secuencia (ST). Si se encuentran nuevos alelos y ST, se almacenan en la base de datos después de la verificación. En el paso de análisis final de MLST, la relación de los aislados se determina comparando perfiles alélicos. Los investigadores realizan estudios epidemiológicos y filogenéticos comparando ST de diferentes complejos clonales. Durante el proceso de secuenciación e identificación se produce un enorme conjunto de datos, por lo que se utilizan técnicas bioinformáticas para organizar, gestionar, analizar y fusionar todos los datos biológicos.
Para lograr el equilibrio entre el poder de identificación aceptable, el tiempo y el costo de la tipificación de la cepa, en los laboratorios se utilizan comúnmente entre siete y ocho genes de mantenimiento. Citando a Staphylococcus aureus como ejemplo, en la tipificación MLST se utilizan siete genes constitutivos. Estos genes incluyen carbamato quinasa (arcC), shikimato deshidrogenasa (aroE), glicerol quinasa (glpF), guanilato quinasa (gmk), fosfato acetiltransferasa (pta), triosafosfato isomerasa (tpi) y acetil coenzima A acetiltransferasa (yqiL) según lo especificado por el MLST sitio web. Sin embargo, no es raro que se utilicen hasta diez genes constitutivos. Para Vibrio vulnificus, los genes constitutivos utilizados son glucosa-6-fosfato isomerasa (glp), ADN girasa, subunidad B (gyrB), malato -lactato deshidrogenasa (mdh), metionil-ARNt sintetasa (metG), fosforribosilaminoimidazol sintetasa (purM), treonina deshidrogenasa (dtdS), diaminopimelato descarboxilasa (lysA), subunidad alfa transhidrogenasa (pntA), dihidroorotasa (pyrC) y triptofanasa (tnaA ). Por lo tanto, tanto el número como el tipo de genes constitutivos interrogados por MLST pueden diferir de una especie a otra.
Para cada uno de estos genes constitutivos, las diferentes secuencias se asignan como alelos y los alelos en los loci proporcionan un perfil alélico. Una serie de perfiles pueden entonces ser el marcador de identificación para la tipificación de cepas. Las secuencias que difieren incluso en un solo nucleótido se asignan como alelos diferentes y no se pondera para tener en cuenta el número de diferencias de nucleótidos entre los alelos, ya que no podemos distinguir si las diferencias en múltiples sitios de nucleótidos son el resultado de múltiples mutaciones puntuales o de una sola. intercambio recombinacional. El gran número de alelos potenciales en cada uno de los loci proporciona la capacidad de distinguir miles de millones de perfiles alélicos diferentes, y sólo se esperaría que una cepa con el alelo más común en cada locus se produjera por casualidad aproximadamente una vez entre 10.000 aislamientos. A pesar de que MLST proporciona un alto poder discriminatorio, la acumulación de cambios de nucleótidos en genes constitutivos es un proceso relativamente lento y el perfil alélico de un aislado bacteriano es suficientemente estable en el tiempo para que el método sea ideal para la epidemiología global.
La relación de los aislamientos se muestra como un dendrograma construido utilizando la matriz de diferencias por pares entre sus perfiles alélicos, eBURST o un árbol de expansión mínima (MST). El dendrograma es sólo una manera conveniente de mostrar aquellos aislados que tienen perfiles alélicos idénticos o muy similares que se puede suponer que derivan de un ancestro común; Es probable que las relaciones entre aislados que difieren en más de tres de siete loci no sean confiables y no deben considerarse para inferir su filogenia. El MST conecta todas las muestras de tal manera que la distancia sumada de todas las ramas del árbol sea mínima.
Alternativamente, la relación de los aislados también se puede analizar con Análisis de secuencias multiLocus ()MLSA). Esto no utiliza los alelos asignados, sino que concatena las secuencias de los fragmentos genéticos de los genes de limpieza y utiliza esta secuencia concatenada para determinar las relaciones filogenéticas. En contraste con el MLST, este análisis asigna una mayor similitud entre secuencias que difieren sólo de un nucleótido único y una menor similitud entre secuencias con múltiples diferencias de nucleótido. Como resultado, este análisis es más adecuado para organismos con evolución clonal y menos adecuado para organismos en los que ocurren eventos recombinacionales muy a menudo. También se puede utilizar para determinar relaciones filogenéticas entre especies estrechamente relacionadas. Los términos MLST y MLSA son muy a menudo considerados intercambiables. Sin embargo, esto no es correcto ya que cada método de análisis tiene sus características y usos distintivos. Debe tomarse cuidado para utilizar el término correcto.
Comparación con otras técnicas
Se habían establecido enfoques de tipificación serológica anteriores para diferenciar aislados bacterianos, pero la tipificación inmunológica tiene inconvenientes como la dependencia de pocos loci antigénicos y reactividades impredecibles de los anticuerpos con diferentes variantes antigénicas. Se han propuesto varios esquemas de tipificación molecular para determinar la relación de patógenos, como la electroforesis en gel de campo pulsado (PFGE), la ribotipificación y la toma de huellas dactilares basada en PCR. Pero estos métodos de subtipificación basados en bandas de ADN no proporcionan análisis evolutivos significativos. A pesar de que muchos investigadores consideran que el PFGE es el “estándar de oro”, muchas cepas no se pueden tipificar con esta técnica debido a la degradación del ADN durante el proceso (frotis de gel).
El enfoque de MLST es distinto de la electroforesis enzimática multilocus (MLEE), que se basa en diferentes movilidades electroforéticas (EM) de múltiples enzimas metabólicas centrales. Los alelos en cada locus definen la EM de sus productos, ya que diferentes secuencias de aminoácidos entre enzimas dan como resultado diferentes movilidades y distintas bandas cuando se ejecutan en un gel. La relación de los aislados se puede visualizar con un dendrograma generado a partir de la matriz de diferencias por pares entre los tipos electroforéticos. Este método tiene una resolución más baja que MLST por varias razones, todas ellas derivadas del hecho de que la diversidad de fenotipos enzimáticos es simplemente un indicador de la diversidad de secuencias de ADN. En primer lugar, las enzimas pueden tener diferentes secuencias de aminoácidos sin tener EM lo suficientemente diferentes como para dar bandas distintas. En segundo lugar, las "mutaciones silenciosas" puede alterar la secuencia de ADN de un gen sin alterar los aminoácidos codificados. En tercer lugar, el fenotipo de la enzima puede alterarse fácilmente en respuesta a las condiciones ambientales y afectar gravemente la reproducibilidad de los resultados de MLEE; las modificaciones comunes de las enzimas son la fosforilación, la unión de cofactores y la escisión de secuencias de transporte. Esto también limita la comparabilidad de los datos MLEE obtenidos por diferentes laboratorios, mientras que MLST proporciona datos de secuencias de ADN portátiles y comparables y tiene un gran potencial para la automatización y estandarización.
MLST no debe confundirse con códigos de barras de ADN. Este último es un método taxonómico que utiliza marcadores genéticos cortos para reconocer especies particulares de eucariotas. Se basa en el hecho de que el ADN mitocondrial (ADNmt) o algunas partes del cistrón del ADN ribosomal tienen tasas de mutación relativamente rápidas, lo que da lugar a una variación significativa en las secuencias entre especies. Los métodos de ADNmt sólo son posibles en eucariotas (ya que los procariotas carecen de mitocondrias), mientras que MLST, aunque inicialmente se desarrolló para procariotas, ahora está encontrando aplicación en eucariotas y, en principio, podría aplicarse a cualquier reino.
Ventajas y aplicaciones
MLST es altamente inequívoco y portátil. Los materiales necesarios para la determinación de ST se pueden intercambiar entre laboratorios. Se puede acceder electrónicamente a las secuencias de cebadores y a los protocolos. Es reproducible y escalable. MLST está automatizado y combina avances en secuenciación de alto rendimiento y bioinformática con técnicas de genética de poblaciones establecidas. Los datos de MLST se pueden utilizar para investigar las relaciones evolutivas entre bacterias. MLST proporciona un buen poder discriminatorio para diferenciar aislados.
La aplicación de MLST es enorme y proporciona un recurso para las comunidades científica, de salud pública y veterinaria, así como para la industria alimentaria. Los siguientes son ejemplos de aplicaciones MLST.
Campylobacter
Campylobacter es el agente causante común de enfermedades intestinales infecciosas bacterianas, que generalmente surgen de aves poco cocidas o de leche no pasteurizada. Sin embargo, su epidemiología no se conoce bien, ya que los brotes rara vez se detectan, por lo que no es fácil rastrear las fuentes y las rutas de transmisión de los brotes. Además, los genomas de Campylobacter son genéticamente diversos e inestables, con frecuentes recombinaciones inter e intragenómicas, junto con variación de fase, lo que complica la interpretación de los datos de muchos métodos de tipificación. Hasta hace poco, con la aplicación de la técnica MLST, la tipificación de Campylobacter ha logrado un gran éxito y se ha agregado a la base de datos MLST. Al 1 de mayo de 2008, la base de datos de Campylobacter MLST contiene 3516 aislamientos y alrededor de 30 publicaciones que utilizan o mencionan MLST en investigaciones sobre Campylobacter (http://pubmlst.org/campylobacter /).
Neisseria meningitidis
MLST ha proporcionado una imagen más rica de las bacterias dentro de las poblaciones humanas y de las variantes de cepas que pueden ser patógenas para los humanos, las plantas y los animales. La técnica MLST fue utilizada por primera vez por Maiden et al. (1) caracterizar Neisseria meningitidis utilizando seis loci. La aplicación de MLST ha resuelto claramente los principales linajes meningocócicos que se sabe son responsables de enfermedades invasivas en todo el mundo. Para mejorar el nivel de poder discriminatorio entre los principales linajes invasores, actualmente se utilizan siete loci que han sido aceptados por muchos laboratorios como método de elección para caracterizar aislados de meningococos. Es un hecho bien conocido que los intercambios recombinacionales ocurren comúnmente en N. meningitidis, lo que lleva a una rápida diversificación de clones meningocócicos. MLST ha proporcionado con éxito un método confiable para la caracterización de clones dentro de otras especies bacterianas en las que las tasas de diversificación clonal son generalmente más bajas.
Staphylococcus aureus
S. aureus causa una serie de enfermedades. S resistente a meticilina. aureus (MRSA) ha generado una creciente preocupación por su resistencia a casi todos los antibióticos excepto a la vancomicina. Sin embargo, los casos más graves S. aureus en la comunidad, y muchas en los hospitales, son causadas por aislados susceptibles a la meticilina (MSSA) y ha habido pocos intentos de identificar los clones hipervirulentos de MSSA asociados con enfermedades graves. Por lo tanto, MLST se desarrolló para proporcionar un método inequívoco para caracterizar clones de MRSA y para la identificación de clones de MSSA asociados con enfermedades graves.
Estreptococo pyogenes
S. pyogenes causa enfermedades que van desde faringitis hasta impétigo potencialmente mortal, incluida la fascitis necrotizante. Un esquema MLST para S. pyogenes ha sido desarrollado. En la actualidad, la base de datos (mlst.net) contiene los perfiles alélicos de aislados que representan la diversidad mundial del organismo y aislados de enfermedades invasivas graves.
Cándida albicans
C. albicans es un hongo patógeno humano y es responsable de infecciones del torrente sanguíneo adquiridas en hospitales. Se ha utilizado la técnica MLST para caracterizar C. albicans aislados. La combinación de los alelos en los diferentes loci da como resultado tipos de secuencias diploides únicas que pueden usarse para discriminar cepas. Se ha demostrado que MLST se aplica con éxito para estudiar la epidemiología de C. albicans en el hospital así como la diversidad de C. albicans aislados obtenidos de diversos nichos ecológicos, incluidos huéspedes humanos y animales.
Cronobacter
El género Cronobacter está compuesto por 7 especies. Antes de 2007, a estos organismos se les aplicaba el nombre único de especie Enterobacter sakazakii. La MLST de Cronobacter se aplicó inicialmente para distinguir entre C. sakazakii y C. malonaticus porque la secuenciación del ADNr 16S no siempre es lo suficientemente precisa y la biotipificación es demasiado subjetiva. El esquema MLST de Cronobacter utiliza 7 alelos; atpD, fusA, glnS, gltB, gyrB, infB y ppsA dando una secuencia concatenada de 3036 pb para análisis filogenético (MLSA) y genómica comparativa. MLST también se ha utilizado en el reconocimiento formal de nuevas especies de Cronobacter. El método ha revelado una fuerte asociación entre un linaje genético, la secuencia tipo 4 (ST4) y los casos de meningitis neonatal. El sitio MLST de Cronobacter está en http://www.pubMLST.org/cronobacter .
Limitaciones
MLST parece mejor en estudios genéticos de poblaciones, pero es costoso. Debido a la conservación de la secuencia en los genes constitutivos, MLST a veces carece del poder discriminatorio para diferenciar cepas bacterianas, lo que limita su uso en investigaciones epidemiológicas. Para mejorar el poder discriminatorio de MLST, se ha desarrollado un enfoque de tipificación de secuencias de locus de virulencia múltiple (MVLST) utilizando Listeria monocytogenes. MVLST amplía los beneficios de MLST pero se dirige a los genes de virulencia, que pueden ser más polimórficos que los genes constitutivos. La genética de la población no es el único factor relevante en una epidemia. Los factores de virulencia también son importantes a la hora de causar enfermedades, y los estudios genéticos de poblaciones luchan por controlarlos. Esto se debe a que los genes implicados suelen ser altamente recombinantes y móviles entre cepas en comparación con el marco genético de la población. Así, por ejemplo, en Escherichia coli, identificar cepas portadoras de genes de toxinas es más importante que realizar una evaluación de las cepas prevalentes basada en la genética de poblaciones.
La llegada de las tecnologías de secuenciación de segunda generación ha hecho posible obtener información de la secuencia de todo el genoma bacteriano a un costo y esfuerzo relativamente modestos, y ahora se puede asignar MLST a partir de la información de la secuencia del genoma completo, en lugar de secuenciar cada locus por separado. como era la práctica cuando se desarrolló por primera vez MLST. La secuenciación del genoma completo proporciona información más rica para diferenciar cepas bacterianas (MLST utiliza aproximadamente el 0,1% de la secuencia genómica para asignar el tipo sin tener en cuenta el resto del genoma bacteriano). Por ejemplo, la secuenciación del genoma completo de numerosos aislamientos ha revelado que el único linaje MLST ST258 de Klebsiella pneumoniae comprende dos clados genéticos distintos, lo que proporciona información adicional sobre la evolución y propagación de estos organismos resistentes a múltiples fármacos, y refutando la hipótesis anterior de un origen clonal único para ST258.
Bases de datos
Las bases de datos MLST contienen las secuencias de alelos de referencia y los tipos de secuencias para cada organismo, y también aíslan datos epidemiológicos. Los sitios web contienen software de interrogación y análisis que permiten a los usuarios consultar sus secuencias de alelos y tipos de secuencias. MLST se utiliza ampliamente como herramienta para investigadores y trabajadores de la salud pública.
La mayoría de las bases de datos MLST están alojadas en un servidor web ubicado actualmente en la Universidad de Oxford (pubmlst.org).
La base de datos alojada en el sitio contiene secuencias de alelos de referencia específicas del organismo y listas de ST para organismos individuales.
Para ayudar a recopilar y formatear las secuencias utilizadas, se ha desarrollado un complemento simple y gratuito para Firefox (enlace Archivado el 22 de febrero de 2014 en Wayback Machine).
Contenido relacionado
Ley de Fick
Híbrido (biología)
Evolución divergente