Código de barras de ADN

Compartir Imprimir Citar

El código de barras de ADN es un método de identificación de especies que utiliza una pequeña sección de ADN de un gen o genes específicos. La premisa del código de barras de ADN es que, en comparación con una biblioteca de referencia de tales secciones de ADN (también llamadas "secuencias"), una secuencia individual puede usarse para identificar de manera única un organismo a la especie, de la misma manera que un escáner de supermercado usa el rayas negras familiares del código de barras UPC para identificar un artículo en su stock contra su base de datos de referencia. Estos "códigos de barras" a veces se utilizan en un esfuerzo por identificar especies desconocidas, partes de un organismo, o simplemente para catalogar tantos taxones como sea posible, o para comparar con la taxonomía tradicional en un esfuerzo por determinar los límites de las especies.

Se utilizan diferentes regiones de genes para identificar los diferentes grupos de organismos mediante códigos de barras. La región del código de barras más utilizada para animales y algunos protistas es una parte del gen de la citocromo c oxidasa I (COI o COX1), que se encuentra en el ADN mitocondrial. Otros genes adecuados para el código de barras de ADN son el rRNA del espaciador transcrito interno (ITS) que se usa a menudo para hongos y RuBisCO que se usa para plantas. Los microorganismos se detectan utilizando diferentes regiones de genes. El gen 16S rRNA, por ejemplo, se usa ampliamente en la identificación de procariotas, mientras que el gen 18S rRNA se usa principalmente para detectar eucariotas microbianos. Estas regiones de genes se eligen porque tienen menos variación intraespecífica (dentro de las especies) que variación interespecífica (entre especies), lo que se conoce como "Brecha del código de barras".

Algunas aplicaciones de los códigos de barras de ADN incluyen: identificación de hojas de plantas incluso cuando no hay flores o frutos disponibles; identificar el polen recogido en los cuerpos de los animales polinizadores; identificar larvas de insectos que pueden tener menos caracteres diagnósticos que los adultos; o investigando la dieta de un animal en base a su contenido estomacal, saliva o heces. Cuando se utiliza el código de barras para identificar organismos de una muestra que contiene ADN de más de un organismo, se utiliza el término código de metabarras de ADN, por ejemplo, código de metabarras de ADN de comunidades de diatomeas en ríos y arroyos, que se utiliza para evaluar la calidad del agua.

Fondo

Las técnicas de códigos de barras de ADN se desarrollaron a partir de los primeros trabajos de secuenciación de ADN en comunidades microbianas utilizando el gen 5S rRNA. En 2003, en un artículo de Paul DN Hebert et al., se propusieron métodos y terminología específicos de códigos de barras de ADN modernos como un método estandarizado para identificar especies, así como para asignar potencialmente secuencias desconocidas a taxones superiores, como órdenes y filos. de la Universidad de Guelph, Ontario, Canadá. Hebert y sus colegas demostraron la utilidad del gen de la citocromo c oxidasa I (COI), utilizado por primera vez por Folmer et al. en 1994, utilizando sus cebadores de ADN publicados como una herramienta para análisis filogenéticos a nivel de especie como una herramienta discriminatoria adecuada entre invertebrados metazoos.La "región de Folmer" del gen COI se usa comúnmente para distinguir entre taxones en función de sus patrones de variación a nivel de ADN. La relativa facilidad de recuperar la secuencia y la variabilidad combinada con la conservación entre especies son algunos de los beneficios de COI. Llamando a los perfiles "códigos de barras", Hebert et al. previó el desarrollo de una base de datos COI que podría servir como base para un "sistema global de bioidentificación".

Métodos

Muestreo y conservación

El código de barras se puede realizar a partir de tejido de una muestra objetivo, de una mezcla de organismos (muestra a granel) o de ADN presente en muestras ambientales (p. ej., agua o suelo). Los métodos de muestreo, conservación o análisis difieren entre esos diferentes tipos de muestra.

muestras de tejido

Para codificar con barras una muestra de tejido del espécimen de destino, es probable que sea suficiente un pequeño trozo de piel, una balanza, una pata o una antena (según el tamaño del espécimen). Para evitar la contaminación, es necesario esterilizar las herramientas usadas entre muestras. Se recomienda recolectar dos muestras de un espécimen, una para archivar y otra para el proceso de codificación de barras. La conservación de muestras es crucial para superar el problema de la degradación del ADN.

Muestras a granel

Una muestra a granel es un tipo de muestra ambiental que contiene varios organismos del grupo taxonómico en estudio. La diferencia entre las muestras a granel (en el sentido utilizado aquí) y otras muestras ambientales es que la muestra a granel suele proporcionar una gran cantidad de ADN de buena calidad. Los ejemplos de muestras a granel incluyen muestras de macroinvertebrados acuáticos recolectadas con redes o muestras de insectos recolectadas con una trampa Malaise. Las muestras de agua filtrada o fraccionada por tamaño que contienen organismos completos como eucariotas unicelulares también se definen a veces como muestras a granel. Dichas muestras se pueden recolectar mediante las mismas técnicas utilizadas para obtener muestras tradicionales para la identificación basada en la morfología.

muestras de ADN electrónico

El método de ADN ambiental (eDNA) es un enfoque no invasivo para detectar e identificar especies a partir de desechos celulares o ADN extracelular presente en muestras ambientales (p. ej., agua o suelo) a través de códigos de barras o metacódigos de barras. El enfoque se basa en el hecho de que todos los organismos vivos dejan ADN en el medio ambiente, y este ADN ambiental puede detectarse incluso en organismos que se encuentran en muy baja abundancia. Por lo tanto, para el muestreo de campo, la parte más crucial es utilizar material y herramientas libres de ADN en cada sitio de muestreo o muestra para evitar la contaminación, si es probable que el ADN de los organismos objetivo esté presente en cantidades bajas. Por otro lado, una muestra de eDNA siempre incluye el ADN de microorganismos vivos de células enteras, que a menudo están presentes en grandes cantidades. Por lo tanto, las muestras de microorganismos tomadas en el entorno natural también se denominan muestras de eDNA, pero la contaminación es menos problemática en este contexto debido a la gran cantidad de organismos objetivo. El método eDNA se aplica a la mayoría de los tipos de muestras, como agua, sedimentos, suelo, heces de animales, contenido estomacal o sangre de, por ejemplo, sanguijuelas.{{Citation|last1=Jelger Herder|title=ADN ambiental: una revisión de las posibles aplicaciones para el detección de especies (invasoras).

Extracción, amplificación y secuenciación de ADN

El código de barras de ADN requiere que se extraiga el ADN de la muestra. Existen varios métodos diferentes de extracción de ADN, y factores como el costo, el tiempo, el tipo de muestra y el rendimiento afectan la selección del método óptimo.

Cuando el ADN de muestras de organismos o ADN electrónico se amplifica mediante la reacción en cadena de la polimerasa (PCR), la reacción puede verse afectada negativamente por las moléculas inhibidoras contenidas en la muestra. La eliminación de estos inhibidores es crucial para garantizar que el ADN de alta calidad esté disponible para análisis posteriores.

La amplificación del ADN extraído es un paso necesario en la codificación de ADN. Por lo general, solo se secuencia un pequeño fragmento del material de ADN total (generalmente de 400 a 800 pares de bases) para obtener el código de barras de ADN. La amplificación del material de eDNA generalmente se enfoca en tamaños de fragmentos más pequeños (<200 pares de bases), ya que es más probable que el eDNA se fragmente que el material de ADN de otras fuentes. Sin embargo, algunos estudios argumentan que no existe una relación entre el tamaño del amplicón y la tasa de detección de eDNA.

Cuando se ha amplificado la región marcadora del código de barras de ADN, el siguiente paso es secuenciar la región marcadora utilizando métodos de secuenciación de ADN. Hay muchas plataformas de secuenciación diferentes disponibles y el desarrollo técnico avanza rápidamente.

Selección de marcador

Los marcadores utilizados para los códigos de barras de ADN se denominan códigos de barras. Para caracterizar con éxito especies basadas en códigos de barras de ADN, la selección de regiones de ADN informativas es crucial. Un buen código de barras de ADN debe tener una variabilidad intraespecífica baja e interespecífica alta y poseer sitios laterales conservados para desarrollar cebadores de PCR universales para una amplia aplicación taxonómica. El objetivo es diseñar cebadores que detecten y distingan la mayoría o todas las especies en el grupo de organismos estudiado (resolución taxonómica alta). La longitud de la secuencia del código de barras debe ser lo suficientemente corta para usarse con la fuente de muestreo actual, métodos de extracción, amplificación y secuenciación de ADN.

Idealmente, se usaría una secuencia de genes para todos los grupos taxonómicos, desde virus hasta plantas y animales. Sin embargo, aún no se ha encontrado tal región genética, por lo que se utilizan diferentes códigos de barras para diferentes grupos de organismos, o según la pregunta de estudio.

Para los animales, el código de barras más utilizado es el locus mitocondrial de la citocromo C oxidasa I (COI). También se utilizan otros genes mitocondriales, como Cytb, 12S o 18S. Los genes mitocondriales se prefieren a los genes nucleares debido a su falta de intrones, su modo de herencia haploide y su recombinación limitada. Además, cada célula tiene varias mitocondrias (hasta varios miles) y cada una de ellas contiene varias moléculas circulares de ADN. Por lo tanto, las mitocondrias pueden ofrecer una fuente abundante de ADN incluso cuando la muestra de tejido es limitada.

En las plantas, sin embargo, los genes mitocondriales no son apropiados para el código de barras de ADN porque exhiben bajas tasas de mutación. Se han encontrado algunos genes candidatos en el genoma del cloroplasto, siendo el gen de la maturasa K (matK) el más prometedor por sí mismo o en asociación con otros genes. También se han utilizado para la identificación de especies marcadores multilocus, como los espaciadores transcritos internos ribosómicos (ADN ITS), junto con matK, rbcL, trnH u otros genes. La mejor discriminación entre especies de plantas se ha logrado cuando se utilizan dos o más códigos de barras de cloroplastos.

Para las bacterias, la subunidad pequeña del gen del ARN ribosómico (16S) se puede utilizar para diferentes taxones, ya que está muy conservada. Algunos estudios sugieren que COI, la chaperonina tipo II (cpn60) o la subunidad β de la ARN polimerasa (rpoB) también podrían servir como códigos de barras de ADN bacteriano.

Los hongos de codificación de barras son más desafiantes y es posible que se requiera más de una combinación de cebadores. El marcador COI funciona bien en ciertos grupos de hongos, pero no igual de bien en otros. Por lo tanto, se están utilizando marcadores adicionales, como ITS rDNA y la subunidad grande de RNA ribosomal nuclear (28S LSU rRNA).

Dentro del grupo de los protistas, se han propuesto varios códigos de barras, como las regiones D1-D2 o D2-D3 del 28S rDNA, la subregión V4 del gen 18S rRNA, ITS rDNA y COI. Además, se pueden usar algunos códigos de barras específicos para protistas fotosintéticos, por ejemplo, la subunidad grande del gen ribulosa-1,5-bisfosfato carboxilasa-oxigenasa (rbcL) y el gen cloroplástico 23S rRNA.

grupo de organismosGen/locus marcador
animalesCOI, Cytb, 12S, 16S
PlantasmatK, rbcL, psbA-trnH, SU
bacteriasCOI, rpoB, 16S, cpn60, tuf, RIF, tierra
hongosSU, TEF1α, RPB1, RPB2 , 18S, 28S
protistasSU, COI, rbcL, 18S, 28S, 23S

Bibliotecas de referencia y bioinformática

Las bibliotecas de referencia se utilizan para la identificación taxonómica, también llamada anotación, de secuencias obtenidas a partir de códigos de barras o metabarcodes. Estas bases de datos contienen los códigos de barras de ADN asignados a taxones previamente identificados. La mayoría de las bibliotecas de referencia no cubren todas las especies dentro de un grupo de organismos, y continuamente se crean nuevas entradas. En el caso de macro y muchos microorganismos (como algas), estas bibliotecas de referencia requieren documentación detallada (lugar y fecha de muestreo, persona que lo recolectó, imagen, etc.) e identificación taxonómica autorizada del espécimen comprobante, así como el envío de secuencias en un formato particular. Sin embargo, tales estándares se cumplen solo para un pequeño número de especies. El proceso también requiere el almacenamiento de especímenes comprobantes en colecciones de museos, herbarios y otras instituciones colaboradoras.En el mundo microbiano, no hay información de ADN para la mayoría de los nombres de especies, y muchas secuencias de ADN no pueden asignarse a ningún binomio de Linneo. Existen varias bases de datos de referencia según el grupo de organismos y el marcador genético utilizado. Existen bases de datos nacionales más pequeñas (p. ej., FinBOL) y grandes consorcios como el International Barcode of Life Project (iBOL).

AUDAZ

Lanzado en 2007, Barcode of Life Data System (BOLD) es una de las bases de datos más grandes, que contiene alrededor de 780 000 BIN (Números de índice de código de barras) en 2022. Es un depósito de libre acceso para los registros de muestras y secuencias para estudios de códigos de barras, y también es un banco de trabajo que ayuda a la gestión, control de calidad y análisis de datos de códigos de barras. La base de datos contiene principalmente registros BIN para animales basados ​​en el marcador genético COI.

UNIR

La base de datos UNITE se lanzó en 2003 y es una base de datos de referencia para la identificación molecular de especies fúngicas (y desde 2018 de todas las eucariotas) con la región del marcador genético del espaciador transcrito interno ribosómico nuclear (ITS). Esta base de datos se basa en el concepto de hipótesis de especies: usted elige el % en el que desea trabajar y las secuencias se ordenan en comparación con las secuencias obtenidas de especímenes de prueba identificados por expertos.

diat.barcode

La base de datos Diat.barcode se publicó por primera vez con el nombre R-syst::diatom en 2016 a partir de datos de dos fuentes: la colección de cultivos de Thonon (TCC) en la estación hidrobiológica del Instituto Nacional Francés de Investigación Agrícola (INRA), y de la base de datos de nucleótidos del NCBI (Centro Nacional de Información Biotecnológica). Diat.barcode proporciona datos para dos marcadores genéticos, rbc L (ribulosa-1,5-bisfosfato carboxilasa/oxigenasa) y 18S (ARN ribosomal 18S). La base de datos también incluye información adicional sobre rasgos de especies, como características morfológicas (biovolumen, tamaño, dimensiones, etc.), formas de vida (movilidad, tipo de colonia, etc.) o características ecológicas (sensibilidad a la contaminación, etc.).

Análisis bioinformático

Para obtener datos bien estructurados, limpios e interpretables, los datos de secuenciación sin procesar deben procesarse mediante análisis bioinformático. El archivo FASTQ con los datos de secuenciación contiene dos tipos de información: las secuencias detectadas en la muestra (archivo FASTA) y un archivo de calidad con puntajes de calidad (puntajes PHRED) asociados a cada nucleótido de cada secuencia de ADN. Las puntuaciones PHRED indican la probabilidad con la que se ha puntuado correctamente el nucleótido asociado.

1090%
2099%
3099,9%
4099,99%
5099.999%

En general, la puntuación PHRED disminuye hacia el final de cada secuencia de ADN. Por lo tanto, algunas tuberías bioinformáticas simplemente cortan el final de las secuencias en un umbral definido.

Algunas tecnologías de secuenciación, como MiSeq, usan secuenciación de extremos emparejados durante la cual la secuenciación se realiza desde ambas direcciones para producir una mejor calidad. Las secuencias superpuestas luego se alinean en contigs y se fusionan. Por lo general, varias muestras se agrupan en una sola ejecución y cada muestra se caracteriza por un fragmento de ADN corto, la etiqueta. En un paso de demultiplexación, las secuencias se ordenan utilizando estas etiquetas para volver a ensamblar las muestras separadas. Antes de continuar con el análisis, las etiquetas y otros adaptadores se eliminan del fragmento de ADN de la secuencia del código de barras. Durante el recorte, se eliminan las secuencias de mala calidad (puntuaciones PHRED bajas) o las secuencias que son mucho más cortas o más largas que el código de barras de ADN objetivo. El siguiente paso de desreplicación es el proceso en el que todas las secuencias filtradas por calidad se contraen en un conjunto de lecturas únicas (ISU de unidades de secuencia individuales) con la información de su abundancia en las muestras. Después de eso, se detectan y eliminan las quimeras (es decir, secuencias compuestas formadas a partir de piezas de origen mixto). Finalmente, las secuencias se agrupan en OTU (Unidades taxonómicas operativas), utilizando una de las muchas estrategias de agrupación. El software bioinformático más utilizado incluye Mothur,Uparse, Qiime, Galaxy, Obitools, JAMP, Barque y DADA2.

Comparar la abundancia de lecturas, es decir, secuencias, entre diferentes muestras sigue siendo un desafío porque tanto la cantidad total de lecturas en una muestra como la cantidad relativa de lecturas para una especie pueden variar entre muestras, métodos u otras variables. A modo de comparación, se puede reducir el número de lecturas de cada muestra al número mínimo de lecturas de las muestras que se van a comparar, un proceso llamado rarefacción. Otra forma es utilizar la abundancia relativa de lecturas.

Identificación de especies y asignación taxonómica

La asignación taxonómica de las OTU a las especies se logra haciendo coincidir las secuencias con las bibliotecas de referencia. La herramienta básica de búsqueda de alineación local (BLAST) se usa comúnmente para identificar regiones de similitud entre secuencias comparando lecturas de secuencias de la muestra con secuencias en bases de datos de referencia. Si la base de datos de referencia contiene secuencias de las especies relevantes, entonces las secuencias de muestra pueden identificarse a nivel de especie. Si una secuencia no puede coincidir con una entrada de biblioteca de referencia existente, se puede usar el código de barras de ADN para crear una nueva entrada.

En algunos casos, debido a que las bases de datos de referencia están incompletas, la identificación solo se puede lograr en niveles taxonómicos más altos, como la asignación a una familia o clase. En algunos grupos de organismos, como las bacterias, la asignación taxonómica a nivel de especie a menudo no es posible. En tales casos, una muestra puede asignarse a una unidad taxonómica operativa (OTU) en particular.

Aplicaciones

Las aplicaciones de los códigos de barras de ADN incluyen la identificación de nuevas especies, la evaluación de la seguridad de los alimentos, la identificación y evaluación de especies crípticas, la detección de especies exóticas, la identificación de especies amenazadas y en peligro de extinción, la vinculación de las etapas de huevo y larva con las especies adultas, la obtención de derechos de propiedad intelectual para los recursos biológicos, enmarcar planes de manejo global para estrategias de conservación y dilucidar nichos de alimentación. Los marcadores de código de barras de ADN se pueden aplicar para abordar preguntas básicas en sistemática, ecología, biología evolutiva y conservación, incluido el ensamblaje de comunidades, redes de interacción de especies, descubrimiento taxonómico y evaluación de áreas prioritarias para la protección ambiental.

Identificación de especies

Secuencias de ADN cortas específicas o marcadores de una región estandarizada del genoma pueden proporcionar un código de barras de ADN para identificar especies. Los métodos moleculares son especialmente útiles cuando los métodos tradicionales no son aplicables. El código de barras de ADN tiene una gran aplicabilidad en la identificación de larvas para las que generalmente hay pocos caracteres de diagnóstico disponibles, y en asociación de diferentes etapas de vida (p. ej., larva y adulto) en muchos animales. La identificación de especies incluidas en los apéndices de la Convención sobre el Comercio Internacional de Especies en Peligro de Extinción (CITES) mediante técnicas de códigos de barras se utiliza para controlar el comercio ilegal.

Detección de especies invasoras

Las especies exóticas se pueden detectar a través de códigos de barras. Los códigos de barras pueden ser adecuados para la detección de especies, por ejemplo, en el control fronterizo, donde a menudo no es posible una identificación morfológica rápida y precisa debido a las similitudes entre diferentes especies, la falta de suficientes características de diagnóstico y/o la falta de experiencia taxonómica. Los códigos de barras y los metacódigos de barras también se pueden usar para detectar especies invasoras en los ecosistemas y para distinguir entre una especie invasora y una especie nativa, morfológicamente similar.

Delimitación de especies crípticas

El código de barras de ADN permite la identificación y el reconocimiento de especies crípticas. Sin embargo, los resultados de los análisis de códigos de barras de ADN dependen de la elección de los métodos analíticos, por lo que el proceso de delimitación de especies crípticas utilizando códigos de barras de ADN puede ser tan subjetivo como cualquier otra forma de taxonomía. Hebert et al. (2004) concluyeron que la mariposa Astraptes fulgerator en el noroeste de Costa Rica en realidad consta de 10 especies diferentes. Estos resultados, sin embargo, fueron cuestionados posteriormente por Brower (2006), quien señaló numerosas fallas graves en el análisis y concluyó que los datos originales no podían respaldar más que la posibilidad de tres a siete taxones crípticos en lugar de diez especies crípticas. Smith et al. (2007) utilizaron citocromo cCódigos de barras de ADN oxidasa I para la identificación de especies de las 20 morfoespecies de moscas parasitoide Belvosia (Diptera: Tachinidae) criadas a partir de orugas (Lepidoptera) en el Área de Conservación Guanacaste (ACG), noroeste de Costa Rica. Estos autores descubrieron que los códigos de barras elevan el recuento de especies a 32, al revelar que cada una de las tres especies de parasitos, anteriormente consideradas generalistas, en realidad son conjuntos de especies crípticas altamente específicas del huésped. Para 15 morfoespecies de poliquetos dentro del bentos antártico profundo estudiado a través de códigos de barras de ADN, se encontró diversidad críptica en el 50% de los casos. Además, se detectaron 10 morfoespecies previamente pasadas por alto, aumentando la riqueza total de especies en la muestra en un 233%.

Aplicación de análisis de dieta y web alimentaria.

Los códigos de barras y los metacódigos de barras de ADN pueden ser útiles en los estudios de análisis de la dieta y, por lo general, se usan si los especímenes de presa no se pueden identificar en función de los caracteres morfológicos. Existe una variedad de enfoques de muestreo en el análisis de la dieta: la metabarcodificación de ADN se puede realizar en el contenido del estómago, las heces, la saliva o el análisis de todo el cuerpo. En muestras fecales o contenido estomacal altamente digerido, a menudo no es posible distinguir el tejido de una sola especie y, por lo tanto, se puede aplicar metabarcode en su lugar. Las heces o la saliva representan enfoques de muestreo no invasivos, mientras que el análisis de todo el cuerpo a menudo significa que primero se debe sacrificar al individuo. Para organismos más pequeños, la secuenciación del contenido estomacal se suele realizar mediante la secuenciación de todo el animal.

Código de barras para la seguridad alimentaria

El código de barras de ADN representa una herramienta esencial para evaluar la calidad de los productos alimenticios. El objetivo es garantizar la trazabilidad de los alimentos, minimizar la piratería alimentaria y valorizar la producción agroalimentaria local y típica. Otro propósito es salvaguardar la salud pública; por ejemplo, el código de barras ofrece la posibilidad de identificar meros que causan intoxicación por pescado con ciguatera a partir de restos de comida, o separar los hongos venenosos de los comestibles (Ref).

Biomonitoreo y evaluación ecológica

El código de barras de ADN se puede utilizar para evaluar la presencia de especies en peligro de extinción para los esfuerzos de conservación (Ref), o la presencia de especies indicadoras que reflejan condiciones ecológicas específicas (Ref), por ejemplo, exceso de nutrientes o bajos niveles de oxígeno.

Potenciales y deficiencias.

Potenciales

Los métodos tradicionales de bioevaluación están bien establecidos internacionalmente y sirven bien para el biomonitoreo, como por ejemplo para la bioevaluación acuática dentro de las Directivas de la UE WFD y MSFD. Sin embargo, el código de barras de ADN podría mejorar los métodos tradicionales por las siguientes razones; Los códigos de barras de ADN (i) pueden aumentar la resolución taxonómica y armonizar la identificación de taxones que son difíciles de identificar o carecen de expertos, (ii) pueden relacionar con mayor precisión/exactitud los factores ambientales con taxones específicos (iii) pueden aumentar la comparabilidad entre regiones, (iv) permite la inclusión de etapas tempranas de la vida y especímenes fragmentados, (v) permite la delimitación de especies crípticas/raras (vi) permite el desarrollo de nuevos índices, por ejemplo, especies raras/crípticas que pueden ser sensibles/tolerantes a factores estresantes,

Tiempo y costo

El código de barras de ADN es más rápido que los métodos morfológicos tradicionales desde el entrenamiento hasta la asignación taxonómica. Se necesita menos tiempo para adquirir experiencia en métodos de ADN que convertirse en un experto en taxonomía. Además, el flujo de trabajo del código de barras de ADN (es decir, de la muestra al resultado) suele ser más rápido que el flujo de trabajo morfológico tradicional y permite el procesamiento de más muestras.

Resolución taxonómica

El código de barras de ADN permite la resolución de taxones desde niveles taxonómicos superiores (p. ej., familia) a inferiores (p. ej., especie), que de otro modo serían demasiado difíciles de identificar utilizando métodos morfológicos tradicionales, como, por ejemplo, la identificación mediante microscopía. Por ejemplo, los Chironomidae (el mosquito que no muerde) están ampliamente distribuidos tanto en ecosistemas terrestres como de agua dulce. Su riqueza y abundancia los hace importantes para los procesos y redes ecológicos, y son uno de los muchos grupos de invertebrados utilizados en el biomonitoreo. Las muestras de invertebrados pueden contener hasta 100 especies de quironómidos que a menudo constituyen hasta el 50% de una muestra. A pesar de esto, generalmente no se identifican por debajo del nivel de familia debido a la experiencia taxonómica y al tiempo requerido.Esto puede resultar en diferentes especies de quironómidos con diferentes preferencias ecológicas agrupadas, lo que resulta en una evaluación inexacta de la calidad del agua.

El código de barras de ADN brinda la oportunidad de resolver taxones y relacionar directamente los efectos estresantes con taxones específicos, como especies de quironómidos individuales. Por ejemplo, Beermann et al. (2018) Chironomidae con código de barras de ADN para investigar su respuesta a múltiples factores estresantes; caudal reducido, aumento de sedimentos finos y aumento de la salinidad. Después del código de barras, se encontró que la muestra de quironómidos constaba de 183 unidades taxonómicas operativas (OTU), es decir, códigos de barras (secuencias) que a menudo son equivalentes a especies morfológicas. Estas 183 OTU mostraron 15 tipos de respuesta en lugar de los informados anteriormentedos tipos de respuesta registrados cuando todos los quironómidos se agruparon en el mismo estudio de factores estresantes múltiples. Una tendencia similar fue descubierta en un estudio de Macher et al. (2016) que descubrió una diversidad críptica dentro de la especie de mosca de mayo de Nueva Zelanda Deleatidium sp . Este estudio encontró diferentes patrones de respuesta de 12 OTU moleculares distintos a los factores estresantes que pueden cambiar el consenso de que esta efímera es sensible a la contaminación.

Deficiencias

A pesar de las ventajas que ofrece el código de barras de ADN, también se ha sugerido que el código de barras de ADN se utiliza mejor como complemento de los métodos morfológicos tradicionales. Esta recomendación se basa en múltiples desafíos percibidos.

Parámetros físicos

No es completamente sencillo conectar los códigos de barras de ADN con las preferencias ecológicas del taxón con código de barras en cuestión, ya que es necesario si se va a utilizar el código de barras para el biomonitoreo. Por ejemplo, la detección de ADN diana en sistemas acuáticos depende de la concentración de moléculas de ADN en un sitio, que a su vez puede verse afectada por muchos factores. La presencia de moléculas de ADN también depende de la dispersión en un sitio, por ejemplo, la dirección o la fuerza de las corrientes. No se sabe realmente cómo se mueve el ADN en los arroyos y lagos, lo que dificulta el muestreo. Otro factor podría ser el comportamiento de la especie objetivo, por ejemplo, los peces pueden tener cambios estacionales de movimientos, los cangrejos de río o los mejillones liberarán ADN en mayores cantidades solo en ciertos momentos de su vida (muda, desove). Para el ADN en el suelo, se sabe aún menos sobre distribución, cantidad o calidad.

La principal limitación del método de códigos de barras es que se basa en bibliotecas de referencia de códigos de barras para la identificación taxonómica de las secuencias. La identificación taxonómica es precisa solo si se dispone de una referencia fiable. Sin embargo, la mayoría de las bases de datos aún están incompletas, especialmente para organismos más pequeños, por ejemplo, hongos, fitoplancton, nematodos, etc. Además, las bases de datos actuales contienen errores de identificación, errores ortográficos y otros errores. Existe un esfuerzo masivo de curación y finalización en torno a las bases de datos para todos los organismos necesarios, lo que implica grandes proyectos de códigos de barras (por ejemplo, el proyecto iBOL para la base de datos de referencia Barcode of Life Data Systems (BOLD)).Sin embargo, la finalización y la curación son difíciles y requieren mucho tiempo. Sin especímenes validados, no puede haber certeza sobre si la secuencia utilizada como referencia es correcta.

Las bases de datos de secuencias de ADN como GenBank contienen muchas secuencias que no están vinculadas a especímenes certificados (por ejemplo, especímenes de herbario, líneas de células cultivadas o, a veces, imágenes). Esto es problemático frente a cuestiones taxonómicas, como si varias especies deberían dividirse o combinarse, o si las identificaciones anteriores eran sólidas. La reutilización de secuencias, no vinculadas a especímenes autorizados, de organismos inicialmente mal identificados puede respaldar conclusiones incorrectas y debe evitarse. Por lo tanto, la mejor práctica para el código de barras de ADN es secuenciar especímenes registrados. Sin embargo, para muchos taxones puede ser difícil obtener especímenes de referencia, por ejemplo, con especímenes que son difíciles de capturar, los especímenes disponibles están mal conservados o se carece de experiencia taxonómica adecuada.

Es importante destacar que los códigos de barras de ADN también se pueden usar para crear una taxonomía provisional, en cuyo caso las OTU se pueden usar como sustitutos de los binomios latinos tradicionales, lo que reduce significativamente la dependencia de bases de datos de referencia totalmente pobladas.

Sesgo tecnológico

El código de barras de ADN también conlleva un sesgo metodológico, desde el muestreo hasta el análisis de datos bioinformáticos. Además del riesgo de contaminación de la muestra de ADN por los inhibidores de la PCR, el sesgo de los cebadores es una de las principales fuentes de errores en los códigos de barras del ADN. El aislamiento de un marcador de ADN eficiente y el diseño de cebadores es un proceso complejo y se ha realizado un esfuerzo considerable para desarrollar cebadores para códigos de barras de ADN en diferentes grupos taxonómicos. Sin embargo, los cebadores a menudo se unirán preferentemente a algunas secuencias, lo que conducirá a diferencias en la eficiencia y especificidad de los cebadores y en la evaluación de comunidades no representativas y la inflación de la riqueza.Por lo tanto, la composición de las secuencias de las comunidades de la muestra se altera principalmente en el paso de la PCR. Además, a menudo se requiere la replicación de PCR, pero conduce a un aumento exponencial del riesgo de contaminación. Varios estudios han destacado la posibilidad de utilizar muestras enriquecidas con mitocondrias o enfoques libres de PCR para evitar estos sesgos, pero a día de hoy, la técnica de metabarcodificación de ADN todavía se basa en la secuenciación de amplicones. Otros sesgos entran en escena durante la secuenciación y durante el procesamiento bioinformático de las secuencias, como la creación de quimeras.

Falta de estandarización

A pesar de que el código de barras de ADN se usa y aplica más ampliamente, no hay acuerdo sobre los métodos para la conservación o extracción de ADN, las opciones de marcadores de ADN y el conjunto de cebadores, o los protocolos de PCR. Los parámetros de las canalizaciones bioinformáticas (por ejemplo, agrupación de OTU, algoritmos o umbrales de asignación taxonómica, etc.) están en el origen de mucho debate entre los usuarios de códigos de barras de ADN. Las tecnologías de secuenciación también están evolucionando rápidamente, junto con las herramientas para el análisis de las cantidades masivas de datos de ADN generados, y se necesita con urgencia la estandarización de los métodos para permitir la colaboración y el intercambio de datos a mayor escala espacial y temporal. Esta estandarización de los métodos de códigos de barras a escala europea forma parte de los objetivos de la European COST Action DNAqua-nety también es abordado por el CEN (Comité Europeo de Normalización).

Otra crítica del código de barras de ADN es su eficiencia limitada para la discriminación precisa por debajo del nivel de especie (por ejemplo, para distinguir entre variedades), para la detección de híbridos y que puede verse afectado por las tasas evolutivas.

Discrepancias entre la identificación convencional (morfológica) y la basada en códigos de barras

Es importante saber que las listas de taxones derivadas de la identificación convencional (morfológica) no son, y tal vez nunca lo sean, directamente comparables con las listas de taxones derivadas de la identificación basada en códigos de barras por varias razones. La causa más importante es probablemente la incompletitud y la falta de precisión de las bases de datos de referencia molecular que impiden una asignación taxonómica correcta de las secuencias de eDNA. El eDNA no encontrará taxones que no estén presentes en las bases de datos de referencia, y las secuencias vinculadas a un nombre incorrecto conducirán a una identificación incorrecta.Otras causas conocidas son una escala y tamaño de muestreo diferentes entre una muestra tradicional y una molecular, el posible análisis de organismos muertos, que puede ocurrir de diferentes maneras para ambos métodos según el grupo de organismos, y la selección específica de identificación en cualquiera de los métodos, es decir experiencia taxonómica variable o posibilidad de identificar ciertos grupos de organismos, respectivamente sesgo del cebador que también conduce a un posible análisis sesgado de los taxones.

Estimaciones de riqueza/diversidad

El código de barras de ADN puede resultar en una sobreestimación o subestimación de la riqueza y diversidad de especies. Algunos estudios sugieren que los artefactos (identificación de especies que no están presentes en una comunidad) son una de las principales causas de la biodiversidad inflada. El problema más problemático son los taxones representados por un bajo número de lecturas de secuenciación. Estas lecturas generalmente se eliminan durante el proceso de filtrado de datos, ya que diferentes estudios sugieren que la mayoría de estas lecturas de baja frecuencia pueden ser artefactos. Sin embargo, pueden existir taxones realmente raros entre estas lecturas de baja abundancia.Las secuencias raras pueden reflejar linajes únicos en comunidades que las convierten en secuencias valiosas e informativas. Por lo tanto, existe una gran necesidad de algoritmos bioinformáticos más robustos que permitan la diferenciación entre lecturas informativas y artefactos. Las bibliotecas de referencia completas también permitirían una mejor prueba de los algoritmos bioinformáticos, al permitir un mejor filtrado de artefactos (es decir, la eliminación de secuencias que carecen de una contraparte entre las especies existentes) y, por lo tanto, sería posible obtener una asignación de especies más precisa. La diversidad críptica también puede resultar en una biodiversidad inflada ya que una especie morfológica en realidad puede dividirse en muchas secuencias moleculares distintas.

Metacódigo de barras

El metabarcode se define como el código de barras de ADN o eDNA (ADN ambiental) que permite la identificación simultánea de muchos taxones dentro de la misma muestra (ambiental), aunque a menudo dentro del mismo grupo de organismos. La principal diferencia entre los enfoques es que el código de barras meta, en contraste con el código de barras, no se enfoca en un organismo específico, sino que tiene como objetivo determinar la composición de especies dentro de una muestra.

Metodología

El procedimiento de codificación de metabarras, como la codificación de barras general, cubre los pasos de extracción de ADN, amplificación por PCR, secuenciación y análisis de datos. Un código de barras consta de una región genética variable corta (por ejemplo, consulte diferentes marcadores/códigos de barras) que es útil para la asignación taxonómica flanqueada por regiones genéticas altamente conservadas que se pueden usar para el diseño de cebadores. Se utilizan diferentes genes dependiendo de si el objetivo es codificar en barras una sola especie o metabarcodificar varias especies. En este último caso, se utiliza un gen más universal. La metabarcodificación no utiliza ADN/ARN de una sola especie como punto de partida, sino ADN/ARN de varios organismos diferentes derivados de una muestra ambiental o a granel.

Aplicaciones

Los metacódigos de barras tienen el potencial de complementar las medidas de biodiversidad e incluso reemplazarlas en algunos casos, especialmente a medida que la tecnología avanza y los procedimientos se vuelven gradualmente más baratos, optimizados y generalizados.

Las aplicaciones de metabarcodificación de ADN incluyen:

Ventajas y desafíos

Las ventajas y desventajas generales de los códigos de barras revisadas anteriormente también son válidas para los metacódigos de barras. Un inconveniente particular de los estudios de metabarcodificación es que aún no hay consenso con respecto al diseño experimental óptimo y los criterios bioinformáticos que se aplicarán en la codificación de metabarras de eDNA. Sin embargo, existen intentos conjuntos actuales, como por ejemplo, la red DNAqua-Net de EU COST, para avanzar mediante el intercambio de experiencias y conocimientos para establecer estándares de mejores prácticas para el biomonitoreo.