Etiqueta de secuencia expresada

format_list_bulleted Contenido keyboard_arrow_down
ImprimirCitar

En genética, una etiqueta de secuencia expresada (EST) es una subsecuencia corta de una secuencia de ADNc. Las EST pueden usarse para identificar transcripciones de genes y fueron fundamentales en el descubrimiento de genes y en la determinación de la secuencia de genes. La identificación de tecnologías ecológicamente racionales ha avanzado rápidamente: actualmente hay aproximadamente 74,2 millones de tecnologías ecológicamente racionales disponibles en bases de datos públicas (por ejemplo, GenBank del 1 de enero de 2013, todas las especies). Los enfoques EST han sido reemplazados en gran medida por la secuenciación del genoma completo y del transcriptoma y la secuenciación del metagenoma.

Una EST resulta de la secuenciación única de un ADNc clonado. Los ADNc utilizados para la generación de EST suelen ser clones individuales de una biblioteca de ADNc. La secuencia resultante es un fragmento de calidad relativamente baja cuya longitud está limitada por la tecnología actual a aproximadamente 500 a 800 nucleótidos. Debido a que estos clones consisten en ADN que es complementario al ARNm, las EST representan porciones de genes expresados. Pueden representarse en bases de datos como secuencia de ADNc/ARNm o como el complemento inverso del ARNm, la cadena molde.

Se pueden asignar tecnologías ecológicamente racionales a ubicaciones cromosómicas específicas utilizando técnicas de mapeo físico, como el mapeo híbrido de radiación, el mapeo Happy o FISH. Alternativamente, si se ha secuenciado el genoma del organismo que originó la EST, se puede alinear la secuencia de EST con ese genoma usando una computadora.

La comprensión actual del conjunto de genes humanos (a partir de 2006) incluye la existencia de miles de genes basados únicamente en evidencia EST. En este sentido, las EST se han convertido en una herramienta para refinar las transcripciones predichas de esos genes, lo que conduce a la predicción de sus productos proteicos y, en última instancia, de su función. Además, la situación en la que se obtienen esos EST (tejido, órgano, estado de enfermedad, por ejemplo, cáncer) proporciona información sobre las condiciones en las que actúa el gen correspondiente. Las EST contienen suficiente información para permitir el diseño de sondas precisas para micromatrices de ADN que luego pueden usarse para determinar perfiles de expresión génica.

Algunos autores utilizan el término "EST" para describir genes para los cuales existe poca o ninguna información adicional además de la etiqueta.

Historia

En 1979, equipos de Harvard y Caltech ampliaron la idea básica de hacer copias de ADN de ARNm in vitro para amplificar una biblioteca de estos en plásmidos bacterianos.

En 1982, Greg Sutcliffe y sus compañeros de trabajo exploraron la idea de seleccionar clones aleatorios o semialeatorios de dicha biblioteca de ADNc para la secuenciación.

Did you mean:

In 1983, Putney et al. sequence 178 clones from a rabbit muscle cDNA library.

En 1991, Adams y sus colaboradores acuñaron el término EST e iniciaron una secuenciación más sistemática como proyecto (comenzando con 600 ADNc cerebrales).

Fuentes de datos y anotaciones

DbEST

El dbEST es una división de Genbank establecida en 1992. En cuanto a GenBank, los datos en dbEST son enviados directamente por laboratorios de todo el mundo y no están seleccionados.

EST contigs

Debido a la forma en que se secuencian las EST, muchas etiquetas de secuencia expresadas distintas son a menudo secuencias parciales que corresponden al mismo ARNm de un organismo. En un esfuerzo por reducir el número de etiquetas de secuencia expresadas para análisis de descubrimiento de genes posteriores, varios grupos ensamblaron etiquetas de secuencia expresadas en contigs EST. Ejemplos de recursos que proporcionan contigs EST incluyen: índices de genes TIGR, Unigene y STACK

La construcción de contigs EST no es trivial y puede producir artefactos (contigs que contienen dos productos genéticos distintos). Cuando la secuencia completa del genoma de un organismo está disponible y se anotan las transcripciones, es posible evitar el ensamblaje de contig y hacer coincidir directamente las transcripciones con las tecnologías ecológicamente racionales. Este enfoque se utiliza en el sistema TissueInfo (ver más abajo) y facilita la vinculación de anotaciones en la base de datos genómica con la información del tejido proporcionada por los datos EST.

Información del tejido

Los análisis de alto rendimiento de tecnologías ecológicamente racionales a menudo enfrentan desafíos similares en la gestión de datos. Un primer desafío es que la procedencia de los tejidos de las bibliotecas EST se describe en inglés sencillo en dbEST. Esto dificulta la escritura de programas que puedan determinar sin ambigüedades que dos bibliotecas EST fueron secuenciadas del mismo tejido. De manera similar, las condiciones de enfermedad del tejido no están anotadas de manera computacionalmente amigable. Por ejemplo, el origen del cáncer de una biblioteca a menudo se mezcla con el nombre del tejido (p. ej., el nombre del tejido "glioblastoma" indica que la biblioteca EST se secuenció a partir de tejido cerebral y la enfermedad es cáncer). Con la notable excepción del cáncer, la enfermedad a menudo no se registra en las entradas de dbEST. El proyecto TissueInfo se inició en el año 2000 para ayudar con estos desafíos. El proyecto proporciona datos seleccionados (actualizados diariamente) para eliminar la ambigüedad del origen del tejido y el estado de la enfermedad (cáncer/no cáncer), ofrece una ontología de tejido que vincula tejidos y órganos "es parte de" un tejido. relaciones (es decir, formaliza el conocimiento de que el hipotálamo es parte del cerebro y que el cerebro es parte del sistema nervioso central) y distribuye software de código abierto para vincular anotaciones de transcripción de genomas secuenciados a perfiles de expresión tisular calculados con datos en dbEST.

Contenido relacionado

Ley de Fick

La Ley de Fick es enunciado que resume la forma en la que operan los principios de difusión. Esta ley cuantifica el movimiento de una sustancia desde una...

Precisión y exactitud

En un conjunto de medidas, la exactitud es la cercanía de las medidas a un valor específico, mientras que la precisión es la cercanía de las medidas entre...

Evidencia empírica

La evidencia empírica de una proposición es evidencia, es decir, lo que apoya o contrarresta esta proposición, que está constituida por o accesible a la...
Más resultados...
Tamaño del texto:
undoredo
format_boldformat_italicformat_underlinedstrikethrough_ssuperscriptsubscriptlink
save