Polimorfismo de nucleótido simple

format_list_bulleted Contenido keyboard_arrow_down
ImprimirCitar
La molécula de ADN superior difiere de la molécula de ADN inferior en una sola ubicación de punto base (un polimorfismo G/A)

En genética y bioinformática, un polimorfismo de un solo nucleótido (SNP; plural SNP) es una sustitución de la línea germinal de un solo nucleótido en un Posición específica en el genoma que está presente en una fracción suficientemente grande de la población considerada (generalmente considerada como 1% o más).

Por ejemplo, un nucleótido G presente en una ubicación específica en un genoma de referencia puede ser reemplazado por un A en una minoría de individuos. Las dos posibles variaciones de nucleótidos de este SNP (G o A) se denominan alelos.

Los SNP pueden ayudar a explicar las diferencias en la susceptibilidad a una amplia gama de enfermedades en una población. Por ejemplo, un SNP común en el gen CFH se asocia con un mayor riesgo de degeneración macular relacionada con la edad. Las diferencias en la gravedad de una enfermedad o la respuesta a los tratamientos también pueden ser manifestaciones de variaciones genéticas causadas por los SNP. Por ejemplo, dos SNP comunes en el gen APOE, rs429358 y rs7412, conducen a tres alelos principales de APO-E con diferentes riesgos asociados para el desarrollo de la enfermedad de Alzheimer y la edad de inicio de la enfermedad.

Las sustituciones de un solo nucleótido con una frecuencia alélica inferior al 1 % a veces se denominan variantes de un solo nucleótido (SNV). "Variante" También puede usarse como término general para cualquier cambio de un solo nucleótido en una secuencia de ADN, abarcando tanto SNP comunes como mutaciones raras, ya sean de línea germinal o somáticas. Por lo tanto, el término SNV se ha utilizado para referirse a mutaciones puntuales encontradas en células cancerosas. Las variantes de ADN también deben tenerse en cuenta en aplicaciones de diagnóstico molecular, como el diseño de cebadores de PCR para detectar virus, en los que la muestra de ARN o ADN viral puede contener SNV. Sin embargo, esta nomenclatura utiliza distinciones arbitrarias (como una frecuencia alélica del 1%) y no se utiliza de manera consistente en todos los campos; El desacuerdo resultante ha provocado pedidos de un marco más consistente para nombrar las diferencias en las secuencias de ADN entre dos muestras.

Tipos

Tipos de polimorfismo mononucleótido (SNP)

Los polimorfismos de un solo nucleótido pueden caer dentro de secuencias codificantes de genes, regiones no codificantes de genes o en regiones intergénicas (regiones entre genes). Los SNP dentro de una secuencia codificante no necesariamente cambian la secuencia de aminoácidos de la proteína que se produce, debido a la degeneración del código genético.

Los SNP en la región codificante son de dos tipos: SNP sinónimos y SNP no sinónimos. Los SNP sinónimos no afectan la secuencia de la proteína, mientras que los SNP no sinónimos cambian la secuencia de aminoácidos de la proteína.

  • Los SNP en las regiones no codificadoras pueden manifestarse en un mayor riesgo de cáncer, y pueden afectar la estructura del MRNA y la susceptibilidad de las enfermedades. Los SNP no codificadores también pueden alterar el nivel de expresión de un gen, como un eQTL (locus de expresión cuantitativa).
  • SNPs in coding regions:
    • las sustituciones sinónimos por definición no resultan en un cambio de aminoácidos en la proteína, pero todavía pueden afectar su función de otras maneras. Un ejemplo sería una mutación aparentemente silenciosa en el gen de resistencia multidroga 1 (MDR1), que códigos para una bomba de membrana celular que expulsa medicamentos de la célula, puede frenar la traducción y permitir que la cadena de péptidos se plegue en una conformación inusual, causando que la bomba mutante sea menos funcional (en la proteína MDR1 por ejemplo, el polimorfismo C1236T cambia un codón GGC en Gbocine
    • sustituciones no sinónimos:
      • missense – un solo cambio en la base resulta en el cambio en el aminoácido de la proteína y su mal funcionamiento que conduce a la enfermedad (por ejemplo, c.1580G SNP en el gen LMNA – posición 1580 (nt) en la secuencia de ADN (CGT codon) causando que la guanina sea reemplazada por la timina, produciendo el codón CTT en la secuencia de ADN, resulta en el nivel de proteínas en la sustitución de la arginina por la leucina en la posición 527, a nivel de fenotipo que se manifiesta en la displasia de mandibuloacral y proplasia
      • disparates – mutación de puntos en una secuencia de ADN que resulta en un codón de parada prematura, o una tonterías en el mRNA transcribido, y en un producto de proteína truncado, incompleto y generalmente no funcional (por ejemplo, fibrosis quística causada por la mutación G542X en el gen de regulador de conductividad transmembrana fibrosis quística).

Los SNP que no se encuentran en regiones codificantes de proteínas aún pueden afectar el empalme de genes, la unión de factores de transcripción, la degradación del ARN mensajero o la secuencia del ARN no codificante. La expresión genética afectada por este tipo de SNP se denomina eSNP (SNP de expresión) y puede estar en sentido ascendente o descendente del gen.

Frecuencia

Se han identificado más de 600 millones de SNP en todo el genoma humano de la población mundial. Un genoma típico difiere del genoma humano de referencia en 4 a 5 millones de sitios, la mayoría de los cuales (más del 99,9%) consisten en SNP e indeles cortos.

Dentro de un genoma

La distribución genómica de los SNP no es homogénea; Los SNP ocurren en regiones no codificantes con más frecuencia que en regiones codificantes o, en general, donde la selección natural actúa y "fija" los genes. el alelo (eliminando otras variantes) del SNP que constituye la adaptación genética más favorable. Otros factores, como la recombinación genética y la tasa de mutación, también pueden determinar la densidad de SNP.

La densidad de SNP se puede predecir mediante la presencia de microsatélites: los microsatélites AT en particular son potentes predictores de la densidad de SNP, con tractos repetidos largos (AT)(n) que tienden a encontrarse en regiones de densidad de SNP significativamente reducida y bajo contenido de GC..

Dentro de una población

Existen variaciones entre las poblaciones humanas, por lo que un alelo SNP que es común en un grupo geográfico o étnico puede ser mucho más raro en otro. Sin embargo, este patrón de variación es relativamente raro; En una muestra global de 67,3 millones de SNP, el Proyecto de Diversidad del Genoma Humano "no encontró variantes privadas que estén fijadas en un continente o región importante determinados". Las frecuencias más altas las alcanzan unas pocas decenas de variantes presentes en >70% (y algunos miles en >50%) en África, América y Oceanía. Por el contrario, las variantes de mayor frecuencia privadas para Europa, Asia Oriental, Oriente Medio o Asia Central y Meridional alcanzan sólo entre el 10 y el 30%.

Dentro de una población, a los SNP se les puede asignar una frecuencia alélica menor: la frecuencia alélica más baja en un locus que se observa en una población particular. Esta es simplemente la menor de las dos frecuencias alélicas para los polimorfismos de un solo nucleótido.

Con este conocimiento, los científicos han desarrollado nuevos métodos para analizar las estructuras poblacionales en especies menos estudiadas. Al utilizar técnicas de agrupación, el coste del análisis se reduce significativamente. Estas técnicas se basan en secuenciar una población en una muestra agrupada en lugar de secuenciar cada individuo dentro de la población por sí solo. Con las nuevas herramientas bioinformáticas existe la posibilidad de investigar la estructura poblacional, el flujo y la migración de genes mediante la observación de las frecuencias alélicas dentro de toda la población. Con estos protocolos existe la posibilidad de combinar las ventajas de los SNP con marcadores de microsatélites. Sin embargo, se pierde información en el proceso, como el desequilibrio de vinculación y la información de cigosidad.

Aplicaciones

  • Los estudios de asociación pueden determinar si una variante genética está asociada a una enfermedad o rasgo.
  • Una etiqueta SNP es un polimorfismo mononucleótido representativo en una región del genoma con desenquilibrio de alta vinculación (la asociación no rara de alelos a dos o más loci). Tag SNPs son útiles en estudios de asociación SNP de todo el genoma, en los que se genotipan cientos de miles de SNP en todo el genoma.
  • Haplotype mapping: sets of alleles or DNA sequences can be clustered so that a single SNP can identify many linked SNPs.
  • Linkage desenquilibrium (LD), un término utilizado en la genética poblacional, indica la asociación no aleatoria de alelos a dos o más loci, no necesariamente en el mismo cromosoma. Se refiere al fenómeno de que SNP allele o secuencia de ADN que están unidos en el genoma tienden a ser heredados juntos. La LD puede verse afectada por dos parámetros (entre otros factores, como la estratificación de la población): 1) La distancia entre los SNPs [el mayor es la distancia, el menor el LD]. 2) Tasa de reanimación [la baja la tasa de recombinación, la mayor la LD].
  • En epidemiología genética SNPs se utilizan para estimar los racimos de transmisión.

Importancia

Las variaciones en las secuencias de ADN de los humanos pueden afectar la forma en que los humanos desarrollan enfermedades y responden a patógenos, sustancias químicas, medicamentos, vacunas y otros agentes. Los SNP también son fundamentales para la medicina personalizada. Los ejemplos incluyen investigación biomédica, ciencia forense, farmacogenética y causalidad de enfermedades, como se describe a continuación.

Investigación clínica

Estudio de asociación de todo el genoma (GWAS)

Una de las principales contribuciones de los SNP en la investigación clínica es el estudio de asociación de todo el genoma (GWAS). Los datos genéticos de todo el genoma pueden generarse mediante múltiples tecnologías, incluida la matriz de SNP y la secuenciación del genoma completo. GWAS se ha utilizado comúnmente para identificar SNP asociados con enfermedades o fenotipos o rasgos clínicos. Dado que GWAS es una evaluación de todo el genoma, se requiere un sitio de muestra grande para obtener suficiente poder estadístico para detectar todas las asociaciones posibles. Algunos SNP tienen un efecto relativamente pequeño sobre enfermedades o fenotipos o rasgos clínicos. Para estimar el poder del estudio, se debe considerar el modelo genético de la enfermedad, como los efectos dominantes, recesivos o aditivos. Debido a la heterogeneidad genética, el análisis GWAS debe ajustarse según la raza.

Estudio de asociación de genes candidatos

El estudio de asociación de genes candidatos se utiliza comúnmente en estudios genéticos antes de la invención de tecnologías de secuenciación o genotipado de alto rendimiento. El estudio de asociación de genes candidatos tiene como objetivo investigar un número limitado de SNP preespecificados para su asociación con enfermedades o fenotipos o rasgos clínicos. Así que este es un enfoque impulsado por hipótesis. Dado que sólo se prueba un número limitado de SNP, un tamaño de muestra relativamente pequeño es suficiente para detectar la asociación. El enfoque de asociación de genes candidatos también se utiliza comúnmente para confirmar los hallazgos de GWAS en muestras independientes.

Mapeo de homocigosidad en enfermedades

Los datos de SNP de todo el genoma se pueden utilizar para el mapeo de homocigosidad. El mapeo de homocigosidad es un método utilizado para identificar loci autosómicos recesivos homocigotos, que puede ser una herramienta poderosa para mapear regiones genómicas o genes involucrados en la patogénesis de la enfermedad.

Patrones de metilación

Asociaciones entre SNP, patrones de metilación y expresión genética de rasgos biológicos

Recientemente, los resultados preliminares informaron que los SNP son componentes importantes del programa epigenético en los organismos. Además, estudios cosmopolitas en poblaciones europeas y del sur de Asia han revelado la influencia de los SNP en la metilación de sitios CpG específicos. Además, el análisis de enriquecimiento de meQTL utilizando la base de datos GWAS demostró que esas asociaciones son importantes para la predicción de rasgos biológicos.

Ciencias forenses

Históricamente, los SNP se han utilizado para hacer coincidir una muestra de ADN forense con un sospechoso, pero se han vuelto obsoletos debido al avance de las técnicas de huellas dactilares de ADN basadas en STR. Sin embargo, el desarrollo de la tecnología de secuenciación de próxima generación (NGS) puede permitir más oportunidades para el uso de SNP en pistas fenotípicas como el origen étnico, el color del cabello y el color de los ojos con una buena probabilidad de coincidencia. Esto también se puede aplicar para aumentar la precisión de las reconstrucciones faciales al proporcionar información que de otro modo podría ser desconocida, y esta información se puede utilizar para ayudar a identificar sospechosos incluso sin una coincidencia del perfil de ADN STR.

Algunas desventajas del uso de SNP versus STR es que los SNP brindan menos información que los STR y, por lo tanto, se necesitan más SNP para el análisis antes de poder crear un perfil de un sospechoso. Además, los SNP dependen en gran medida de la presencia de una base de datos para el análisis comparativo de muestras. Sin embargo, en casos con muestras degradadas o de pequeño volumen, las técnicas SNP son una excelente alternativa a los métodos STR. Los SNP (a diferencia de los STR) tienen una gran cantidad de marcadores potenciales, pueden automatizarse completamente y una posible reducción de la longitud requerida del fragmento a menos de 100 pb.[26]

Farmacogenética

La farmacogenética se centra en identificar variaciones genéticas, incluidos los SNP, asociados con respuestas diferenciales al tratamiento. Los SNP pueden influir en muchas enzimas metabolizadoras de fármacos, dianas farmacológicas o vías diana. Los SNP implicados en las actividades de las enzimas metabolizadoras de fármacos pueden cambiar la farmacocinética de los fármacos, mientras que los SNP implicados en el objetivo del fármaco o su vía pueden cambiar la farmacodinamia del fármaco. Por lo tanto, los SNP son marcadores genéticos potenciales que pueden usarse para predecir la exposición al fármaco o la eficacia del tratamiento. El estudio farmacogenético de todo el genoma se llama farmacogenómica. La farmacogenética y la farmacogenómica son importantes en el desarrollo de la medicina de precisión, especialmente para enfermedades potencialmente mortales como el cáncer.

Enfermedad

Solo una pequeña cantidad de SNP en el genoma humano puede tener un impacto en las enfermedades humanas. Se ha realizado GWAS a gran escala para las enfermedades humanas más importantes, incluidas enfermedades cardíacas, enfermedades metabólicas, enfermedades autoinmunes y trastornos neurodegenerativos y psiquiátricos. Se han identificado la mayoría de los SNP con efectos relativamente grandes sobre estas enfermedades. Estos hallazgos han mejorado significativamente la comprensión de la patogénesis de la enfermedad y las vías moleculares, y han facilitado el desarrollo de mejores tratamientos. Otros GWAS con muestras de mayor tamaño revelarán los SNP con un efecto relativamente pequeño sobre las enfermedades. En el caso de enfermedades comunes y complejas, como la diabetes tipo 2, la artritis reumatoide y la enfermedad de Alzheimer, en la etiología de la enfermedad intervienen múltiples factores genéticos. Además, la interacción gen-gen y la interacción gen-ambiente también desempeñan un papel importante en el inicio y la progresión de la enfermedad.

Ejemplos

  • rs6311 y rs6313 son PNB en el gen receptor Serotonin 5-HT2A en el cromosoma humano 13.
  • El SNP − 3279C/A (rs3761548) está entre los SNP que se encuentran en la región promotora del gen Foxp3, podría estar involucrado en la progresión del cáncer.
  • A SNP in the F5 gene causes Factor V Leiden thrombophilia.
  • rs3091244 es un ejemplo de un SNP testélico en el gen CRP en el cromosoma humano 1.
  • Códigos TAS2R38 para la capacidad de degustación de PTC, y contiene 6 SNPs anotados.
  • rs148649884 y rs138055828 en el FCN1 la codificación de genes M-ficolin crippled la capacidad de unión de ligando de la M-ficolina recombinante.
  • Un SNP intronico en el gen de reparación del desajuste de ADN PMS2 (rs1059060, Ser775Asn) se asocia con el aumento del daño del ADN del esperma y el riesgo de infertilidad masculina.

Bases de datos

Al igual que las existen para los genes, existen bases de datos bioinformáticas para los SNP.

  • dbSNP es una base de datos SNP del Centro Nacional de Información Biotecnológica (NCBI). Al 8 de junio de 2015, dbSNP enumeraba 149.735.377 SNPs en humanos.
  • Kaviar es un compendio de SNPs de múltiples fuentes de datos incluyendo dbSNP.
  • SNPedia es una base de datos de estilo wiki que apoya la anotación, interpretación y análisis del genoma personal.
  • El OMIM La base de datos describe la asociación entre polimorfismos y enfermedades (por ejemplo, da enfermedades en forma de texto)
  • dbSAP – base de datos de polimorfismo aminoácidos único para la detección de la variación de proteínas
  • The Human Gene Mutation La base de datos proporciona mutaciones genéticas provocadas o asociadas con enfermedades hereditarias humanas y PNB funcionales
  • El Proyecto HapMap Internacional, donde los investigadores están identificando SNPs de etiqueta para poder determinar la colección de haplotipos presentes en cada tema.
  • GWAS Central permite a los usuarios interrogar visualmente los datos reales de asociación a nivel sumario en uno o más estudios de asociación en todo el genoma.

El grupo de trabajo internacional de mapas de SNP mapeó la secuencia que flanquea cada SNP mediante alineamiento con la secuencia genómica de clones de inserción grande en Genebank. Estas alineaciones se convirtieron a coordenadas cromosómicas que se muestran en la Tabla 1. Esta lista ha aumentado considerablemente desde que, por ejemplo, la base de datos Kaviar ahora incluye 162 millones de variantes de un solo nucleótido (SNV).

CromosomaLongitud(bp)All SNPsTSC SNPs
Total SNPskb per SNPTotal SNPskb per SNP
1214,066.000129.9311.6575.11662.85
2222.889.000103.6642.1576.9852.90
3186,938.00093.1402.0163.6692.94
4169.035.00084.4262.0065.7192.57
5170.954.000117,8821.4563.5452.69
6165.022.00096.3171.7153.7973.07
7149.414.00071.7522.0842.3273.53
8125.148.00057.8342.1642.6532.93
9107.440.00062.0131.7343,0202.50
10127.8894.00061.2982.0942.4663.01
11129.193.00084.6631.5347.6212.71
12125.198.00059.2452.1138.1363.28
1393.711.53,0931.7735.7452.62
1489.344.00044.1122.0329.7463.00
1573.467.00037.8141.9426.5242.77
1674.037.00038.7351.9123.3283.17
1773,367.00034.6212.1219.3963.78
1873.078.00045.1351.6227 0282.70
1956.044.00025.6762.1811.1855.01
2063,317.00029.4782.1517.0513.71
2133.824.00020.9161.629,1033.72
2233.786.00028.4101.1911.0563.06
X131.245.00034,8423.7720.4006.43
Y21.753.0004.1935.191,78412.19
RefSeq15,696,67414,5341.08
Totales2.710.164.0001,419,1901.91887.4503.05

Nomenclatura

La nomenclatura de los SNP incluye varias variaciones para un SNP individual, aunque carece de un consenso común.

El estándar rs### es el que ha sido adoptado por dbSNP y utiliza el prefijo "rs", para "SNP de referencia", seguido de un número único y arbitrario. Con frecuencia se hace referencia a los SNP por su número dbSNP rs, como en los ejemplos anteriores.

La Sociedad de Variación del Genoma Humano (HGVS) utiliza un estándar que transmite más información sobre el SNP. Ejemplos son:

  • c.76A confíaT: "c." para la región de codificación, seguido de un número para la posición del nucleótido, seguido de una abreviatura de una letras para el nucleótido (A, C, G, T o U), seguido de un signo mayor que el signo ("") para indicar sustitución, seguido por la abreviación del nucleótido que reemplaza al anterior
  • p.Ser123Arg: "p." para la proteína, seguido de una abreviación de tres letras para el aminoácido, seguido de un número para la posición del aminoácido, seguido de la abreviación del aminoácido que reemplaza al anterior.

Análisis de SNP

Los SNP se pueden analizar fácilmente debido a que solo contienen dos alelos posibles y tres genotipos posibles que involucran los dos alelos: homocigoto A, homocigoto B y heterocigoto AB, lo que lleva a muchas técnicas posibles de análisis. Algunos incluyen: secuenciación de ADN; electroforesis capilar; espectrometría de masas; polimorfismo de conformación monocatenario (SSCP); extensión de base única; análisis electroquímico; HPLC desnaturalizante y electroforesis en gel; polimorfismo de longitud de fragmentos de restricción; y análisis de hibridación.

Programas de predicción de efectos SNP

Un grupo importante de SNP son aquellos que corresponden a mutaciones sin sentido que provocan cambios de aminoácidos a nivel de proteína. La mutación puntual de un residuo particular puede tener diferentes efectos sobre la función de la proteína (desde ningún efecto hasta la interrupción completa de su función). Por lo general, el cambio en aminoácidos con tamaño y propiedades fisicoquímicas similares (por ejemplo, sustitución de leucina por valina) tiene un efecto leve y opuesto. De manera similar, si el SNP altera elementos de la estructura secundaria (por ejemplo, sustitución por prolina en la región de la hélice alfa), dicha mutación generalmente puede afectar la estructura y función de toda la proteína. Utilizando esas reglas simples y muchas otras derivadas del aprendizaje automático, se desarrolló un grupo de programas para la predicción del efecto SNP:

  • SIFT Este programa proporciona información sobre cómo una mutación inducida por un laboratorio afectará a la función de proteína basada en las propiedades físicas del aminoácido y la homología de la secuencia.
  • LIST (Identidad Local e Taxa Compartida) estima que la posible eliminación de mutaciones se debió a alterar sus funciones de proteína. Se basa en la suposición de que las variaciones observadas en especies estrechamente relacionadas son más significativas al evaluar la conservación en comparación con las de especies distantes.
  • SNAP2
  • SuSPect
  • PolyPhen-2
  • PredictSNP
  • MutationTaster: sitio web oficial
  • Predictor de efectos variables del proyecto Ensembl
  • SNPViz Archivado 2020-08-07 en la máquina Wayback Este programa proporciona una representación 3D de la proteína afectada, destacando el cambio de aminoácidos para que los médicos puedan determinar la patogenicidad de la proteína mutante.
  • PROVEAN
  • PhyreRisk es una base de datos que mapea variantes a estructuras de proteína experimentales y predichas.
  • Missense3D es una herramienta que proporciona un informe estereoquímico sobre el efecto de las variantes de missense en la estructura de proteínas.

Contenido relacionado

Ley de Fick

La Ley de Fick es enunciado que resume la forma en la que operan los principios de difusión. Esta ley cuantifica el movimiento de una sustancia desde una...

Híbrido (biología)

En biología, un híbrido es la descendencia que resulta de combinar las cualidades de dos organismos de diferentes razas, variedades, especies o géneros a...

Evolución divergente

La evolución divergente o selección divergente es la acumulación de diferencias entre poblaciones estrechamente relacionadas dentro de una especie, lo que...
Más resultados...
Tamaño del texto:
undoredo
format_boldformat_italicformat_underlinedstrikethrough_ssuperscriptsubscriptlink
save