Distancia genética

Compartir Imprimir Citar

La distancia genética es una medida de la divergencia genética entre especies o entre poblaciones dentro de una especie, ya sea que la distancia mida el tiempo desde un ancestro común o el grado de diferenciación. Las poblaciones con muchos alelos similares tienen distancias genéticas pequeñas. Esto indica que están estrechamente relacionados y tienen un ancestro común reciente.

La distancia genética es útil para reconstruir la historia de las poblaciones, como las múltiples expansiones humanas fuera de África. También se utiliza para comprender el origen de la biodiversidad. Por ejemplo, las distancias genéticas entre diferentes razas de animales domésticos a menudo se investigan para determinar qué razas deben protegerse para mantener la diversidad genética.

Base biológica

En el genoma de un organismo, cada gen está ubicado en un lugar específico llamado locus para ese gen. Las variaciones alélicas en estos loci provocan variaciones fenotípicas dentro de las especies (p. ej., color de pelo, color de ojos). Sin embargo, la mayoría de los alelos no tienen un impacto observable en el fenotipo. Dentro de una población, los nuevos alelos generados por mutación mueren o se propagan por toda la población. Cuando una población se divide en diferentes poblaciones aisladas (ya sea por factores geográficos o ecológicos), las mutaciones que ocurren después de la división estarán presentes solo en la población aislada. La fluctuación aleatoria de las frecuencias alélicas también produce diferenciación genética entre poblaciones. Este proceso se conoce como deriva genética. Al examinar las diferencias entre las frecuencias alélicas entre las poblaciones y calcular la distancia genética,

Medidas

Aunque es simple definir la distancia genética como una medida de la divergencia genética, se han propuesto varias medidas estadísticas diferentes. Esto ha sucedido porque diferentes autores consideraron diferentes modelos evolutivos. Las más utilizadas son la distancia genética de Nei, la medida de Cavalli-Sforza y ​​Edwards, y la distancia genética de Reynolds, Weir y Cockerham, que se enumeran a continuación.

En todas las fórmulas de esta sección, Xy Yrepresentan dos poblaciones diferentes para las que Lse han estudiado loci. X_{{u}}Representemos la tufrecuencia alélica en el locus yo.

Distancia genética estándar de Nei

En 1972, Masatoshi Nei publicó lo que se conoció como la distancia genética estándar de Nei. Esta distancia tiene la buena propiedad de que si la tasa de cambio genético (sustitución de aminoácidos) es constante por año o generación, entonces la distancia genética estándar de Nei (D) aumenta en proporción al tiempo de divergencia. Esta medida asume que las diferencias genéticas son causadas por mutación y deriva genética.{displaystyle D=-ln {frac {sum limits _{ell }sum limits _{u}X_{u}Y_{u}}{sqrt {left(sum limits _ {u}X_{u}^{2}right)left(sum limits _{u}Y_{u}^{2}right)}}}}

Esta distancia también se puede expresar en términos de la media aritmética de la identidad del gen. Sea j_{X}la probabilidad de que los dos miembros de la población Xtengan el mismo alelo en un locus particular y j_{Y}sea la probabilidad correspondiente en la población Y. Además, j_{{XY}}sea la probabilidad de que un miembro Xy un miembro Ytengan el mismo alelo. Ahora sea J_{X}, J_{Y}y J_{{XY}}la media aritmética de j_{X}, j_{Y}y j_{{XY}}sobre todos los loci, respectivamente. En otras palabras,{displaystyle J_{X}=sum_{u}{frac {{X_{u}}^{2}}{L}}}{displaystyle J_{Y}=sum_{u}{frac {{Y_{u}}^{2}}{L}}}{displaystyle J_{XY}=sum_{ell}sum_{u}{frac {X_{u}Y_{u}}{L}}}

donde Les el número total de loci examinados.

La distancia estándar de Nei se puede escribir como{displaystyle D=-ln {frac {J_{XY}}{sqrt {J_{X}J_{Y}}}}}

Distancia de la cuerda Cavalli-Sforza

En 1967 Luigi Luca Cavalli-Sforza y ​​AWF Edwards publicaron esta medida. Asume que las diferencias genéticas surgen debido únicamente a la deriva genética. Una de las principales ventajas de esta medida es que las poblaciones están representadas en una hiperesfera, cuya escala es de una unidad por sustitución de genes. La distancia de la cuerda en la esfera hiperdimensional está dada por{displaystyle D_{text{CH}}={frac {2}{pi }}{sqrt {2left(1-sum _{ell }sum _{u}{sqrt { X_{u}Y_{u}}}derecha)}}}

Algunos autores descartan el factor {frac {2}{pi}}para simplificar la fórmula a costa de perder la propiedad de que la escala es de una unidad por sustitución génica.

La distancia genética de Reynolds, Weir y Cockerham

En 1983, esta medida fue publicada por John Reynolds, Bruce Weir y C. Clark Cockerham. Esta medida asume que la diferenciación genética ocurre solo por deriva genética sin mutaciones. Estima el coeficiente de coancestría Thetaque proporciona una medida de la divergencia genética mediante:{displaystyle Theta _{w}={sqrt {frac {sum limits _{ell}sum limits _{u}(X_{u}-Y_{u})^{2}} {2sum limits _{ell }left(1-sum limits _{u}X_{u}Y_{u}right)}}}}

Otras medidas

Se han propuesto muchas otras medidas de distancia genética con éxito variable.

Nei's D A distancia 1983

Esta distancia asume que las diferencias genéticas surgen debido a la mutación y la deriva genética, pero se sabe que esta medida de distancia brinda árboles de población más confiables que otras distancias, particularmente para datos de ADN de microsatélites.{displaystyle D_{A}=1-sum_{ell}sum_{u}{sqrt {X_{u}Y_{u}}}/{L}}

Distancia euclidiana

{displaystyle D_{UE}={sqrt {sum_u}(X_{u}-Y_{u})^{2}}}}

Distancia Goldstein 1995

Fue desarrollado específicamente para marcadores de microsatélites y se basa en el modelo de mutación paso a paso (SMM). mu _{X}y mu _{Y}son las medias de los tamaños de los alelos en la población X e Y.{displaystyle (delta mu)^{2}=sum_{ell }{frac {(mu_{X}-mu_{Y})^{2}}{L}}}

Distancia genética mínima de Nei 1973

Esta medida supone que las diferencias genéticas surgen debido a la mutación y la deriva genética.{displaystyle D_{m}={frac {J_{X}+J_{Y}}{2}}-J_{XY}}

Distancia de Roger 1972

{displaystyle D_{R}={frac {1}{L}}{sqrt {frac {sum limits _{u}(X_{u}-Y_{u})^{2}}{ 2}}}}

índice de fijación

Una medida de distancia genética comúnmente utilizada es el índice de fijación (FST) que varía entre 0 y 1. Un valor de 0 indica que dos poblaciones son genéticamente idénticas (diversidad genética mínima o nula entre las dos poblaciones) mientras que un valor de 1 indica que dos poblaciones son genéticamente diferentes (máxima diversidad genética entre las dos poblaciones). No se supone ninguna mutación. Las poblaciones grandes entre las que hay mucha migración, por ejemplo, tienden a estar poco diferenciadas, mientras que las poblaciones pequeñas entre las que hay poca migración tienden a estar muy diferenciadas. F ST es una medida conveniente de esta diferenciación y, como resultado, F STy las estadísticas relacionadas se encuentran entre las estadísticas descriptivas más utilizadas en población y genética evolutiva. Pero F ST es más que una estadística descriptiva y una medida de diferenciación genética. FST está directamente relacionado con la variación en la frecuencia de alelos entre poblaciones y, a la inversa, con el grado de semejanza entre los individuos dentro de las poblaciones. Si FST es pequeño, significa que las frecuencias alélicas dentro de cada población son muy similares; si es grande, significa que las frecuencias alélicas son muy diferentes.

Software