Principio de Hardy-Weinberg
En genética de poblaciones, el principio de Hardy-Weinberg, también conocido como equilibrio de Hardy-Weinberg, modelo, teorema, o ley, establece que las frecuencias de alelos y genotipos en una población permanecerán constantes de generación en generación en ausencia de otras influencias evolutivas. Estas influencias incluyen deriva genética, elección de pareja, apareamiento selectivo, selección natural, selección sexual, mutación, flujo de genes, impulso meiótico, autostop genético, cuello de botella poblacional, efecto fundador, depresión por consanguinidad y exogamia.
En el caso más simple de un solo locus con dos alelos denominados A y a con frecuencias f (A) = p y f(a) = q, respectivamente, las frecuencias genotípicas esperadas bajo apareamiento aleatorio son f(AA) = p2 para los homocigotos AA, f(aa) = q2 para los homocigotos aa, y f(Aa) = 2pq para los heterocigotos. En ausencia de selección, mutación, deriva genética u otras fuerzas, las frecuencias alélicas p y q son constantes entre generaciones, por lo que se alcanza el equilibrio.
El principio lleva el nombre de G. H. Hardy y Wilhelm Weinberg, quienes lo demostraron matemáticamente por primera vez. El artículo de Hardy se centró en desacreditar la opinión de que un alelo dominante tendería automáticamente a aumentar en frecuencia (una opinión posiblemente basada en una pregunta mal interpretada en una conferencia). Hoy en día, las pruebas de frecuencias de genotipos de Hardy-Weinberg se utilizan principalmente para evaluar la estratificación de la población y otras formas de apareamiento no aleatorio.
Derivación
Considérese una población de diploides monoicos, donde cada organismo produce gametos masculinos y femeninos con la misma frecuencia y tiene dos alelos en cada locus genético. Suponemos que la población es tan grande que puede tratarse como infinita. Los organismos se reproducen por unión aleatoria de gametos (el modelo de población de 'reserva genética'). Un locus en esta población tiene dos alelos, A y a, que ocurren con frecuencias iniciales f0(A) = p y f0(a) = q, respectivamente. Las frecuencias alélicas en cada generación se obtienen agrupando los alelos de cada genotipo de la misma generación según la contribución esperada de los genotipos homocigoto y heterocigoto, que son 1 y 1/2, respectivamente:
- ft()A)=ft()AA)+12ft()Aa){displaystyle f_{t}({text{A})=f_{t}({text{AA}})+{tfrac {1}{2}}}f_{t} {text{Aa}}}}} {f}} {f}}} {f} {f}}}} {f}}}}}}}}}}}}}}}}}} {
()1)
- ft()a)=ft()aa)+12ft()Aa){displaystyle f_{t}({text{a})=f_{t}({text{aaaa}})+{tfrac} {1}{2}f_{t} {text{Aaa}}} {f}} {f} {f} {f}}} {f}}} {f}}}}} {f}} {f}}} {f}}} {f} {f}}}} {f}}}}}}}}}}}}}}} {f} {f}}} {f}}}} {f}}}}} {f}}}}} {f}}}}}} {f}}}}} {f} {f}} {f}}}}}}}} {f}} {f} {f} {f} {f} {f}}}}}}}}} {f} {f}} {f}}}}}}}}}} {f}}}}}}}}}}}}}}}}} {f}}}}}}}}
()2)
Las diferentes formas de formar genotipos para la próxima generación se pueden mostrar en un cuadro de Punnett, donde la proporción de cada genotipo es igual al producto de las frecuencias alélicas de fila y columna de la generación actual.
| Mujeres | |||
|---|---|---|---|
| Ap) | aq) | ||
| Hombres | Ap) | AAp2) | Aapq) |
| aq) | Aaqp) | aaq2) | |
La suma de las entradas es p2 + 2pq + q2 = 1, ya que las frecuencias de los genotipos deben sumar uno.
Observe nuevamente que como p + q = 1, la expansión binomial de (p + q)2 = p2 + 2 pq + q2 = 1 da las mismas relaciones.
Al sumar los elementos del cuadro de Punnett o la expansión binomial, obtenemos las proporciones de genotipo esperadas entre los descendientes después de una sola generación:
- f1()AA)=p2=f0()A)2{displaystyle f_{1}({text{AA}})=p^{2}=f_{0}({text{A}})} {f}}} {f}}}}
()3)
- f1()Aa)=pq+qp=2pq=2f0()A)f0()a){displaystyle f_{1}({text{Aa}})=pq+qp=2pq=2f_{0}({text{A}})f_{0} {text{a}}}}}
()4)
- f1()aa)=q2=f0()a)2{displaystyle f_{1} {text{aaa}})=q^{2}=f_{0}({text{a}})} {c}}
()5)
Estas frecuencias definen el equilibrio de Hardy-Weinberg. Debe mencionarse que las frecuencias de genotipo después de la primera generación no necesitan ser iguales a las frecuencias de genotipo de la generación inicial, p. f1(AA) ≠ f0(AA). Sin embargo, las frecuencias de genotipo para todos los tiempos futuros serán iguales a las frecuencias de Hardy-Weinberg, p. ft(AA) = f1(AA) para t > 1. Esto se debe a que las frecuencias genotípicas de la siguiente generación dependen únicamente de las frecuencias alélicas de la generación actual que, calculadas mediante las ecuaciones (1) y (2), se conservan de la generación inicial:
- f1()A)=f1()AA)+12f1()Aa)=p2+pq=p()p+q)=p=f0()A)f1()a)=f1()aa)+12f1()Aa)=q2+pq=q()p+q)=q=f0()a){displaystyle {begin{aligned}f_{1}({text{A}) {1}{2}f_{1}({text{Aa})=p^{2}+pq=p(p+q)=p=f_{0}({text{A})f_{1}({text{a})} {=f_{1} {text{aaaaa}}})+{tfrac} {i} {c} {c}} {c}}} {c}}} {cc}}}}}}}}} {ccccccccccccccccccccccccccccccccccccccccccccccccccccccccccccc {1}{2}f_{1}({text{Aa})=q^{2}+pq=q(p+q)=q=f_{0}({text{a})end{aligned}}}}
Para el caso más general de los diploides dioicos [los organismos son machos o hembras] que se reproducen por apareamiento aleatorio de individuos, es necesario calcular las frecuencias genotípicas de los nueve apareamientos posibles entre cada genotipo parental (AA, Aa y aa) en ambos sexos, ponderados por las contribuciones esperadas del genotipo de cada apareamiento. De manera equivalente, uno considera las seis combinaciones diploides-diploides únicas:
- [()AA,AA),()AA,Aa),()AA,aa),()Aa,Aa),()Aa,aa),()aa,aa)]{fnMicrosoft Sans Serif} {fnMicrosoft Sans Serif} {fnMicrosoft Sans Serif}}} {text{}}} {text{}}}} {text{} {atext{}}}} {atext{}} {atext{}}}}} {atextaaatexta}}}} {}}}}{}{}}}}}}{}{}{}{}{}{}{}{}}}}{}{}{}{}}}}{}}}}{}{}}}}}}}}{}}}}}}}}}}}}}}}}}{}}}}}}}{}}}}}{}{}{}{}{}}}{}{}{}}}}}}}}}}}}}}}{}{}{}{}{}}}}{}}}}}}}}}}}}}}}}}}}
y construye un cuadro de Punnett para cada uno, a fin de calcular su contribución a los genotipos de la próxima generación. Estas contribuciones se ponderan según la probabilidad de cada combinación diploide-diploide, que sigue una distribución multinomial con k = 3. Por ejemplo, la probabilidad de la combinación de apareamiento (AA,aa) es 2 f t(AA)ft(aa) y solo puede resultar en Aa genotipo: [0,1,0]. En general, las frecuencias de genotipo resultantes se calculan como:
- [ft+1()AA),ft+1()Aa),ft+1()aa)]==ft()AA)ft()AA)[1,0,0]+2ft()AA)ft()Aa)[12,12,0]+2ft()AA)ft()aa)[0,1,0]+ft()Aa)ft()Aa)[14,12,14]+2ft()Aa)ft()aa)[0,12,12]+ft()aa)ft()aa)[0,0,1]=[()ft()AA)+12ft()Aa))2,2()ft()AA)+12ft()Aa))()ft()aa)+12ft()Aa)),()ft()aa)+12ft()Aa))2]=[ft()A)2,2ft()A)ft()a),ft()a)2]{fnMicrosoft Sans Serif} {f} {f} {f}f} {f}} {f} {f} {f}} {f}f}}f}f}f}f}f}f}f}f}f}f}f}f}cH00}cH0}cH0}cH0}cH00cH00cH00cH00cH00}cH00cH00cH00cH00cH00cH00cH00cH00cH00cH00}cH00cH00cH00}cH00}cH00cH00}cH00cH00cH00cH00cH00}cH00}cH00}cH00cH00cH00cH00cH00}}cH00} {1}{2}},{tfrac {1} {2}},0right]+2f_{t}({text{})f_{t}({text{a})left[0,0right]qquad qquad +f_{t}({text{Aa}} {} {c} {} {c}}} {c}}} {c}}}}} {ccccccc}}}} {ccccccccccccccccccccccccc} {cccccccccccccccc}}}}}}}} {c} {cccccccccc}}}}}} {0} {0} {f} {f} {f}} {f}} {f} {f}} {f}} {f} {f}} {f}} {f}} {f}} {f}} {f}}} {f}} {f}}} {f}}}} {f}}}} {f}}}}}}}} {f}}}} {f}}}} {f}}} {f}} {f}}}}} {f}} {f} {f}}} {f}}}}}}}}}} {f}}}}} {f} {f}}}}}}}}}}} {f} {f} {f}} {f}}}}}}}}}} {f} {f} {f}}} {f}}}}}}}}}}}}}}}}} =left[left(f_{text{AA})+{tfrac {1}{2}f_{t}({text{Aa})right)}{2},2left(f_{t}({text{AA}})+{tfrac {1}{2}f_{t}({text{Aa})right)left(f_{t}({text{aaa}})+{tfrac {1}{2}f_{t}({text{Aa})right),left(f_{t}({text{aaa}})+{tfrac} {2} {f} {f} {text{}}}}derecha]fqquad =left[f_{t}({text{A})}{2},2f_{t} {f} {f} {f} {f} {f}} {f} {f} {f} {f}}}}} {} {f}}}}}} {f}}}} {f}{}}}}}}}}}} {} {f}{}}}}}}}} {}}} {}}}}} {}}}}}}}}}}} {}}}}}}} {f} {} {}}}}}} {}} {}}}}}} {} {f} {}}}}}}}}}}}}}}} {}}}}} {f} {}}}}}}}}}}}}}}}}}}}} {
Como antes, se puede demostrar que las frecuencias alélicas en el momento t + 1 son iguales a las del momento t, y así, son constantes en el tiempo. De manera similar, las frecuencias de los genotipos dependen solo de las frecuencias de los alelos, por lo que, después del tiempo, t = 1 también son constantes en el tiempo.
Si en organismos monoicos o dioicos, las proporciones de alelos o genotipos son inicialmente desiguales en ambos sexos, se puede demostrar que se obtienen proporciones constantes después de una generación de apareamiento aleatorio. Si los organismos dioicos son heterogaméticos y el locus del gen está ubicado en el cromosoma X, se puede demostrar que si las frecuencias alélicas son inicialmente desiguales en los dos sexos [p. ej., mujeres XX y hombres XY, como en humanos], f′(a) en el sexo heterogamético 'chases' f(a) en el sexo homogamético de la generación anterior, hasta alcanzar un equilibrio en la media ponderada de las dos frecuencias iniciales.
Desviaciones del equilibrio de Hardy-Weinberg
Los siete supuestos que subyacen al equilibrio de Hardy-Weinberg son los siguientes:
- organismos son diploides
- sólo la reproducción sexual ocurre
- generaciones no superpuestas
- apareamiento es aleatorio
- tamaño de la población es infinitamente grande
- frecuencias de alelo son iguales en los sexos
- no hay migración, flujo de genes, admixtura, mutación o selección
Las violaciones de los supuestos de Hardy-Weinberg pueden provocar desviaciones de las expectativas. Cómo afecta esto a la población depende de los supuestos que se violan.
- Aleatorio. El HWP afirma que la población tendrá las frecuencias genotípicas dadas (llamadas proporciones Hardy-Weinberg) después de una sola generación de apareamiento aleatorio dentro de la población. Cuando se viola la suposición aleatoria de apareamiento, la población no tendrá proporciones Hardy-Weinberg. Una causa común de apareamiento no aleatorio es la incineración, que causa un aumento de la homocigosidad para todos los genes.
Si una población viola uno de los siguientes cuatro supuestos, la población puede continuar teniendo proporciones de Hardy-Weinberg en cada generación, pero las frecuencias alélicas cambiarán con el tiempo.
- La selección, en general, hace que las frecuencias de alelo cambien, a menudo bastante rápido. Mientras que la selección direccional eventualmente conduce a la pérdida de todos los alelos excepto el favorecido (a menos que un alelo sea dominante, en cuyo caso los alelos recesivos pueden sobrevivir en bajas frecuencias), algunas formas de selección, como el equilibrio de la selección, conducen al equilibrio sin pérdida de alelos.
- La mutación tendrá un efecto muy sutil en las frecuencias de alelo a través de la introducción de nuevo alelo en una población. Las tasas de mutación son del orden 10−4 a 10−8, y el cambio en la frecuencia del alelo será, al menos, el mismo orden. La mutación recurrente mantendrá alelos en la población, incluso si hay una fuerte selección contra ellos.
- La migración vincula genéticamente a dos o más poblaciones juntas. En general, las frecuencias de alelo se volverán más homogéneas entre las poblaciones. Algunos modelos para la migración incluyen inherentemente el apareamiento no aleatorio (efecto Wahlund, por ejemplo). Para esos modelos, las proporciones Hardy-Weinberg normalmente no serán válidas.
- El tamaño pequeño de la población puede causar un cambio aleatorio en frecuencias de alelo. Esto se debe a un efecto de muestreo, y se llama deriva genética. Los efectos de muestreo son más importantes cuando el alelo está presente en un pequeño número de copias.
En los datos de genotipos del mundo real, las desviaciones del equilibrio de Hardy-Weinberg pueden ser un signo de error de genotipado.
Vinculación sexual
Donde el gen A está ligado al sexo, el sexo heterogamético (p. ej., machos mamíferos, hembras aviares) tiene solo una copia del gen (y se denominan hemicigóticos), mientras que el sexo homogamético (p. ej., hembras humanas) tienen dos copias. Las frecuencias genotípicas en equilibrio son p y q para el sexo heterogamético pero p2, 2pq y q2 para el sexo homogamético.
Por ejemplo, en los humanos, el daltonismo rojo-verde es un rasgo recesivo ligado al cromosoma X. En los hombres de Europa occidental, el rasgo afecta aproximadamente a 1 de cada 12 (q = 0,083), mientras que afecta a aproximadamente 1 de cada 200 mujeres (0,005, en comparación con q2 = 0.007), muy cerca de las proporciones de Hardy-Weinberg.
Si una población se junta con machos y hembras con una frecuencia alélica diferente en cada subpoblación (machos o hembras), la frecuencia alélica de la población masculina en la próxima generación seguirá la de la población femenina porque cada hijo recibe su cromosoma X de su madre. La población converge al equilibrio muy rápidamente.
Generalizaciones
La derivación simple anterior se puede generalizar para más de dos alelos y poliploidía.
Generalización para más de dos alelos
Considere una frecuencia alélica adicional, r. El caso de dos alelos es la expansión binomial de (p + q)2 y, por lo tanto, el caso de tres alelos es la expansión trinominal de (p + q + r)2.
- ()p+q+r)2=p2+q2+r2+2pq+2pr+2qr{displaystyle (p+q+r)^{2}=p^{2}+q^{2}+r^{2}+2pq+2pr+2qr,}
Más generalmente, considere los alelos A1,..., An dados por las frecuencias alélicas p1 a pn;
- ()p1+⋯ ⋯ +pn)2{displaystyle (p_{1}+cdots +p_{n}{2},}
dando para todos los homocigotos:
- f()AiAi)=pi2{displaystyle f(A_{i}A_{i}=p_{i}{2},}
y para todos los heterocigotos:
- f()AiAj)=2pipj{displaystyle f(A_{i}A_{j})=2p_{i}p_{j},}
Generalización para poliploidía
El principio de Hardy-Weinberg también puede generalizarse a sistemas poliploides, es decir, para organismos que tienen más de dos copias de cada cromosoma. Considere nuevamente solo dos alelos. El caso diploide es la expansión binomial de:
- ()p+q)2{displaystyle (p+q)^{2},}
y por lo tanto el caso poliploide es la expansión binomial de:
- ()p+q)c{displaystyle (p+q)^{c},}
donde c es la ploidía, por ejemplo con tetraploide (c = 4):
| Genotipo | Frecuencia |
|---|---|
| AAAA | p4{displaystyle p^{4} |
| AAAa | 4p3q{displaystyle 4p^{3}q} |
| AAaa | 6p2q2{displaystyle 6p^{2}q^{2}} |
| Aaaa | 4pq3{displaystyle 4pq^{3} |
| aaaaa | q4{displaystyle q^{4} |
Si el organismo es un 'verdadero' tetraploide o anfidiploide determinará cuánto tiempo le tomará a la población alcanzar el equilibrio de Hardy-Weinberg.
Generalización completa
Para n{displaystyle n} alelos distintos en c{displaystyle c}-ploides, las frecuencias genotipos en el equilibrio Hardy-Weinberg se dan por términos individuales en la expansión multinomio ()p1+⋯ ⋯ +pn)c{displaystyle (p_{1}+cdots +p_{n}{c}}:
- ()p1+⋯ ⋯ +pn)c=.. k1,...... ,kn▪ ▪ N:k1+⋯ ⋯ +kn=c()ck1,...... ,kn)p1k1⋯ ⋯ pnkn{displaystyle (p_{1}+cdots +p_{n}{c}=sum _{k_{1},ldotsk_{n}in mathbb {N}:k_{1}+cdots ## k_{1}ldotsk_{1}p_{1}cdots ¿Qué?
Pruebas de significancia para desviación
La desviación de la prueba del HWP generalmente se realiza mediante la prueba de chi-cuadrado de Pearson, utilizando las frecuencias de genotipo observadas obtenidas de los datos y las frecuencias de genotipo esperadas obtenidas mediante el HWP. Para los sistemas donde hay una gran cantidad de alelos, esto puede dar como resultado datos con muchos genotipos posibles vacíos y recuentos bajos de genotipos, porque a menudo no hay suficientes individuos presentes en la muestra para representar adecuadamente todas las clases de genotipos. Si este es el caso, entonces la asunción asintótica de la distribución de chi-cuadrado ya no se mantendrá, y puede ser necesario usar una forma de prueba exacta de Fisher, que requiere una computadora para resolver. Más recientemente, se han propuesto varios métodos MCMC para probar las desviaciones de HWP (Guo & Thompson, 1992; Wigginton et al. 2005)
Ejemplo de prueba de chi-cuadrado para desviación
Estos datos son de E. B. Ford (1971) sobre la polilla tigre escarlata, para la cual se registraron los fenotipos de una muestra de la población. Se supone que la distinción genotipo-fenotipo es insignificantemente pequeña. La hipótesis nula es que la población está en proporciones de Hardy-Weinberg y la hipótesis alternativa es que la población no está en proporciones de Hardy-Weinberg.
| Fenotipo | Blanco manchado (AA) | Intermedio (Aa) | Un poco de mancha (aa) | Total |
|---|---|---|---|---|
| Número | 1469 | 138 | 5 | 1612 |
A partir de esto, se pueden calcular las frecuencias alélicas:
- p=2× × obs()AA)+obs()Aa)2× × ()obs()AA)+obs()Aa)+obs()aa))=2× × 1469+1382× × ()1469+138+5)=30763224=0.954################################################################################################################################################################################################################################################################
y
- q=1− − p=1− − 0.954=0,046{displaystyle {begin{aligned}q limit=1-p\fn1-0.954\\\\=0,46end{aligned}}
Entonces, la expectativa de Hardy-Weinberg es:
- Exp()AA)=p2n=0.9542× × 1612=1467.4Exp()Aa)=2pqn=2× × 0.954× × 0,046× × 1612=141.2Exp()aa)=q2n=0,0462× × 1612=3.4{fnMicrosoft Sans Serif} {fnMicrosoft Sans Serif} {fnMicrosoft Sans Serif} {fnMicrosoft Sans Serif} {fnMicrosoft Sans Serif} {fnMicrosoft Sans Serif} {fnMicrosoft Sans Serif}
La prueba de chi-cuadrado de Pearson establece:
- χ χ 2=.. ()O− − E)2E=()1469− − 1467.4)21467.4+()138− − 141.2)2141.2+()5− − 3.4)23.4=0,001+0,073+0,765=0.83{displaystyle {begin{aligned}chi ^{2}=sum {(O-E)^{2}over E}\={(1469-1467.4)^{2}over 1467.4}+{(138-141.2)^{2}over 141.2}+{(5-3.4)^{2}over 3.4}\=0.001+0.756\\\\}\\\\\\\\\\\\\}\\\}\\\\\0}\\\\\\\\\\\\0}\\\\\\\\\\\\\\\\\\\\]\\\\\\\\\\\\\\\\\\\\
Hay 1 grado de libertad (los grados de libertad para la prueba de proporciones de Hardy-Weinberg son # genotipos − # alelos). El nivel de significación del 5 % para 1 grado de libertad es 3,84, y dado que el valor de χ2 es menor que este, la hipótesis nula de que la población está en las frecuencias de Hardy-Weinberg no rechazado.
Prueba exacta de Fisher (prueba de probabilidad)
La prueba exacta de Fisher se puede aplicar a las pruebas de proporciones de Hardy-Weinberg. Dado que la prueba está condicionada a las frecuencias de los alelos, p y q, el problema puede verse como una prueba del número adecuado de heterocigotos. De esta forma, se rechaza la hipótesis de las proporciones de Hardy-Weinberg si el número de heterocigotos es demasiado grande o demasiado pequeño. Las probabilidades condicionales para el heterocigoto, dadas las frecuencias alélicas, se dan en Emigh (1980) como
- Prob [n12▪ ▪ n1]=()nn11,n12,n22)()2nn1,n2)2n12,{displaystyle operatorname {prob} [n_{12}mid {fnMicrosoft {fnMicrosoft} {n}{n_{11},n_{12},n_{22}{binom} {2n}{n_{1},n_{2}}}2 {n_{12}}}
Donde n11, n12, n22 son los números observados de los tres genotipos, AA, Aa y aa, respectivamente, y n1 es el número de Alelos, donde n1=2n11+n12{displaystyle No..
Un ejemploUsando uno de los ejemplos de Emigh (1980), podemos considerar el caso donde n= 100, y p= 0.34. Los posibles heterocigotos observados y su nivel de significación exacto se da en el cuadro 4.
| Número de heterocigotas | Nivel de significación |
|---|---|
| 0 | 0,000 |
| 2 | 0,000 |
| 4 | 0,000 |
| 6 | 0,000 |
| 8 | 0,000 |
| 10 | 0,000 |
| 12 | 0,000 |
| 14 | 0,000 |
| 16 | 0,000 |
| 18 | 0,001 |
| 20 | 0,007 |
| 22 | 0,034 |
| 34 | 0,067 |
| 24 | 0.151 |
| 32 | 0.291 |
| 26 | 0.474 |
| 30 | 0,730 |
| 28 | 1.000 |
Usando esta tabla, se debe buscar el nivel de significación de la prueba en función del número observado de heterocigotos. Por ejemplo, si se observaron 20 heterocigotos, el nivel de significación para la prueba es 0,007. Como es habitual en la prueba exacta de Fisher para muestras pequeñas, la gradación de los niveles de significación es bastante tosca.
Sin embargo, se debe crear una tabla como esta para cada experimento, ya que las tablas dependen tanto de n como de p.
Pruebas de equivalencia
Las pruebas de equivalencia se desarrollan para establecer un acuerdo suficientemente bueno de las frecuencias de genotipo observadas y el equilibrio Hardy Weinberg. Vamos M{displaystyle {fnMithcal}} denota la familia de las distribuciones genotipos bajo el supuesto de equilibrio Hardy Weinberg. La distancia entre una distribución genotipo p{displaystyle p} y Hardy Weinberg equilibrio se define por d()p,M)=minq▪ ▪ Md()p,q){displaystyle d(p,{mathcal {M}})=min _{qin {mathcal {}d(p,q)}}, donde d{displaystyle d} es cierta distancia. El problema de la prueba de equivalencia se da por H0={}d()p,M)≥ ≥ ε ε }{displaystyle H_{0}={d(p,{mathcal {M})geq varepsilon } y <math alttext="{displaystyle H_{1}={d(p,{mathcal {M}})H1={}d()p,M).ε ε }{displaystyle ¿Qué? {}}<img alt="{displaystyle H_{1}={d(p,{mathcal {M}}), donde 0}" xmlns="http://www.w3.org/1998/Math/MathML">ε ε ■0{displaystyle varepsilon }0 " aria-hidden="true" class="mwe-math-fallback-image-inline" src="https://wikimedia.org/api/rest_v1/media/math/render/svg/e04ec3670b50384a3ce48aca42e7cc5131a06b12" style="vertical-align: -0.338ex; width:5.344ex; height:2.176ex;"/> es un parámetro de tolerancia. Si la hipótesis H0{displaystyle H_{0} puede ser rechazado entonces la población está cerca del equilibrio Hardy Weinberg con una alta probabilidad. Las pruebas de equivalencia para el caso biallelico se desarrollan entre otros en Wellek (2004). Las pruebas de equivalencia para el caso de los alelos múltiples se proponen en Ostrovski (2020).
Coeficiente de consanguinidad
El coeficiente de energia, F{displaystyle F} (ver también F-estadística), es un menos la frecuencia observada de heterocigotes sobre la que se espera del equilibrio Hardy-Weinberg.
- F=E ()f()Aa))− − O ()f()Aa))E ()f()Aa))=1− − O ()f()Aa))E ()f()Aa)),{f} {f} {f} {f}} {f}} {f} {f} {f} {f}}} {f}} {f}}} {f} {f} {f} {f} {f} {f} {f} {f}f}f} {f} {f}f}f}f}f}f}f}}}}f}f}f}f}}f}f}f}}}}}f} {f} {f}f}f}f}f}f}}f}f}f}f}}f}f}}f}}}f}f}f}f}f}f}f}f}f} {f}f}f}f}f}f}f}f}}}f}f} }
donde el valor esperado del equilibrio de Hardy-Weinberg viene dado por
- E ()f()Aa))=2pq{displaystyle operatorname {E} (f({text{Aa})=2pq}
Por ejemplo, para los datos de Ford anteriores:
- F=1− − 138141.2=0.023.{displaystyle F=1-{138 over 141.2}=0.023.}
Para dos alelos, la bondad de la prueba de ajuste de las proporciones de Hardy-Weinberg es equivalente a la prueba de la inbreeding,F=0{displaystyle F=0}.
El coeficiente de endogamiento es inestable ya que el valor esperado se aproxima a cero, y por lo tanto no es útil para alelos raros y muy comunes. Para: FSilencioE=0,O=0=− − JUEGO JUEGO {displaystyle F{big Silencio.; 0}}" xmlns="http://www.w3.org/1998/Math/MathML">FSilencioE=0,O■0{displaystyle F{big Silencio.0}}" aria-hidden="true" class="mwe-math-fallback-image-inline" src="https://wikimedia.org/api/rest_v1/media/math/render/svg/ef7241585a9a7556a525b37ac39f0cc9a006c944" style="vertical-align: -1.505ex; width:9.788ex; height:3.676ex;"/> es indefinido.
Historia
La genética mendeliana se redescubrió en 1900. Sin embargo, siguió siendo algo controvertida durante varios años, ya que no se sabía cómo podía causar características continuas. Udny Yule (1902) argumentó en contra del mendelismo porque pensó que los alelos dominantes aumentarían en la población. El estadounidense William E. Castle (1903) demostró que sin selección, las frecuencias genotípicas se mantendrían estables. Karl Pearson (1903) encontró una posición de equilibrio con valores de p = q = 0,5. Reginald Punnett, incapaz de contrarrestar el punto de Yule, le presentó el problema a G. H. Hardy, un matemático británico, con quien jugaba al cricket. Hardy era un matemático puro y despreciaba las matemáticas aplicadas; su visión de los biólogos' el uso de las matemáticas aparece en su artículo de 1908, donde describe esto como "muy simple":
- Para el Editor de la Ciencia: Me renuente a inmiscuir en una discusión sobre asuntos de los cuales no tengo conocimiento experto, y debería haber esperado el punto muy simple que me gustaría hacer para haber estado familiarizado con los biólogos. Sin embargo, algunos comentarios del Sr. Udny Yule, a los que el Sr. R. C. Punnett ha llamado mi atención, sugieren que puede todavía valer la pena...
- Supongamos que Aa es un par de personajes mendelianos, un ser dominante, y que en cualquier generación dada el número de dominios puros (AA), heterocigotes (Aa), y recesivos puros (aaa) son como p:2q:r. Finalmente, supongamos que los números son bastante grandes, para que el apareamiento pueda ser considerado como aleatorio, que los sexos se distribuyen uniformemente entre las tres variedades, y que todos son igualmente fértiles. Un poco de matemáticas del tipo de multiplicación-tabla es suficiente para demostrar que en la próxima generación los números serán como ()p+q)2:2(p+q)q+r):q+r)2, o como p1:2q1:r1, di.
- La pregunta interesante es: ¿en qué circunstancias esta distribución será la misma que en la generación anterior? Es fácil ver que la condición para esto es q2=pr. Y desde q12=p1r1, independientemente de los valores p, q, y r puede ser, la distribución en cualquier caso continuará sin cambios después de la segunda generación
El principio se conoció como ley de Hardy en el mundo de habla inglesa hasta 1943, cuando Curt Stern señaló que había sido formulado de forma independiente por primera vez en 1908 por el médico alemán Wilhelm Weinberg. William Castle en 1903 también derivó las proporciones para el caso especial de frecuencias alélicas iguales, y a veces (pero rara vez) se le llama Ley de Hardy-Weinberg-Castle.
Derivación de las ecuaciones de Hardy
La declaración de Hardy comienza con una relación de recurrencia para las frecuencias p, 2q, y r. Estas relaciones de recurrencia se derivan de conceptos fundamentales en probabilidad, específicamente independencia y probabilidad condicional. Por ejemplo, considere la probabilidad de una descendencia de la generación t{displaystyle textstyle t} ser homozygous dominante. Los alelos son heredados independientemente de cada padre. Un alelo dominante puede ser heredado de un padre dominante homozygous con probabilidad 1, o de un padre heterocigoo con probabilidad 0.5. Para representar este razonamiento en una ecuación, dejemos At{displaystyle textstyle A_{t} representan la herencia de un alelo dominante de un padre. Además, dejemos AAt− − 1{displaystyle textstyle AA_{t-1} y Aat− − 1{displaystyle textstyle Aa_{t-1} representan posibles genotipos parentales en la generación anterior.
- pt=P()At,At)=P()At)2=()P()At▪ ▪ AAt− − 1)P()AAt− − 1)+P()At▪ ▪ Aat− − 1)P()Aat− − 1))2=()()1)pt− − 1+()0.5)2qt− − 1)2=()pt− − 1+qt− − 1)2{fnMicrosoft Sans Serif} {fnMicrosoft Sans Serif} {fnMicrosoft Sans Serif} {fnMicrosoft Sans Serif} {fnMicrosoft Sans Serif} {fnMicrosoft Sans Serif} {fnMicrosoft Sans Serif}
El mismo razonamiento, aplicado a los otros genotipos, produce las dos relaciones de recurrencia restantes. El equilibrio ocurre cuando cada proporción es constante entre las generaciones posteriores. Más formalmente, una población está en equilibrio en generación t{displaystyle textstyle t} cuando
- 0=pt− − pt− − 1{displaystyle textstyle 0=p_{t}-p_{t-1}, 0=qt− − qt− − 1{displaystyle textstyle 0=q_{t}-q_{t-1}, y 0=rt− − rt− − 1{displaystyle textstyle 0=r_{t}-r_{t-1}
Resolviendo estas ecuaciones se pueden determinar las condiciones necesarias y suficientes para que se produzca el equilibrio. Nuevamente, considere la frecuencia de animales homocigóticos dominantes. El equilibrio implica
- 0=pt− − pt− − 1=pt− − 12+2pt− − 1qt− − 1+qt− − 12− − pt− − 1{displaystyle {begin{aligned}0 ventaja=p_{t}-p_{t-1}\=p_{t-1}{2}+2p_{t-1}q_{t-1}+q_{t-1}{2}-p_{t-1} {t-1}end{aligned}}}}}}}} {}}}}} {}}}}}}}}}}}}}}}}} {}}} {}}}}}}}}}}}} {} {}}} {}}}}} {}}}}}}}}}}}} {}}}}}}}}}}}}}}}}}} {}}}}}}}}}}}}}}}}}}}} {}}}}}}}}}}}}}}}}}}}}}}} {}}}}}}}}}}}}}}}}}}}}}}}} {
Primera consideración del caso, donde pt− − 1=0{displaystyle textstyle p_{t-1}=0}, y notar que implica que qt− − 1=0{displaystyle textstyle q_{t-1}=0} y rt− − 1=1{displaystyle textstyle R_{t-1}=1}. Ahora considere el caso restante, donde pt− − 1ل ل 0{displaystyle textstyle p_{t-1}neq textstyle 0}:
- 0=pt− − 1()pt− − 1+2qt− − 1+qt− − 12/pt− − 1− − 1)=qt− − 12/pt− − 1− − rt− − 1{displaystyle {begin{aligned}0 limit=p_{t-1}(p_{t-1}+2q_{t-1}+q_{t-1}{2}/p_{t-1}-1)\\=q_{2}/p_{t-1}-r_{t-1}end{aligned}}}}}}}}} {
donde la igualdad final sostiene porque las proporciones alelo deben sumarse a una. En ambos casos, qt− − 12=pt− − 1rt− − 1{displaystyle textstyle q_{t-1} {2}=p_{t-1}r_{t-1}. Se puede demostrar que las otras dos condiciones de equilibrio implican la misma ecuación. Juntos, las soluciones de las tres ecuaciones de equilibrio implican suficiencia de la condición de Hardy para el equilibrio. Puesto que la condición siempre tiene para la segunda generación, todas las generaciones venideras tienen las mismas proporciones.
Ejemplo numérico
Estimación de la distribución de genotipos
Un cálculo de ejemplo de la distribución del genotipo dado por las ecuaciones originales de Hardy es instructivo. La distribución de fenotipos de la Tabla 3 anterior se usará para calcular la distribución de genotipos inicial de Hardy. Tenga en cuenta que los valores p y q utilizados por Hardy no son los mismos que los utilizados anteriormente.
- suma=obs()AA)+2× × obs()Aa)+obs()aa)=1469+2× × 138+5=1750{displaystyle {begin{aligned}{text{sum} {obs} ({text{AA}})+2times mathrm {obs} ({text{Aa}})+mathrm {obs} ({text{a}})}={1469+2times 138+5}[5pt] quedarse=1750end{aligned}}}}}}}}} {obs} {
- p=14691750=0.839432q=2× × 1381750=0.15771r=51750=0,00286{displaystyle {begin{aligned}p tendría={1469 over 1750}=0.83943[5pt]2q correspond={2times 138 over 1750}=0.15771\[5pt]r correspond={5over 1750}=0.00286end{aligned}}}}}}}}
Como comprobaciones de la distribución, calcule
- p+2q+r=0.83943+0.15771+0,00286=1.000{displaystyle p+2q+r=0.83943+0.15771+0.00286=1.00000,}
y
- E0=q2− − pr=0,00382.{displaystyle E_{0}=q^{2}-pr=0.00382.,}
Para la próxima generación, las ecuaciones de Hardy dan
- q=0.157712=0,07886p1=()p+q)2=0.843252q1=2()p+q)()q+r)=0.15007r1=()q+r)2=0.00668.{displaystyle {begin{aligned}q={0.15771 over 2}=0.07886\\\\p_{1} limit=(p+q)^{2}=0.84325[5pt]2q_{1}=2(p+q)=0.15007\[5end]r_{1}=68=0}=0}{6}=0}{0}=0}=0}=0}{6}=0}=0}=0}=0}=0}=0}=0}{0}=0}=0}=0}=0}=0}=0}=0}{0}=0}=0}=0}=0}=0}=0}{0}=0}=0}=0}=0}=0}=0}=0}=0}=0}=0}{0}=0}=0}=0}=0}=0}=0}=0}=0}=0}=0}=0}
De nuevo como controles de la distribución, calcule
- p1+2q1+r1=0.84325+0.15007+0,00668=1.000{displaystyle p_{1}+2q_{1}+r_{1}=0.84325+0.15007+0.00668=1.00000,}
y
- E1=q12− − p1r1=0,00000{displaystyle E_{1}=q_{1} {2}-p_{1}=0.00000,}
cuáles son los valores esperados. El lector puede demostrar que el uso posterior de los valores de segunda generación para una tercera generación arrojará resultados idénticos.
Estimación de frecuencia portadora
El principio de Hardy-Weinberg también se puede utilizar para estimar la frecuencia de portadores de una afección autosómica recesiva en una población en función de la frecuencia de padecimientos.
Asumamos una estimación 12500{displaystyle textstyle {frac {1}{2500}} Los bebés nacen con fibrosis quística, se trata de la frecuencia de las personas homocigodas observadas en las poblaciones del norte de Europa. Podemos utilizar las ecuaciones Hardy-Weinberg para estimar la frecuencia del portador, la frecuencia de individuos heterocigoos, 2pq{displaystyle textstyle 2pq}.
- q2=12500q=150p=1− − q{displaystyle {begin{aligned} {1}{2500}[5pt]
As 150{displaystyle textstyle {frac {}{50}} es pequeño que podemos tomar p, 1− − 150{displaystyle textstyle 1-{frac {1}{50}}, para ser 1.
- 2pq=2⋅ ⋅ 1502pq=125{displaystyle {begin{aligned}2pq=2cdot {frac {1}{50}[5pt]2pq={frac {1}end{aligned}}} {f}} {f}}} {f}}}} {f}}}}}}}}f} {f}}}}}} {f}}}}}}}}}}}}}}}}}}}}}}}}}}}}} {
Por lo tanto, estimamos la tasa de transporte 125{displaystyle textstyle {frac {1}{25}}, que se trata de la frecuencia observada en las poblaciones del norte de Europa.
Esto se puede simplificar a que la frecuencia de la portadora sea aproximadamente el doble de la raíz cuadrada de la frecuencia de nacimiento.
Representación gráfica
Es posible representar gráficamente la distribución de frecuencias genotípicas para un locus bialélico dentro de una población utilizando un diagrama de De Finetti. Esto utiliza una gráfica triangular (también conocida como gráfica trilineal, triaxial o ternaria) para representar la distribución de las frecuencias de los tres genotipos entre sí. Se diferencia de muchas otras parcelas similares en que se ha invertido la dirección de uno de los ejes. La línea curva del diagrama es la parábola de Hardy-Weinberg y representa el estado en el que los alelos están en equilibrio de Hardy-Weinberg. Es posible representar los efectos de la selección natural y su efecto sobre la frecuencia alélica en dichos gráficos. El diagrama de De Finetti fue desarrollado y utilizado extensamente por A. W. F. Edwards en su libro Foundations of Mathematical Genetics.