Principio de Hardy-Weinberg

format_list_bulleted Contenido keyboard_arrow_down

ImprimirCitar

Principio en genética

Proporciones de Hardy-Weinberg para dos alelos: el eje horizontal muestra las dos frecuencias de alelo p y q y el eje vertical muestra las frecuencias del genotipo esperado. Cada línea muestra uno de los tres posibles genotipos.

En genética de poblaciones, el principio de Hardy-Weinberg, también conocido como equilibrio de Hardy-Weinberg, modelo, teorema, o ley, establece que las frecuencias de alelos y genotipos en una población permanecerán constantes de generación en generación en ausencia de otras influencias evolutivas. Estas influencias incluyen deriva genética, elección de pareja, apareamiento selectivo, selección natural, selección sexual, mutación, flujo de genes, impulso meiótico, autostop genético, cuello de botella poblacional, efecto fundador, depresión por consanguinidad y exogamia.

En el caso más simple de un solo locus con dos alelos denominados A y a con frecuencias $f (A) = p$ y $f (a) = q$ , respectivamente, las frecuencias genotípicas esperadas bajo apareamiento aleatorio son $f (AA) = p 2$ para los homocigotos AA, $f (aa) = q 2$ para los homocigotos aa, y $f (Aa) = 2 pq$ para los heterocigotos. En ausencia de selección, mutación, deriva genética u otras fuerzas, las frecuencias alélicas p y q son constantes entre generaciones, por lo que se alcanza el equilibrio.

El principio lleva el nombre de G. H. Hardy y Wilhelm Weinberg, quienes lo demostraron matemáticamente por primera vez. El artículo de Hardy se centró en desacreditar la opinión de que un alelo dominante tendería automáticamente a aumentar en frecuencia (una opinión posiblemente basada en una pregunta mal interpretada en una conferencia). Hoy en día, las pruebas de frecuencias de genotipos de Hardy-Weinberg se utilizan principalmente para evaluar la estratificación de la población y otras formas de apareamiento no aleatorio.

Derivación

Considérese una población de diploides monoicos, donde cada organismo produce gametos masculinos y femeninos con la misma frecuencia y tiene dos alelos en cada locus genético. Suponemos que la población es tan grande que puede tratarse como infinita. Los organismos se reproducen por unión aleatoria de gametos (el modelo de población de 'reserva genética'). Un locus en esta población tiene dos alelos, A y a, que ocurren con frecuencias iniciales $f 0 (A) = p$ y $f 0 (a) = q$ , respectivamente. Las frecuencias alélicas en cada generación se obtienen agrupando los alelos de cada genotipo de la misma generación según la contribución esperada de los genotipos homocigoto y heterocigoto, que son 1 y 1/2, respectivamente:

{displaystyle f_{t}({text{A}})=f_{t}({text{AA}})+{tfrac {1}{2}}f_{t}({text{Aa}})}

()1)

{displaystyle f_{t}({text{a}})=f_{t}({text{aa}})+{tfrac {1}{2}}f_{t}({text{Aa}})}

()2)

Duración

p, q

corresponde a frecuencias de alelo (aquí

p = 0.6, q = 0,4

). Luego el área del rectángulo representa frecuencias de genotipo (tus

AA: Aa: aa = 0,36: 0,48: 0,16

Las diferentes formas de formar genotipos para la próxima generación se pueden mostrar en un cuadro de Punnett, donde la proporción de cada genotipo es igual al producto de las frecuencias alélicas de fila y columna de la generación actual.

Cuadro 1: Plaza de Punnett para Hardy-Weinberg
		Mujeres
		Ap)	aq)
Hombres	Ap)	AAp²)	Aapq)
Hombres	aq)	Aaqp)	aaq²)

La suma de las entradas es $p 2 + 2 pq + q 2 = 1$ , ya que las frecuencias de los genotipos deben sumar uno.

Observe nuevamente que como $p + q = 1$ , la expansión binomial de $(p + q) 2 = p 2 + 2 pq + q 2 = 1$ da las mismas relaciones.

Al sumar los elementos del cuadro de Punnett o la expansión binomial, obtenemos las proporciones de genotipo esperadas entre los descendientes después de una sola generación:

f_{1}({text{AA}})=p^{2}=f_{0}({text{A}})^{2}

()3)

f_{1}({text{Aa}})=pq+qp=2pq=2f_{0}({text{A}})f_{0}({text{a}})

()4)

f_{1}({text{aa}})=q^{2}=f_{0}({text{a}})^{2}

()5)

Estas frecuencias definen el equilibrio de Hardy-Weinberg. Debe mencionarse que las frecuencias de genotipo después de la primera generación no necesitan ser iguales a las frecuencias de genotipo de la generación inicial, p. $f 1 (AA) \neq f 0 (AA)$ . Sin embargo, las frecuencias de genotipo para todos los tiempos futuros serán iguales a las frecuencias de Hardy-Weinberg, p. $f t (AA) = f 1 (AA)$ para $t > 1$ . Esto se debe a que las frecuencias genotípicas de la siguiente generación dependen únicamente de las frecuencias alélicas de la generación actual que, calculadas mediante las ecuaciones (1) y (2), se conservan de la generación inicial:

{displaystyle {begin{aligned}f_{1}({text{A}})&=f_{1}({text{AA}})+{tfrac {1}{2}}f_{1}({text{Aa}})=p^{2}+pq=p(p+q)=p=f_{0}({text{A}})\f_{1}({text{a}})&=f_{1}({text{aa}})+{tfrac {1}{2}}f_{1}({text{Aa}})=q^{2}+pq=q(p+q)=q=f_{0}({text{a}})end{aligned}}}

Para el caso más general de los diploides dioicos [los organismos son machos o hembras] que se reproducen por apareamiento aleatorio de individuos, es necesario calcular las frecuencias genotípicas de los nueve apareamientos posibles entre cada genotipo parental (AA, Aa y aa) en ambos sexos, ponderados por las contribuciones esperadas del genotipo de cada apareamiento. De manera equivalente, uno considera las seis combinaciones diploides-diploides únicas:

{displaystyle left[({text{AA}},{text{AA}}),({text{AA}},{text{Aa}}),({text{AA}},{text{aa}}),({text{Aa}},{text{Aa}}),({text{Aa}},{text{aa}}),({text{aa}},{text{aa}})right]}

y construye un cuadro de Punnett para cada uno, a fin de calcular su contribución a los genotipos de la próxima generación. Estas contribuciones se ponderan según la probabilidad de cada combinación diploide-diploide, que sigue una distribución multinomial con $k = 3$ . Por ejemplo, la probabilidad de la combinación de apareamiento $(AA,aa)$ es $2 f t (AA) f t (aa)$ y solo puede resultar en $Aa$ genotipo: $[0,1,0]$ . En general, las frecuencias de genotipo resultantes se calculan como:

{displaystyle {begin{aligned}&left[f_{t+1}({text{AA}}),f_{t+1}({text{Aa}}),f_{t+1}({text{aa}})right]=\&qquad =f_{t}({text{AA}})f_{t}({text{AA}})left[1,0,0right]+2f_{t}({text{AA}})f_{t}({text{Aa}})left[{tfrac {1}{2}},{tfrac {1}{2}},0right]+2f_{t}({text{AA}})f_{t}({text{aa}})left[0,1,0right]\&qquad qquad +f_{t}({text{Aa}})f_{t}({text{Aa}})left[{tfrac {1}{4}},{tfrac {1}{2}},{tfrac {1}{4}}right]+2f_{t}({text{Aa}})f_{t}({text{aa}})left[0,{tfrac {1}{2}},{tfrac {1}{2}}right]+f_{t}({text{aa}})f_{t}({text{aa}})left[0,0,1right]\&qquad =left[left(f_{t}({text{AA}})+{tfrac {1}{2}}f_{t}({text{Aa}})right)^{2},2left(f_{t}({text{AA}})+{tfrac {1}{2}}f_{t}({text{Aa}})right)left(f_{t}({text{aa}})+{tfrac {1}{2}}f_{t}({text{Aa}})right),left(f_{t}({text{aa}})+{tfrac {1}{2}}f_{t}({text{Aa}})right)^{2}right]\&qquad =left[f_{t}({text{A}})^{2},2f_{t}({text{A}})f_{t}({text{a}}),f_{t}({text{a}})^{2}right]end{aligned}}}

Como antes, se puede demostrar que las frecuencias alélicas en el momento $t + 1$ son iguales a las del momento $t$ , y así, son constantes en el tiempo. De manera similar, las frecuencias de los genotipos dependen solo de las frecuencias de los alelos, por lo que, después del tiempo, $t = 1$ también son constantes en el tiempo.

Si en organismos monoicos o dioicos, las proporciones de alelos o genotipos son inicialmente desiguales en ambos sexos, se puede demostrar que se obtienen proporciones constantes después de una generación de apareamiento aleatorio. Si los organismos dioicos son heterogaméticos y el locus del gen está ubicado en el cromosoma X, se puede demostrar que si las frecuencias alélicas son inicialmente desiguales en los dos sexos [p. ej., mujeres XX y hombres XY, como en humanos], $f'(a)$ en el sexo heterogamético 'chases' $f (a)$ en el sexo homogamético de la generación anterior, hasta alcanzar un equilibrio en la media ponderada de las dos frecuencias iniciales.

Desviaciones del equilibrio de Hardy-Weinberg

Los siete supuestos que subyacen al equilibrio de Hardy-Weinberg son los siguientes:

organismos son diploides
sólo la reproducción sexual ocurre
generaciones no superpuestas
apareamiento es aleatorio
tamaño de la población es infinitamente grande
frecuencias de alelo son iguales en los sexos
no hay migración, flujo de genes, admixtura, mutación o selección

Las violaciones de los supuestos de Hardy-Weinberg pueden provocar desviaciones de las expectativas. Cómo afecta esto a la población depende de los supuestos que se violan.

Aleatorio. El HWP afirma que la población tendrá las frecuencias genotípicas dadas (llamadas proporciones Hardy-Weinberg) después de una sola generación de apareamiento aleatorio dentro de la población. Cuando se viola la suposición aleatoria de apareamiento, la población no tendrá proporciones Hardy-Weinberg. Una causa común de apareamiento no aleatorio es la incineración, que causa un aumento de la homocigosidad para todos los genes.

Si una población viola uno de los siguientes cuatro supuestos, la población puede continuar teniendo proporciones de Hardy-Weinberg en cada generación, pero las frecuencias alélicas cambiarán con el tiempo.

La selección, en general, hace que las frecuencias de alelo cambien, a menudo bastante rápido. Mientras que la selección direccional eventualmente conduce a la pérdida de todos los alelos excepto el favorecido (a menos que un alelo sea dominante, en cuyo caso los alelos recesivos pueden sobrevivir en bajas frecuencias), algunas formas de selección, como el equilibrio de la selección, conducen al equilibrio sin pérdida de alelos.
La mutación tendrá un efecto muy sutil en las frecuencias de alelo a través de la introducción de nuevo alelo en una población. Las tasas de mutación son del orden 10⁻⁴ a 10⁻⁸, y el cambio en la frecuencia del alelo será, al menos, el mismo orden. La mutación recurrente mantendrá alelos en la población, incluso si hay una fuerte selección contra ellos.
La migración vincula genéticamente a dos o más poblaciones juntas. En general, las frecuencias de alelo se volverán más homogéneas entre las poblaciones. Algunos modelos para la migración incluyen inherentemente el apareamiento no aleatorio (efecto Wahlund, por ejemplo). Para esos modelos, las proporciones Hardy-Weinberg normalmente no serán válidas.
El tamaño pequeño de la población puede causar un cambio aleatorio en frecuencias de alelo. Esto se debe a un efecto de muestreo, y se llama deriva genética. Los efectos de muestreo son más importantes cuando el alelo está presente en un pequeño número de copias.

En los datos de genotipos del mundo real, las desviaciones del equilibrio de Hardy-Weinberg pueden ser un signo de error de genotipado.

Vinculación sexual

Donde el gen A está ligado al sexo, el sexo heterogamético (p. ej., machos mamíferos, hembras aviares) tiene solo una copia del gen (y se denominan hemicigóticos), mientras que el sexo homogamético (p. ej., hembras humanas) tienen dos copias. Las frecuencias genotípicas en equilibrio son p y q para el sexo heterogamético pero p², 2pq y q² para el sexo homogamético.

Por ejemplo, en los humanos, el daltonismo rojo-verde es un rasgo recesivo ligado al cromosoma X. En los hombres de Europa occidental, el rasgo afecta aproximadamente a 1 de cada 12 (q = 0,083), mientras que afecta a aproximadamente 1 de cada 200 mujeres (0,005, en comparación con q² = 0.007), muy cerca de las proporciones de Hardy-Weinberg.

Si una población se junta con machos y hembras con una frecuencia alélica diferente en cada subpoblación (machos o hembras), la frecuencia alélica de la población masculina en la próxima generación seguirá la de la población femenina porque cada hijo recibe su cromosoma X de su madre. La población converge al equilibrio muy rápidamente.

Generalizaciones

La derivación simple anterior se puede generalizar para más de dos alelos y poliploidía.

Generalización para más de dos alelos

Punnett cuadrado para caso de tres alelo (izquierda) y caso de cuatro alelo (derecha). Las zonas blancas son homocigotas. Las áreas de color son heterocigotas.

Considere una frecuencia alélica adicional, r. El caso de dos alelos es la expansión binomial de (p + q)² y, por lo tanto, el caso de tres alelos es la expansión trinominal de (p + q + r)².

(p+q+r)^{2}=p^{2}+q^{2}+r^{2}+2pq+2pr+2qr,

Más generalmente, considere los alelos A₁,..., A_n dados por las frecuencias alélicas p₁ a p_n;

(p_{1}+cdots +p_{n})^{2},

dando para todos los homocigotos:

f(A_{i}A_{i})=p_{i}^{2},

y para todos los heterocigotos:

f(A_{i}A_{j})=2p_{i}p_{j},

Generalización para poliploidía

El principio de Hardy-Weinberg también puede generalizarse a sistemas poliploides, es decir, para organismos que tienen más de dos copias de cada cromosoma. Considere nuevamente solo dos alelos. El caso diploide es la expansión binomial de:

(p+q)^{2},

y por lo tanto el caso poliploide es la expansión binomial de:

(p+q)^{c},

donde c es la ploidía, por ejemplo con tetraploide (c = 4):

Cuadro 2: Frecuencias de genotipo esperadas para tetraploidy
Genotipo	Frecuencia
AAAA	$p^{4}$
AAAa	$4p^{3}q$
AAaa	$6p^{2}q^{2}$
Aaaa	$4pq^{3}$
aaaaa	$q^{4}$

Si el organismo es un 'verdadero' tetraploide o anfidiploide determinará cuánto tiempo le tomará a la población alcanzar el equilibrio de Hardy-Weinberg.

Generalización completa

Para $n$ alelos distintos en $c$ -ploides, las frecuencias genotipos en el equilibrio Hardy-Weinberg se dan por términos individuales en la expansión multinomio $(p_{1}+cdots +p_{n})^{c}$ :

(p_{1}+cdots +p_{n})^{c}=sum _{{k_{1},ldotsk_{n} in {mathbb {N}}:k_{1}+cdots +k_{n}=c}}{c choose k_{1},ldotsk_{n}}p_{1}^{{k_{1}}}cdots p_{n}^{{k_{n}}}

Pruebas de significancia para desviación

La desviación de la prueba del HWP generalmente se realiza mediante la prueba de chi-cuadrado de Pearson, utilizando las frecuencias de genotipo observadas obtenidas de los datos y las frecuencias de genotipo esperadas obtenidas mediante el HWP. Para los sistemas donde hay una gran cantidad de alelos, esto puede dar como resultado datos con muchos genotipos posibles vacíos y recuentos bajos de genotipos, porque a menudo no hay suficientes individuos presentes en la muestra para representar adecuadamente todas las clases de genotipos. Si este es el caso, entonces la asunción asintótica de la distribución de chi-cuadrado ya no se mantendrá, y puede ser necesario usar una forma de prueba exacta de Fisher, que requiere una computadora para resolver. Más recientemente, se han propuesto varios métodos MCMC para probar las desviaciones de HWP (Guo & Thompson, 1992; Wigginton et al. 2005)

Ejemplo de prueba de chi-cuadrado para desviación

Estos datos son de E. B. Ford (1971) sobre la polilla tigre escarlata, para la cual se registraron los fenotipos de una muestra de la población. Se supone que la distinción genotipo-fenotipo es insignificantemente pequeña. La hipótesis nula es que la población está en proporciones de Hardy-Weinberg y la hipótesis alternativa es que la población no está en proporciones de Hardy-Weinberg.

Cuadro 3: Ejemplo de Hardy – Cálculo de principio de Weinberg
Fenotipo	Blanco manchado (AA)	Intermedio (Aa)	Un poco de mancha (aa)	Total
Número	1469	138	5	1612

A partir de esto, se pueden calcular las frecuencias alélicas:

{displaystyle {begin{aligned}p&={2times mathrm {obs} ({text{AA}})+mathrm {obs} ({text{Aa}}) over 2times (mathrm {obs} ({text{AA}})+mathrm {obs} ({text{Aa}})+mathrm {obs} ({text{aa}}))}\\&={2times 1469+138 over 2times (1469+138+5)}\\&={3076 over 3224}\\&=0.954end{aligned}}}

{begin{aligned}q&=1-p\&=1-0.954\&=0.046end{aligned}}

Entonces, la expectativa de Hardy-Weinberg es:

{begin{aligned}{mathrm {Exp}}({text{AA}})&=p^{2}n=0.954^{2}times 1612=1467.4\{mathrm {Exp}}({text{Aa}})&=2pqn=2times 0.954times 0.046times 1612=141.2\{mathrm {Exp}}({text{aa}})&=q^{2}n=0.046^{2}times 1612=3.4end{aligned}}

La prueba de chi-cuadrado de Pearson establece:

{begin{aligned}chi ^{2}&=sum {(O-E)^{2} over E}\&={(1469-1467.4)^{2} over 1467.4}+{(138-141.2)^{2} over 141.2}+{(5-3.4)^{2} over 3.4}\&=0.001+0.073+0.756\&=0.83end{aligned}}

Hay 1 grado de libertad (los grados de libertad para la prueba de proporciones de Hardy-Weinberg son # genotipos − # alelos). El nivel de significación del 5 % para 1 grado de libertad es 3,84, y dado que el valor de χ² es menor que este, la hipótesis nula de que la población está en las frecuencias de Hardy-Weinberg no rechazado.

Prueba exacta de Fisher (prueba de probabilidad)

La prueba exacta de Fisher se puede aplicar a las pruebas de proporciones de Hardy-Weinberg. Dado que la prueba está condicionada a las frecuencias de los alelos, p y q, el problema puede verse como una prueba del número adecuado de heterocigotos. De esta forma, se rechaza la hipótesis de las proporciones de Hardy-Weinberg si el número de heterocigotos es demasiado grande o demasiado pequeño. Las probabilidades condicionales para el heterocigoto, dadas las frecuencias alélicas, se dan en Emigh (1980) como

{displaystyle operatorname {prob} [n_{12}mid n_{1}]={frac {binom {n}{n_{11},n_{12},n_{22}}}{binom {2n}{n_{1},n_{2}}}}2^{n_{12}},}

Donde n₁₁, n₁₂, n₂₂ son los números observados de los tres genotipos, AA, Aa y aa, respectivamente, y n₁ es el número de Alelos, donde $n_{1}=2n_{{11}}+n_{{12}}$ .

Un ejemploUsando uno de los ejemplos de Emigh (1980), podemos considerar el caso donde n= 100, y p= 0.34. Los posibles heterocigotos observados y su nivel de significación exacto se da en el cuadro 4.

Tabla 4: Ejemplo de la prueba exacta de Fisher para n= 100, p= 0,34.
Número de heterocigotas	Nivel de significación
0	0,000
2	0,000
4	0,000
6	0,000
8	0,000
10	0,000
12	0,000
14	0,000
16	0,000
18	0,001
20	0,007
22	0,034
34	0,067
24	0.151
32	0.291
26	0.474
30	0,730
28	1.000

Usando esta tabla, se debe buscar el nivel de significación de la prueba en función del número observado de heterocigotos. Por ejemplo, si se observaron 20 heterocigotos, el nivel de significación para la prueba es 0,007. Como es habitual en la prueba exacta de Fisher para muestras pequeñas, la gradación de los niveles de significación es bastante tosca.

Sin embargo, se debe crear una tabla como esta para cada experimento, ya que las tablas dependen tanto de n como de p.

Pruebas de equivalencia

Las pruebas de equivalencia se desarrollan para establecer un acuerdo suficientemente bueno de las frecuencias de genotipo observadas y el equilibrio Hardy Weinberg. Vamos ${displaystyle {mathcal {M}}}$ denota la familia de las distribuciones genotipos bajo el supuesto de equilibrio Hardy Weinberg. La distancia entre una distribución genotipo $p$ y Hardy Weinberg equilibrio se define por ${displaystyle d(p,{mathcal {M}})=min _{qin {mathcal {M}}}d(p,q)}$ , donde $d$ es cierta distancia. El problema de la prueba de equivalencia se da por ${displaystyle H_{0}={d(p,{mathcal {M}})geq varepsilon }}$ y $<math alttext="{displaystyle H_{1}={d(p,{mathcal {M}})H1={}d()p,M).ε ε }{displaystyle ¿Qué? {}}<img alt="{displaystyle H_{1}={d(p,{mathcal {M}})$ , donde $0}" xmlns="http://www.w3.org/1998/Math/MathML">ε ε ■0{displaystyle varepsilon }0 " aria-hidden="true" class="mwe-math-fallback-image-inline" src="https://wikimedia.org/api/rest_v1/media/math/render/svg/e04ec3670b50384a3ce48aca42e7cc5131a06b12" style="vertical-align: -0.338ex; width:5.344ex; height:2.176ex;"/>$ es un parámetro de tolerancia. Si la hipótesis ${displaystyle H_{0}}$ puede ser rechazado entonces la población está cerca del equilibrio Hardy Weinberg con una alta probabilidad. Las pruebas de equivalencia para el caso biallelico se desarrollan entre otros en Wellek (2004). Las pruebas de equivalencia para el caso de los alelos múltiples se proponen en Ostrovski (2020).

Coeficiente de consanguinidad

El coeficiente de energia, $F$ (ver también F-estadística), es un menos la frecuencia observada de heterocigotes sobre la que se espera del equilibrio Hardy-Weinberg.

F={frac {operatorname {E}{(f({text{Aa}}))}-operatorname {O}(f({text{Aa}}))}{operatorname {E}(f({text{Aa}}))}}=1-{frac {operatorname {O}(f({text{Aa}}))}{operatorname {E}(f({text{Aa}}))}},

donde el valor esperado del equilibrio de Hardy-Weinberg viene dado por

operatorname {E}(f({text{Aa}}))=2pq

Por ejemplo, para los datos de Ford anteriores:

F=1-{138 over 141.2}=0.023.

Para dos alelos, la bondad de la prueba de ajuste de las proporciones de Hardy-Weinberg es equivalente a la prueba de la inbreeding, $F=0$ .

El coeficiente de endogamiento es inestable ya que el valor esperado se aproxima a cero, y por lo tanto no es útil para alelos raros y muy comunes. Para: ${displaystyle F{big |}_{E=0,O=0}=-infty }$ ; $0}}" xmlns="http://www.w3.org/1998/Math/MathML">FSilencioE=0,O■0{displaystyle F{big Silencio.0}}" aria-hidden="true" class="mwe-math-fallback-image-inline" src="https://wikimedia.org/api/rest_v1/media/math/render/svg/ef7241585a9a7556a525b37ac39f0cc9a006c944" style="vertical-align: -1.505ex; width:9.788ex; height:3.676ex;"/>$ es indefinido.

Historia

La genética mendeliana se redescubrió en 1900. Sin embargo, siguió siendo algo controvertida durante varios años, ya que no se sabía cómo podía causar características continuas. Udny Yule (1902) argumentó en contra del mendelismo porque pensó que los alelos dominantes aumentarían en la población. El estadounidense William E. Castle (1903) demostró que sin selección, las frecuencias genotípicas se mantendrían estables. Karl Pearson (1903) encontró una posición de equilibrio con valores de p = q = 0,5. Reginald Punnett, incapaz de contrarrestar el punto de Yule, le presentó el problema a G. H. Hardy, un matemático británico, con quien jugaba al cricket. Hardy era un matemático puro y despreciaba las matemáticas aplicadas; su visión de los biólogos' el uso de las matemáticas aparece en su artículo de 1908, donde describe esto como "muy simple":

Para el Editor de la Ciencia: Me renuente a inmiscuir en una discusión sobre asuntos de los cuales no tengo conocimiento experto, y debería haber esperado el punto muy simple que me gustaría hacer para haber estado familiarizado con los biólogos. Sin embargo, algunos comentarios del Sr. Udny Yule, a los que el Sr. R. C. Punnett ha llamado mi atención, sugieren que puede todavía valer la pena...

Supongamos que Aa es un par de personajes mendelianos, un ser dominante, y que en cualquier generación dada el número de dominios puros (AA), heterocigotes (Aa), y recesivos puros (aaa) son como p:2q:r. Finalmente, supongamos que los números son bastante grandes, para que el apareamiento pueda ser considerado como aleatorio, que los sexos se distribuyen uniformemente entre las tres variedades, y que todos son igualmente fértiles. Un poco de matemáticas del tipo de multiplicación-tabla es suficiente para demostrar que en la próxima generación los números serán como ()p+q)²:2(p+q)q+r):q+r)², o como p₁:2q₁:r₁, di.

La pregunta interesante es: ¿en qué circunstancias esta distribución será la misma que en la generación anterior? Es fácil ver que la condición para esto es q²=pr. Y desde q₁²=p₁r₁, independientemente de los valores p, q, y r puede ser, la distribución en cualquier caso continuará sin cambios después de la segunda generación

El principio se conoció como ley de Hardy en el mundo de habla inglesa hasta 1943, cuando Curt Stern señaló que había sido formulado de forma independiente por primera vez en 1908 por el médico alemán Wilhelm Weinberg. William Castle en 1903 también derivó las proporciones para el caso especial de frecuencias alélicas iguales, y a veces (pero rara vez) se le llama Ley de Hardy-Weinberg-Castle.

Derivación de las ecuaciones de Hardy

La declaración de Hardy comienza con una relación de recurrencia para las frecuencias p, 2q, y r. Estas relaciones de recurrencia se derivan de conceptos fundamentales en probabilidad, específicamente independencia y probabilidad condicional. Por ejemplo, considere la probabilidad de una descendencia de la generación $textstyle t$ ser homozygous dominante. Los alelos son heredados independientemente de cada padre. Un alelo dominante puede ser heredado de un padre dominante homozygous con probabilidad 1, o de un padre heterocigoo con probabilidad 0.5. Para representar este razonamiento en una ecuación, dejemos ${displaystyle textstyle A_{t}}$ representan la herencia de un alelo dominante de un padre. Además, dejemos ${displaystyle textstyle AA_{t-1}}$ y ${displaystyle textstyle Aa_{t-1}}$ representan posibles genotipos parentales en la generación anterior.

{displaystyle {begin{aligned}p_{t}&=P(A_{t},A_{t})=P(A_{t})^{2}\&=left(P(A_{t}mid AA_{t-1})P(AA_{t-1})+P(A_{t}mid Aa_{t-1})P(Aa_{t-1})right)^{2}\&=left((1)p_{t-1}+(0.5)2q_{t-1}right)^{2}\&=left(p_{t-1}+q_{t-1}right)^{2}end{aligned}}}

El mismo razonamiento, aplicado a los otros genotipos, produce las dos relaciones de recurrencia restantes. El equilibrio ocurre cuando cada proporción es constante entre las generaciones posteriores. Más formalmente, una población está en equilibrio en generación $textstyle t$ cuando

{displaystyle textstyle 0=p_{t}-p_{t-1}}

{displaystyle textstyle 0=q_{t}-q_{t-1}}

, y

{displaystyle textstyle 0=r_{t}-r_{t-1}}

Resolviendo estas ecuaciones se pueden determinar las condiciones necesarias y suficientes para que se produzca el equilibrio. Nuevamente, considere la frecuencia de animales homocigóticos dominantes. El equilibrio implica

{displaystyle {begin{aligned}0&=p_{t}-p_{t-1}\&=p_{t-1}^{2}+2p_{t-1}q_{t-1}+q_{t-1}^{2}-p_{t-1}end{aligned}}}

Primera consideración del caso, donde ${displaystyle textstyle p_{t-1}=0}$ , y notar que implica que ${displaystyle textstyle q_{t-1}=0}$ y ${displaystyle textstyle r_{t-1}=1}$ . Ahora considere el caso restante, donde ${displaystyle textstyle p_{t-1}neq textstyle 0}$ :

{displaystyle {begin{aligned}0&=p_{t-1}(p_{t-1}+2q_{t-1}+q_{t-1}^{2}/p_{t-1}-1)\&=q_{t-1}^{2}/p_{t-1}-r_{t-1}end{aligned}}}

donde la igualdad final sostiene porque las proporciones alelo deben sumarse a una. En ambos casos, ${displaystyle textstyle q_{t-1}^{2}=p_{t-1}r_{t-1}}$ . Se puede demostrar que las otras dos condiciones de equilibrio implican la misma ecuación. Juntos, las soluciones de las tres ecuaciones de equilibrio implican suficiencia de la condición de Hardy para el equilibrio. Puesto que la condición siempre tiene para la segunda generación, todas las generaciones venideras tienen las mismas proporciones.

Ejemplo numérico

Estimación de la distribución de genotipos

Un cálculo de ejemplo de la distribución del genotipo dado por las ecuaciones originales de Hardy es instructivo. La distribución de fenotipos de la Tabla 3 anterior se usará para calcular la distribución de genotipos inicial de Hardy. Tenga en cuenta que los valores p y q utilizados por Hardy no son los mismos que los utilizados anteriormente.

{displaystyle {begin{aligned}{text{sum}}&={mathrm {obs} ({text{AA}})+2times mathrm {obs} ({text{Aa}})+mathrm {obs} ({text{aa}})}={1469+2times 138+5}\[5pt]&=1750end{aligned}}}

{displaystyle {begin{aligned}p&={1469 over 1750}=0.83943\[5pt]2q&={2times 138 over 1750}=0.15771\[5pt]r&={5 over 1750}=0.00286end{aligned}}}

Como comprobaciones de la distribución, calcule

p+2q+r=0.83943+0.15771+0.00286=1.00000,

E_{0}=q^{2}-pr=0.00382.,

Para la próxima generación, las ecuaciones de Hardy dan

{displaystyle {begin{aligned}q&={0.15771 over 2}=0.07886\\p_{1}&=(p+q)^{2}=0.84325\[5pt]2q_{1}&=2(p+q)(q+r)=0.15007\[5pt]r_{1}&=(q+r)^{2}=0.00668.end{aligned}}}

De nuevo como controles de la distribución, calcule

p_{1}+2q_{1}+r_{1}=0.84325+0.15007+0.00668=1.00000,

E_{1}=q_{1}^{2}-p_{1}r_{1}=0.00000,

cuáles son los valores esperados. El lector puede demostrar que el uso posterior de los valores de segunda generación para una tercera generación arrojará resultados idénticos.

Estimación de frecuencia portadora

El principio de Hardy-Weinberg también se puede utilizar para estimar la frecuencia de portadores de una afección autosómica recesiva en una población en función de la frecuencia de padecimientos.

Asumamos una estimación ${displaystyle textstyle {frac {1}{2500}}}$ Los bebés nacen con fibrosis quística, se trata de la frecuencia de las personas homocigodas observadas en las poblaciones del norte de Europa. Podemos utilizar las ecuaciones Hardy-Weinberg para estimar la frecuencia del portador, la frecuencia de individuos heterocigoos, ${displaystyle textstyle 2pq}$ .

{displaystyle {begin{aligned}&q^{2}={frac {1}{2500}}\[5pt]&q={frac {1}{50}}\[5pt]&p=1-qend{aligned}}}

As ${displaystyle textstyle {frac {1}{50}}}$ es pequeño que podemos tomar p, ${displaystyle textstyle 1-{frac {1}{50}}}$ , para ser 1.

{displaystyle {begin{aligned}2pq=2cdot {frac {1}{50}}\[5pt]2pq={frac {1}{25}}end{aligned}}}

Por lo tanto, estimamos la tasa de transporte ${displaystyle textstyle {frac {1}{25}}}$ , que se trata de la frecuencia observada en las poblaciones del norte de Europa.

Esto se puede simplificar a que la frecuencia de la portadora sea aproximadamente el doble de la raíz cuadrada de la frecuencia de nacimiento.

Representación gráfica

Un diagrama de Finetti que representa una distribución de frecuencias de genotipo

Es posible representar gráficamente la distribución de frecuencias genotípicas para un locus bialélico dentro de una población utilizando un diagrama de De Finetti. Esto utiliza una gráfica triangular (también conocida como gráfica trilineal, triaxial o ternaria) para representar la distribución de las frecuencias de los tres genotipos entre sí. Se diferencia de muchas otras parcelas similares en que se ha invertido la dirección de uno de los ejes. La línea curva del diagrama es la parábola de Hardy-Weinberg y representa el estado en el que los alelos están en equilibrio de Hardy-Weinberg. Es posible representar los efectos de la selección natural y su efecto sobre la frecuencia alélica en dichos gráficos. El diagrama de De Finetti fue desarrollado y utilizado extensamente por A. W. F. Edwards en su libro Foundations of Mathematical Genetics.

Más resultados...