Ilustración del teorema del límite central
En la teoría de la probabilidad, el teorema del límite central (CLT) establece que, en muchas situaciones, cuando se suman variables aleatorias independientes, su suma adecuadamente normalizada tiende hacia una distribución normal. Este artículo ofrece dos ilustraciones de este teorema. Ambos involucran la suma de variables aleatorias independientes y distribuidas de manera idéntica y muestran cómo la distribución de probabilidad de la suma se acerca a la distribución normal a medida que aumenta el número de términos en la suma.
La primera ilustración involucra una distribución de probabilidad continua, para la cual las variables aleatorias tienen una función de densidad de probabilidad. El segundo ejemplo, para el cual la mayor parte del cálculo se puede hacer a mano, implica una distribución de probabilidad discreta, que se caracteriza por una función de masa de probabilidad.
Ilustración del caso continuo
La densidad de la suma de dos variables aleatorias independientes de valor real es igual a la convolución de las funciones de densidad de las variables originales.
Así, la densidad de la suma de m+n términos de una secuencia de variables independientes distribuidas idénticamente es igual a la convolución de las densidades de las sumas de m términos y de n término. En particular, la densidad de la suma de n+1 términos es igual a la convolución de la densidad de la suma de n términos con la densidad original (la "suma& #34; de 1 término).
En la primera figura a continuación se muestra una función de densidad de probabilidad. Luego, en las siguientes figuras se muestran las densidades de las sumas de dos, tres y cuatro variables independientes distribuidas idénticamente, cada una con la densidad original. Si la densidad original es un polinomio por partes, como lo es en el ejemplo, entonces también lo son las densidades sumatorias, de grado cada vez mayor. Aunque la densidad original está lejos de ser normal, la densidad de la suma de unas pocas variables con esa densidad es mucho más suave y tiene algunas de las características cualitativas de la densidad normal.
Las convoluciones se calcularon mediante la transformada discreta de Fourier. Una lista de valores y = f(x0 + k Δx), donde f es la función de densidad original, y Δx es aproximadamente igual a 0,002, y k es igual a 0 a 1000. Se calculó la transformada discreta de Fourier Y de y. Entonces la convolución de f consigo mismo es proporcional a la transformada discreta inversa de Fourier del producto puntual de Y consigo mismo.

Función de densidad de probabilidad original
Comenzamos con una función de densidad de probabilidad. Esta función, aunque discontinua, está lejos de ser el ejemplo más patológico que podría crearse. Es un polinomio por partes, con partes de grados 0 y 1. La media de esta distribución es 0 y su desviación estándar es 1.

Función de densidad de probabilidad de la suma de dos términos
A continuación calculamos la densidad de la suma de dos variables independientes, cada una de las cuales tiene la densidad anterior. La densidad de la suma es la convolución de la densidad anterior consigo misma.
La suma de dos variables significa 0. La densidad mostrada en la figura de la derecha ha sido reescalada por 2{displaystyle {sqrt {2}}, por lo que su desviación estándar es 1.
Esta densidad ya es más suave que la original. Hay grumos evidentes que corresponden a los intervalos en los que se definió la densidad original.

Función de densidad de probabilidad de la suma de tres términos
Luego calculamos la densidad de la suma de tres variables independientes, cada una de las cuales tiene la densidad anterior. La densidad de la suma es la convolución de la primera densidad con la segunda.
La suma de tres variables tiene media 0. La densidad que se muestra en la figura de la derecha ha sido reescalada en √3, por lo que su desviación estándar es 1.
Esta densidad es incluso más suave que la anterior. En esta figura apenas se pueden detectar los bultos.

Función de densidad de probabilidad de la suma de cuatro términos
Finalmente, calculamos la densidad de la suma de cuatro variables independientes, cada una de las cuales tiene la densidad anterior. La densidad de la suma es la convolución de la primera densidad con la tercera (o la segunda densidad consigo misma).
La suma de cuatro variables tiene media 0. La densidad que se muestra en la figura de la derecha ha sido reescalada en √4, por lo que su desviación estándar es 1.
Esta densidad parece cualitativamente muy similar a una densidad normal. A simple vista no se pueden distinguir bultos.
Ilustración del caso discreto
Esta sección ilustra el teorema del límite central a través de un ejemplo en el que el cálculo se puede realizar rápidamente a mano en papel, a diferencia del ejemplo de la sección anterior, que requiere más computación.

Función de masa de probabilidad original
Supongamos que la distribución de probabilidad de una variable aleatoria discreta X asigna pesos iguales a 1, 2 y 3:
- X={}1conprobabilidad1/3,2conprobabilidad1/3,3conprobabilidad1/3.{displaystyle X=left{begin{matrix}1 ventaja {mbox{with} {mbox{probability} 1/3,22mbox{with}mbox{probability} 1/3,33nmbox{with} {mbox{probability} 1/3.
La función de masa de probabilidad de la variable aleatoria X se puede representar mediante el siguiente gráfico de barras:
Claramente esto no se parece en nada a la curva en forma de campana de la distribución normal. Compare lo anterior con las representaciones a continuación.

Función de masa de probabilidad de la suma de dos términos
Ahora considere la suma de dos copias independientes de X:
- {}1+1=21+2=31+3=42+1=32+2=42+3=53+1=43+2=53+3=6}={}2conprobabilidad1/93conprobabilidad2/94conprobabilidad3/95conprobabilidad2/96conprobabilidad1/9}{displaystyle left{begin{matrix}1+1 limit= 31+2 limit= limit= 31+3 limit= limit42+1 limit= 32+2+2+2 limit= limit42+3+3 âTMa {3mc} {c} {ccH0} {c}c}ccc}c}c}ccc}c}ccccc}ccc}mcccccc}cccccccccccc}cccccccccccccccccccc}ccccc}cccccccccc}c}c}} {mbox{probability} 1/9333mbox{with} {mbox{probability} 2/944}mbox{probability} 3/95 lider {mbox{with}mbox{probability} 2/966mbox{with}mbox{probability} 1/9end{matrix}derecha}
La función de masa de probabilidad de esta suma se puede representar así:
Esto todavía no se parece mucho a la curva en forma de campana, pero, al igual que la curva en forma de campana y a diferencia de la función de masa de probabilidad de X, es más alta en el medio que en las dos colas.

Función de masa de probabilidad de la suma de tres términos
Ahora considere la suma de tres copias independientes de esta variable aleatoria:
- {}1+1+1=31+1+2=41+1+3=51+2+1=41+2+2=51+2+3=61+3+1=51+3+2=61+3+3=72+1+1=42+1+2=52+1+3=62+2+1=52+2+2=62+2+3=72+3+1=62+3+2=72+3+3=83+1+1=53+1+2=63+1+3=73+2+1=63+2+2=73+2+3=83+3+1=73+3+2=83+3+3=9}={}3conprobabilidad1/274conprobabilidad3/275conprobabilidad6/276conprobabilidad7/277conprobabilidad6/278conprobabilidad3/279conprobabilidad1/27}22222222222333333333323323322233333333333322233333333333333333333233333333333333333333333333333333333333333333333333333333333333 {mbox{probability} 1/2744mbox{with}mbox{probability} 3/275 lider {mbox{with}mbox{probability} 6/276 }mbox{probability} 7/277 demandante {mbox{with}mbox{probability} 6/278 golpe{mbox{with} {mbox{probability} 3/2799mbox{with}mbox{probability} 1/27end{matrix}derecha}
La función de masa de probabilidad de esta suma se puede representar así:
No sólo es más grande en el centro que en las colas, sino que a medida que uno se mueve hacia el centro desde cualquiera de las colas, la pendiente primero aumenta y luego disminuye, tal como ocurre con la curva en forma de campana.
El grado de parecido con la curva en forma de campana se puede cuantificar de la siguiente manera. Considerar
- Pr(X1 + X2 + X3 ≤ 7) = 1/27 + 3/27 + 6/27 + 7/27 + 6/27 = 23/27 = 0.85185....
¿Qué tan cerca está esto de lo que daría una aproximación normal? Se puede ver fácilmente que el valor esperado de Y = X1 + X2 + X3 es 6 y la desviación estándar de Y es la raíz cuadrada de 2. Dado que Y ≤ 7 (desigualdad débil) si y sólo si Y < 8 (desigualdad estricta), utilizamos una corrección de continuidad y buscamos
- Pr()Y≤ ≤ 7.5)=P()Y− − 62≤ ≤ 7.5− − 62)=Pr()Z≤ ≤ 1.0606602...... )=0.85558...... {mbox {mbox{Pr} {leq 7.5)={mbox{P}left({Y-6 over {sqrt {2}}}}leq {7.5-6 over {sqrt {2}right)={mbox{Pr}}}}} {leq 1.0606602dots}=085}}}} {mbox{f}}}}}}}}}}} {mbox{mbox{mbox{mbox{mbox{mbox{p}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}} {mboxmbox=mbox {mbox {p}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}
donde Z tiene una distribución normal estándar. La diferencia entre 0,85185... y 0,85558... parece notablemente pequeña si se considera que el número de variables aleatorias independientes que se agregaron fue solo tres.
Función de masa de probabilidad de la suma de 1.000 términos

La siguiente imagen muestra el resultado de una simulación basada en el ejemplo presentado en esta página. La extracción de la distribución uniforme se repite 1000 veces y se suman los resultados.
Dado que la simulación se basa en el método Monte Carlo, el proceso se repite 10.000 veces. Los resultados muestran que la distribución de la suma de 1.000 extracciones uniformes se parece mucho a la curva en forma de campana.
Contenido relacionado
Conjunto vacío
Historia de la lógica
Ley de los grandes números