Media aritmética ponderada

format_list_bulleted Contenido keyboard_arrow_down

ImprimirCitar

Cantidad estadística

La media aritmética ponderada es similar a una media aritmética ordinaria (el tipo de promedio más común), excepto que en lugar de que cada uno de los puntos de datos contribuya por igual al promedio final, algunos puntos de datos contribuyen más que otros. La noción de media ponderada juega un papel en la estadística descriptiva y también ocurre de forma más general en varias otras áreas de las matemáticas.

Si todos los pesos son iguales, entonces la media ponderada es la misma que la media aritmética. Si bien las medias ponderadas generalmente se comportan de manera similar a las medias aritméticas, tienen algunas propiedades contrarias a la intuición, como se captura, por ejemplo, en la paradoja de Simpson.

Ejemplos

Ejemplo básico

Dadas dos clases escolares — uno con 20 estudiantes, uno con 30 estudiantes — y evaluar las calificaciones en cada clase de la siguiente manera:

Clase de mañana = {62, 67, 71, 74, 76, 77, 78, 79, 79, 80, 81, 81, 82, 83, 84, 86, 89, 93, 98}

Afternoon class = {81, 82, 83, 84, 85, 86, 87, 87, 88, 88, 89, 89, 89, 90, 90, 90, 90, 90, 91, 91, 91, 92, 92, 93, 93, 94, 95, 96, 97, 98, 99}

La media de la clase de la mañana es 80 y la media de la clase de la tarde es 90. La media no ponderada de las dos medias es 85. Sin embargo, esto no tiene en cuenta la diferencia en el número de estudiantes en cada clase (20 frente a 30); por lo tanto, el valor de 85 no refleja la calificación promedio de los estudiantes (independientemente de la clase). La calificación promedio de los estudiantes se puede obtener promediando todas las calificaciones, sin importar las clases (sume todas las calificaciones y divide por el número total de estudiantes):

{displaystyle {bar {x}}={frac {4300}{50}}=86.}

O bien, esto se puede lograr ponderando las medias de la clase por el número de estudiantes en cada clase. A la clase más grande se le da más "peso":

{bar {x}}={frac {(20times 80)+(30times 90)}{20+30}}=86.

Por lo tanto, la media ponderada permite encontrar la calificación promedio promedio de los estudiantes sin conocer la calificación de cada estudiante. Solo se necesitan las medias de la clase y el número de estudiantes en cada clase.

Ejemplo de combinación convexa

Dado que solo los pesos relativos son relevantes, cualquier media ponderada se puede expresar usando coeficientes que suman uno. Tal combinación lineal se llama combinación convexa.

Usando el ejemplo anterior, obtendríamos los siguientes pesos:

{displaystyle {frac {20}{20+30}}=0.4}

{displaystyle {frac {30}{20+30}}=0.6}

Luego, aplique los pesos de esta manera:

{displaystyle {bar {x}}=(0.4times 80)+(0.6times 90)=86.}

Definición matemática

Formalmente, la media ponderada de un tuple finito no vacío de datos ${displaystyle left(x_{1},x_{2},dotsx_{n}right)}$ , con pesos no negativos correspondientes ${displaystyle left(w_{1},w_{2},dotsw_{n}right)}$ es

{displaystyle {bar {x}}={frac {sum limits _{i=1}^{n}w_{i}x_{i}}{sum limits _{i=1}^{n}w_{i}}},}

que se expande a:

{displaystyle {bar {x}}={frac {w_{1}x_{1}+w_{2}x_{2}+cdots +w_{n}x_{n}}{w_{1}+w_{2}+cdots +w_{n}}}.}

Por lo tanto, los elementos de datos con un peso alto contribuyen más a la media ponderada que los elementos con un peso bajo. Los pesos no pueden ser negativos. Algunos pueden ser cero, pero no todos (ya que no se permite la división por cero).

Las fórmulas se simplifican cuando se normalizan los pesos de tal manera que suman hasta 1, es decir, ${textstyle sum limits _{i=1}^{n}{w_{i}'}=1}$ . Para tales pesos normalizados, la media ponderada es equivalente:

{displaystyle {bar {x}}=sum limits _{i=1}^{n}{w_{i}'x_{i}}}

Tenga en cuenta que siempre se pueden normalizar los pesos haciendo la siguiente transformación en los pesos originales:

{displaystyle w_{i}'={frac {w_{i}}{sum limits _{j=1}^{n}{w_{j}}}}}

La media ordinaria ${textstyle {frac {1}{n}}sum limits _{i=1}^{n}{x_{i}}}$ es un caso especial de la media ponderada donde todos los datos tienen pesos iguales.

Si los elementos de datos son variables aleatorias independientes y distribuidas idénticamente con varianza $sigma ^{2}$ , el error estándar de la media ponderada, ${displaystyle sigma _{bar {x}}}$ , se puede mostrar mediante la propagación de la incertidumbre para ser:

{textstyle sigma _{bar {x}}=sigma {sqrt {sum limits _{i=1}^{n}w_{i}'^{2}}}}

Ponderaciones definidas por varianza

Para la media ponderada de una lista de datos para los cuales cada elemento $x_{i}$ potencialmente proviene de una distribución de probabilidad diferente con varianza conocida $sigma_i^2$ , todos teniendo la misma media, una posible opción para los pesos es dada por la reciproca de la varianza:

{displaystyle w_{i}={frac {1}{sigma _{i}^{2}}}.}

La media ponderada en este caso es:

{displaystyle {bar {x}}={frac {sum _{i=1}^{n}left({dfrac {x_{i}}{sigma _{i}^{2}}}right)}{sum _{i=1}^{n}{dfrac {1}{sigma _{i}^{2}}}}}={frac {sum _{i=1}^{n}left(x_{i}cdot w_{i}right)}{sum _{i=1}^{n}w_{i}}},}

y el error estándar de la media ponderada (con pesos de varianza inversa) es:

{displaystyle sigma _{bar {x}}={sqrt {frac {1}{sum _{i=1}^{n}sigma _{i}^{-2}}}}={sqrt {frac {1}{sum _{i=1}^{n}w_{i}}}},}

Nota esto reduce a $sigma _{bar {x}}^{2}=sigma _{0}^{2}/n$ cuando todo $sigma _{i}=sigma _{0}$ . Es un caso especial de la fórmula general en la sección anterior,

{displaystyle sigma _{bar {x}}^{2}=sum _{i=1}^{n}{w_{i}'^{2}sigma _{i}^{2}}={frac {sum _{i=1}^{n}{sigma _{i}^{-4}sigma _{i}^{2}}}{left(sum _{i=1}^{n}sigma _{i}^{-2}right)^{2}}}.}

Las ecuaciones anteriores se pueden combinar para obtener:

{displaystyle {bar {x}}=sigma _{bar {x}}^{2}sum _{i=1}^{n}{frac {x_{i}}{sigma _{i}^{2}}}.}

La importancia de esta elección es que esta media ponderada es el estimador de máxima verosimilitud de la media de las distribuciones de probabilidad bajo el supuesto de que son independientes y normalmente distribuidas con la misma media.

Propiedades estadísticas

Expectativa

La muestra ponderada significa, ${bar {x}}$ , es en sí misma una variable aleatoria. Su valor esperado y su desviación estándar están relacionados con los valores previstos y las desviaciones estándar de las observaciones, como se indica a continuación. Para la simplicidad, asumimos pesos normalizados (pesos resumiendo a uno).

Si las observaciones tienen valores esperados

{displaystyle E(x_{i})={mu _{i}},}

{displaystyle E({bar {x}})=sum _{i=1}^{n}{w_{i}'mu _{i}}.}

mu _{i}=mu

{displaystyle E({bar {x}})=mu.}

Variación

Simple i.i.d. caso

Al tratar los pesos como constantes y tener una muestra de n observaciones de variables aleatorias no correlacionadas, todas con la misma varianza y expectativa (como es el caso de las variables aleatorias i.i.d), entonces la varianza de la media ponderada se puede estimar como la multiplicación de la varianza por el efecto de diseño de Kish (ver prueba):

{displaystyle operatorname {Var} ({bar {y}}_{w})={frac {{hat {sigma }}_{y}^{2}}{n}}{frac {overline {w^{2}}}{{bar {w}}^{2}}}}

Con ${displaystyle {hat {sigma }}_{y}^{2}={frac {sum _{i=1}^{n}(y_{i}-{bar {y}})^{2}}{n-1}}}$ , ${displaystyle {bar {w}}={frac {sum _{i=1}^{n}w_{i}}{n}}}$ , y ${displaystyle {overline {w^{2}}}={frac {sum _{i=1}^{n}w_{i}^{2}}{n}}}$

Sin embargo, esta estimación es bastante limitada debido a la fuerte suposición sobre las observaciones y. Esto ha llevado al desarrollo de estimadores alternativos más generales.

Perspectiva de muestreo de la encuesta

De un modelo perspectiva, nos interesa estimar la varianza de la media ponderada cuando las diferentes $y_{i}$ no son variables aleatorias i.i.d. Una perspectiva alternativa para este problema es la de un diseño de muestreo arbitrario de los datos en los que se seleccionan unidades con probabilidades desiguales (con reemplazo).

En la metodología de encuestas, la población significa, de cierta cantidad de interés Sí., se calcula tomando una estimación del total de Sí. sobre todos los elementos de la población (Y o a veces T) y dividirlo por el tamaño de la población – o bien conocido ( $N$ ) o estimado ( ${displaystyle {hat {N}}}$ ). En este contexto, cada valor de Sí. se considera constante, y la variabilidad viene del procedimiento de selección. Esto en contraste con enfoques basados en modelos en los que la aleatoriedad se describe a menudo en los valores y. El procedimiento de muestreo de la encuesta produce una serie de valores de indicador Bernoulli ( $I_{i}$ que consigue 1 si alguna observación i está en la muestra y 0 si no fue seleccionado. Esto puede ocurrir con tamaño de muestra fijo, o muestreo de tamaño de muestra variado (por ejemplo: muestreo Poisson). La probabilidad de que algún elemento sea elegido, dada una muestra, se denota como ${displaystyle P(I_{i}=1mid {text{Some sample of size }}n)=pi _{i}}$ , y la probabilidad única de selección es ${displaystyle P(I_{i}=1|{text{one sample draw}})=p_{i}approx {frac {pi _{i}}{n}}}$ (Si N es muy grande y cada uno $p_{i}$ es muy pequeño). Para la siguiente derivación asumiremos que la probabilidad de seleccionar cada elemento está plenamente representada por estas probabilidades. Es decir: seleccionar algún elemento no influirá en la probabilidad de dibujar otro elemento (esto no se aplica para cosas como el diseño de muestreo de racimo).

Desde cada elemento ( $y_{i}$ ) se fija, y la aleatoriedad viene de que se incluye en la muestra o no ( $I_{i}$ ), a menudo hablamos de la multiplicación de los dos, que es una variable aleatoria. Para evitar confusión en la sección siguiente, llamemos a este término: ${displaystyle y'_{i}=y_{i}I_{i}}$ . Con la siguiente esperanza: ${displaystyle E[y'_{i}]=y_{i}E[I_{i}]=y_{i}pi _{i}}$ ; y diferencia: ${displaystyle V[y'_{i}]=y_{i}^{2}V[I_{i}]=y_{i}^{2}pi _{i}(1-pi _{i})}$ .

Cuando cada elemento de la muestra se infla por el inverso de su probabilidad de selección, se denomina el $pi$ -expandidos Sí. valores, es decir: ${displaystyle {check {y}}_{i}={frac {y_{i}}{pi _{i}}}}$ . Una cantidad conexa $p$ -expandidos Sí. valores: ${displaystyle {frac {y_{i}}{p_{i}}}=n{check {y}}_{i}}$ . Como arriba, podemos añadir una marca de garrapata si se multiplica por la función indicadora. I.e.: ${displaystyle {check {y}}'_{i}=I_{i}{check {y}}_{i}={frac {I_{i}y_{i}}{pi _{i}}}}$

En esto diseño perspectiva, los pesos, utilizados en el numerador de la media ponderada, se obtienen a partir de tomar el inverso de la probabilidad de selección (es decir, el factor de inflación). I.e.: ${displaystyle w_{i}={frac {1}{pi _{i}}}approx {frac {1}{ntimes p_{i}}}}$ .

Varianza de la suma ponderada (pwr-estimator para totales)

Si el tamaño de la población N se sabe que podemos estimar que la población significa usar ${displaystyle {hat {bar {Y}}}_{{text{known }}N}={frac {{hat {Y}}_{pwr}}{N}}approx {frac {sum _{i=1}^{n}w_{i}y'_{i}}{N}}}$ .

Si el diseño de muestreo es uno que da como resultado un tamaño de muestra fijo n (como en el muestreo pps), entonces la varianza de este estimador es:

{displaystyle operatorname {Var} left({hat {bar {Y}}}_{{text{known }}N}right)={frac {1}{N^{2}}}{frac {n}{n-1}}sum _{i=1}^{n}left(w_{i}y_{i}-{overline {wy}}right)^{2}}

Prueba

La fórmula general se puede desarrollar así:

{displaystyle {hat {bar {Y}}}_{{text{known }}N}={frac {{hat {Y}}_{pwr}}{N}}={frac {{frac {1}{n}}sum _{i=1}^{n}{frac {y'_{i}}{p_{i}}}}{N}}approx {frac {sum _{i=1}^{n}{frac {y'_{i}}{pi _{i}}}}{N}}={frac {sum _{i=1}^{n}w_{i}y'_{i}}{N}}.}

El total de la población se denota como ${displaystyle Y=sum _{i=1}^{N}y_{i}}$ y puede ser estimado por el estimador de Horvitz-Thompson, también llamado el $pi$ - Estimador. Este estimador se puede calcular utilizando el pwr- Estimador (es decir: $p$ -expandido con el estimador de reemplazo, o "probabilidad con el estimador de reemplazo". Con la notación anterior, es: ${displaystyle {hat {Y}}_{pwr}={frac {1}{n}}sum _{i=1}^{n}{frac {y'_{i}}{p_{i}}}=sum _{i=1}^{n}{frac {y'_{i}}{np_{i}}}approx sum _{i=1}^{n}{frac {y'_{i}}{pi _{i}}}=sum _{i=1}^{n}w_{i}y'_{i}}$ .

La diferencia estimada pwr- La estimación es dada por:

{displaystyle operatorname {Var} ({hat {Y}}_{pwr})={frac {n}{n-1}}sum _{i=1}^{n}left(w_{i}y_{i}-{overline {wy}}right)^{2}}

Donde

{displaystyle {overline {wy}}=sum _{i=1}^{n}{frac {w_{i}y_{i}}{n}}}

The above formula was taken from Sarndal et al. (1992) (also presented in Cochran 1977), but was written differently. El lado izquierdo es cómo se escribió la varianza y el lado derecho es cómo hemos desarrollado la versión ponderada:

{displaystyle {begin{aligned}operatorname {Var} ({hat {Y}}_{text{pwr}})&={frac {1}{n}}{frac {1}{n-1}}sum _{i=1}^{n}left({frac {y_{i}}{p_{i}}}-{hat {Y}}_{pwr}right)^{2}\&={frac {1}{n}}{frac {1}{n-1}}sum _{i=1}^{n}left({frac {n}{n}}{frac {y_{i}}{p_{i}}}-{frac {n}{n}}sum _{i=1}^{n}w_{i}y_{i}right)^{2}={frac {1}{n}}{frac {1}{n-1}}sum _{i=1}^{n}left(n{frac {y_{i}}{pi _{i}}}-n{frac {sum _{i=1}^{n}w_{i}y_{i}}{n}}right)^{2}\&={frac {n^{2}}{n}}{frac {1}{n-1}}sum _{i=1}^{n}left(w_{i}y_{i}-{overline {wy}}right)^{2}\&={frac {n}{n-1}}sum _{i=1}^{n}left(w_{i}y_{i}-{overline {wy}}right)^{2}end{aligned}}}

Y llegamos a la fórmula de arriba.

Un término alternativo, para cuando el muestreo tiene un tamaño de muestra aleatorio (como en el muestreo de Poisson), se presenta en Sarndal et al. (1992) como:

{displaystyle operatorname {Var} ({hat {bar {Y}}}_{{text{pwr (known }}N{text{)}}})={frac {1}{N^{2}}}sum _{i=1}^{n}sum _{j=1}^{n}left({check {Delta }}_{ij}{check {y}}_{i}{check {y}}_{j}right)}

Con ${displaystyle {check {y}}_{i}={frac {y_{i}}{pi _{i}}}}$ . También, ${displaystyle C(I_{i},I_{j})=pi _{ij}-pi _{i}pi _{j}=Delta _{ij}}$ Donde ${displaystyle pi _{ij}}$ es la probabilidad de seleccionar tanto i como j. Y ${displaystyle {check {Delta }}_{ij}=1-{frac {pi _{i}pi _{j}}{pi _{ij}}}}$ , y para i=j: ${displaystyle {check {Delta }}_{ii}=1-{frac {pi _{i}pi _{i}}{pi _{i}}}=1-pi _{i}}$ .

Si la probabilidad de selección no está relacionada (es decir: ${displaystyle forall ineq j:C(I_{i},I_{j})=0}$ ), y al asumir la probabilidad de cada elemento es muy pequeña, entonces:

{displaystyle operatorname {Var} ({hat {bar {Y}}}_{{text{pwr (known }}N{text{)}}})={frac {1}{N^{2}}}sum _{i=1}^{n}left(w_{i}y_{i}right)^{2}}

Prueba

Asumimos que ${displaystyle (1-pi _{i})approx 0}$ y eso

{displaystyle {begin{aligned}operatorname {Var} ({hat {Y}}_{{text{pwr (known }}N{text{)}}})&={frac {1}{N^{2}}}sum _{i=1}^{n}sum _{j=1}^{n}left({check {Delta }}_{ij}{check {y}}_{i}{check {y}}_{j}right)\&={frac {1}{N^{2}}}sum _{i=1}^{n}left({check {Delta }}_{ii}{check {y}}_{i}{check {y}}_{i}right)\&={frac {1}{N^{2}}}sum _{i=1}^{n}left((1-pi _{i}){frac {y_{i}}{pi _{i}}}{frac {y_{i}}{pi _{i}}}right)\&={frac {1}{N^{2}}}sum _{i=1}^{n}left(w_{i}y_{i}right)^{2}end{aligned}}}

Varianza de la media ponderada (π-estimador para razón-media)

En la sección anterior se trataba de la estimación de la población como proporción de un total estimado de población (en inglés) ${displaystyle {hat {Y}}}$ ) con un tamaño de población conocido ( $N$ ), y la diferencia se estimó en ese contexto. Otro caso común es que el tamaño de la población en sí ( $N$ ) es desconocido y se calcula utilizando la muestra (es decir: ${displaystyle {hat {N}}}$ ). La estimación de $N$ se puede describir como la suma de pesos. Así que cuando ${displaystyle w_{i}={frac {1}{pi _{i}}}}$ nosotros ${displaystyle {hat {N}}=sum _{i=1}^{n}w_{i}I_{i}=sum _{i=1}^{n}{frac {I_{i}}{pi _{i}}}=sum _{i=1}^{n}{check {1}}'_{i}}$ . Al utilizar notación de secciones anteriores, la proporción que nos importa es la suma de $y_{i}$ s, y 1s. I.e.: ${displaystyle R={bar {Y}}={frac {sum _{i=1}^{N}{frac {y_{i}}{pi _{i}}}}{sum _{i=1}^{N}{frac {1}{pi _{i}}}}}={frac {sum _{i=1}^{N}{check {y}}_{i}}{sum _{i=1}^{N}{check {1}}_{i}}}={frac {sum _{i=1}^{N}w_{i}y_{i}}{sum _{i=1}^{N}w_{i}}}}$ . Podemos estimarlo usando nuestra muestra con: ${displaystyle {hat {R}}={hat {bar {Y}}}={frac {sum _{i=1}^{N}I_{i}{frac {y_{i}}{pi _{i}}}}{sum _{i=1}^{N}I_{i}{frac {1}{pi _{i}}}}}={frac {sum _{i=1}^{N}{check {y}}'_{i}}{sum _{i=1}^{N}{check {1}}'_{i}}}={frac {sum _{i=1}^{N}w_{i}y'_{i}}{sum _{i=1}^{N}w_{i}1'_{i}}}={frac {sum _{i=1}^{n}w_{i}y'_{i}}{sum _{i=1}^{n}w_{i}1'_{i}}}={bar {y}}_{w}}$ . A medida que pasamos de utilizar N a utilizar n, realmente sabemos que todas las variables indicadoras obtienen 1, así que simplemente podríamos escribir: ${displaystyle {bar {y}}_{w}={frac {sum _{i=1}^{n}w_{i}y_{i}}{sum _{i=1}^{n}w_{i}}}}$ . Esta será la estimación para valores específicos de y y w, pero las propiedades estadísticas vienen cuando incluye la variable indicador ${displaystyle {bar {y}}_{w}={frac {sum _{i=1}^{n}w_{i}y'_{i}}{sum _{i=1}^{n}w_{i}1'_{i}}}}$ .

Esto se llama estimador de razón y es aproximadamente imparcial para R.

En este caso, la variabilidad de la razón depende de la variabilidad de las variables aleatorias tanto en el numerador como en el denominador, así como de su correlación. Dado que no existe una forma analítica cerrada para calcular esta varianza, se utilizan varios métodos para la estimación aproximada. Principalmente linealización de primer orden de la serie de Taylor, asintótica y bootstrap/jackknife. El método de linealización de Taylor podría dar lugar a una subestimación de la varianza para tamaños de muestra pequeños en general, pero eso depende de la complejidad de la estadística. Para la media ponderada, se supone que la varianza aproximada es relativamente precisa incluso para tamaños de muestra medianos. Porque cuando el muestreo tiene un tamaño de muestra aleatorio (como en el muestreo de Poisson), es como sigue:

{displaystyle {widehat {V({bar {y}}_{w})}}={frac {1}{(sum _{i=1}^{n}w_{i})^{2}}}sum _{i=1}^{n}w_{i}^{2}(y_{i}-{bar {y}}_{w})^{2}}

Observamos que si ${displaystyle pi _{i}approx p_{i}n}$ , entonces ya sea usando ${displaystyle w_{i}={frac {1}{pi _{i}}}}$ o ${displaystyle w_{i}={frac {1}{p_{i}}}}$ daría el mismo estimador, ya que multiplicarse $w_{i}$ por algún factor llevaría al mismo estimador. También significa que si escalamos la suma de pesos para ser iguales a un tamaño de población conocido-de-antes N, el cálculo de la varianza se vería igual. Cuando todos los pesos son iguales unos a otros, esta fórmula se reduce al calculador de varianza sin prejuicios estándar.

Prueba

La linealización de Taylor establece que para un estimador de relación general de dos sumas ( ${displaystyle {hat {R}}={frac {hat {Y}}{hat {Z}}}}$ ), se pueden ampliar alrededor del verdadero valor R, y dar:

{displaystyle {hat {R}}={frac {hat {Y}}{hat {Z}}}={frac {sum _{i=1}^{n}w_{i}y'_{i}}{sum _{i=1}^{n}w_{i}z'_{i}}}approx R+{frac {1}{Z}}sum _{i=1}^{n}left({frac {y'_{i}}{pi _{i}}}-R{frac {z'_{i}}{pi _{i}}}right)}

Y la varianza puede ser aproximada por:

{displaystyle {widehat {V({hat {R}})}}={frac {1}{{hat {Z}}^{2}}}sum _{i=1}^{n}sum _{j=1}^{n}left({check {Delta }}_{ij}{frac {y_{i}-{hat {R}}z_{i}}{pi _{i}}}{frac {y_{j}-{hat {R}}z_{j}}{pi _{j}}}right)={frac {1}{{hat {Z}}^{2}}}left[{widehat {V({hat {Y}})}}+{hat {R}}{widehat {V({hat {Z}})}}-2{hat {R}}{hat {C}}({hat {Y}},{hat {Z}})right]}

El término ${displaystyle {hat {C}}({hat {Y}},{hat {Z}})}$ es la covariancia estimada entre la suma estimada de Y y la suma estimada de Z. Dado que esta es la covariancia de dos sumas de variables aleatorias, incluiría muchas combinaciones de covariancias que dependerán de las variables indicadoras. Si la probabilidad de selección no está relacionada (es decir: ${displaystyle forall ineq j:Delta _{ij}=C(I_{i},I_{j})=0}$ ), este término todavía incluiría una suma de n covarianzas para cada elemento i entre ${displaystyle y'_{i}=I_{i}y_{i}}$ y ${displaystyle z'_{i}=I_{i}z_{i}}$ . Esto ayuda a ilustrar que esta fórmula incorpora el efecto de correlación entre y z en la variabilidad de los estimadores de relación.

Cuando se define ${displaystyle z_{i}=1}$ lo anterior se convierte en:

{displaystyle {widehat {V({hat {R}})}}={widehat {V({bar {y}}_{w})}}={frac {1}{{hat {N}}^{2}}}sum _{i=1}^{n}sum _{j=1}^{n}left({check {Delta }}_{ij}{frac {y_{i}-{bar {y}}_{w}}{pi _{i}}}{frac {y_{j}-{bar {y}}_{w}}{pi _{j}}}right).}

Si la probabilidad de selección no está relacionada (es decir: ${displaystyle forall ineq j:Delta _{ij}=C(I_{i},I_{j})=0}$ ), y al asumir la probabilidad de cada elemento es muy pequeña (es decir: ${displaystyle (1-pi _{i})approx 0}$ ), entonces el anterior se redujo a lo siguiente:

{displaystyle {widehat {V({bar {y}}_{w})}}={frac {1}{{hat {N}}^{2}}}sum _{i=1}^{n}left((1-pi _{i}){frac {y_{i}-{bar {y}}_{w}}{pi _{i}}}right)^{2}={frac {1}{(sum _{i=1}^{n}w_{i})^{2}}}sum _{i=1}^{n}w_{i}^{2}(y_{i}-{bar {y}}_{w})^{2}.}

Una re-creación similar de la prueba (hasta algunos errores al final) fue proporcionada por Thomas Lumley en cruzada.

Tenemos (al menos) dos versiones de varianza para la media ponderada: una con una estimación del tamaño de la población conocida y otra con una estimación del tamaño de la población desconocida. No existe un enfoque uniformemente mejor, pero la literatura presenta varios argumentos para preferir usar la versión de estimación de población (incluso cuando se conoce el tamaño de la población). Por ejemplo: si todos los valores de y son constantes, el estimador con tamaño de población desconocido dará el resultado correcto, mientras que el de tamaño de población conocido tendrá cierta variabilidad. Además, cuando el tamaño de la muestra en sí es aleatorio (por ejemplo, en el muestreo de Poisson), la versión con media poblacional desconocida se considera más estable. Por último, si la proporción de muestreo está negativamente correlacionada con los valores (es decir, menor probabilidad de muestrear una observación que es grande), entonces la versión de tamaño de población desconocido lo compensa ligeramente.

Validación de arranque

Se ha demostrado, por Gatz et al. (1995), que en comparación con los métodos de arranque, la siguiente (estimación de la varianza de la media de la relación utilizando la linealización de la serie de Taylor) es una estimación razonable del cuadrado del error estándar de la media (cuando se utiliza en el contexto de la medición de constituyentes químicos):

{displaystyle {widehat {sigma _{{bar {x}}_{w}}^{2}}}={frac {n}{(n-1)(n{bar {w}})^{2}}}left[sum (w_{i}x_{i}-{bar {w}}{bar {x}}_{w})^{2}-2{bar {x}}_{w}sum (w_{i}-{bar {w}})(w_{i}x_{i}-{bar {w}}{bar {x}}_{w})+{bar {x}}_{w}^{2}sum (w_{i}-{bar {w}})^{2}right]}

Donde ${displaystyle {bar {w}}={frac {sum w_{i}}{n}}}$ . Más simplificación conduce a

{displaystyle {widehat {sigma _{bar {x}}^{2}}}={frac {n}{(n-1)(n{bar {w}})^{2}}}sum w_{i}^{2}(x_{i}-{bar {x}}_{w})^{2}}

Gatz et al. mencionar que la formulación anterior fue publicada por Endlich et al. (1988) al tratar la media ponderada como una combinación de un estimador total ponderado dividido por un estimador del tamaño de la población, con base en la formulación publicada por Cochran (1977), como una aproximación a la media de la razón. Sin embargo, Endlich et al. no pareció publicar esta derivación en su artículo (aunque mencionan que la usaron), y el libro de Cochran incluye una formulación ligeramente diferente. Aún así, es casi idéntica a las formulaciones descritas en las secciones anteriores.

Estimadores basados en replicación

Debido a que no existe una forma analítica cerrada para la varianza de la media ponderada, en la literatura se propuso confiar en métodos de replicación como Jackknife y Bootstrapping.

Otras notas

Para observaciones no relacionadas con diferencias $sigma _{i}^{2}$ , la diferencia de la media de la muestra ponderada es

{displaystyle sigma _{bar {x}}^{2}=sum _{i=1}^{n}{w_{i}'^{2}sigma _{i}^{2}}}

cuya raíz cuadrada $sigma _{{{bar x}}}$ se puede llamar error estándar de la media ponderada (caso general).

En consecuencia, si todas las observaciones tienen igual diferencia, $sigma _{i}^{2}=sigma _{0}^{2}$ , el medio de muestra ponderada tendrá varianza

{displaystyle sigma _{bar {x}}^{2}=sigma _{0}^{2}sum _{i=1}^{n}{w_{i}'^{2}},}

Donde ${textstyle 1/nleq sum _{i=1}^{n}{w_{i}'^{2}}leq 1}$ . La diferencia alcanza su valor máximo, $sigma _{0}^{2}$ , cuando todos los pesos excepto uno son cero. Su valor mínimo se encuentra cuando todos los pesos son iguales (es decir, medios no ponderados), en cuyo caso tenemos ${textstyle sigma _{bar {x}}=sigma _{0}/{sqrt {n}}}$ , es decir, se degenera en el error estándar del medio, cuadrado.

Tenga en cuenta que como uno siempre puede transformar pesos no normalizados a pesos normalizados toda fórmula en esta sección puede adaptarse a pesos no normalizados reemplazando todos $w_{i}'={frac {w_{i}}{sum _{i=1}^{n}{w_{i}}}}$ .

Conceptos relacionados

Varianza muestral ponderada

Típicamente cuando se calcula un medio es importante saber la varianza y la desviación estándar sobre ese medio. Cuando una media ponderada $mu ^{*}$ se utiliza, la varianza de la muestra ponderada es diferente de la varianza de la muestra no ponderada.

El parcial Variación de muestra ponderada ${displaystyle {hat {sigma }}_{mathrm {w} }^{2}}$ se define de forma similar a la normalidad parcial Variación de la muestra ${displaystyle {hat {sigma }}^{2}}$ :

{displaystyle {begin{aligned}{hat {sigma }}^{2} &={frac {sum limits _{i=1}^{N}left(x_{i}-mu right)^{2}}{N}}\{hat {sigma }}_{mathrm {w} }^{2}&={frac {sum limits _{i=1}^{N}w_{i}left(x_{i}-mu ^{*}right)^{2}}{sum _{i=1}^{N}w_{i}}}end{aligned}}}

Donde ${displaystyle sum _{i=1}^{N}w_{i}=1}$ para pesos normalizados. Si los pesos son pesos de frecuencia (y por lo tanto son variables aleatorias), se puede demostrar que ${displaystyle {hat {sigma }}_{mathrm {w} }^{2}}$ es el estimador de probabilidad máxima $sigma ^{2}$ iid observaciones gausianas.

Para muestras pequeñas, se acostumbra usar un estimador insesgado para la varianza de la población. En muestras normales no ponderadas, el N en el denominador (correspondiente al tamaño de la muestra) se cambia a N − 1 (consulte la corrección de Bessel). En la configuración ponderada, en realidad hay dos estimadores insesgados diferentes, uno para el caso de pesos de frecuencia y otro para el caso de pesos de confiabilidad.

Pesos de frecuencia

Si los pesos son pesos de frecuencia (donde un peso es igual al número de ocurrencias), entonces el estimador insesgado es:

{displaystyle s^{2} ={frac {sum limits _{i=1}^{N}w_{i}left(x_{i}-mu ^{*}right)^{2}}{sum _{i=1}^{N}w_{i}-1}}}

Esto aplica efectivamente la corrección de Bessel para ponderaciones de frecuencia.

Por ejemplo, si los valores ${2,2,4,5,5,5}$ son extraídos de la misma distribución, entonces podemos tratar este conjunto como una muestra no ponderada, o podemos tratarlo como la muestra ponderada ${2,4,5}$ con pesos correspondientes ${2,1,3}$ Y tenemos el mismo resultado de cualquier manera.

Si el peso de la frecuencia ${w_{i}}$ se normaliza a 1, entonces la expresión correcta después de que la corrección de Bessel se convierte

{displaystyle s^{2} ={frac {sum _{i=1}^{N}w_{i}}{sum _{i=1}^{N}w_{i}-1}}sum _{i=1}^{N}w_{i}left(x_{i}-mu ^{*}right)^{2}}

donde el número total de muestras es ${displaystyle sum _{i=1}^{N}w_{i}}$ (no $N$ ). En todo caso, la información sobre el número total de muestras es necesaria para obtener una corrección imparcial, incluso si $w_{i}$ tiene un significado diferente aparte del peso de frecuencia.

Tenga en cuenta que el estimador puede ser imparcial solo si los pesos no están estandarizados ni normalizados, estos procesos cambian la media y la varianza de los datos y, por lo tanto, conducen a una pérdida de la tasa base (el recuento de población, que es un requisito para la corrección de Bessel).

Pesos de confiabilidad

Si los pesos son en su lugar no aleatorios (pesos de fiabilidad), podemos determinar un factor de corrección para producir un estimador imparcial. Asumiendo que cada variable aleatoria se muestre de la misma distribución con media $mu$ y diferencia real ${displaystyle sigma _{text{actual}}^{2}}$ , teniendo expectativas que tenemos,

{displaystyle {begin{aligned}operatorname {E} [{hat {sigma }}^{2}]&={frac {sum limits _{i=1}^{N}operatorname {E} [(x_{i}-mu)^{2}]}{N}}\&=operatorname {E} [(X-operatorname {E} [X])^{2}]-{frac {1}{N}}operatorname {E} [(X-operatorname {E} [X])^{2}]\&=left({frac {N-1}{N}}right)sigma _{text{actual}}^{2}\operatorname {E} [{hat {sigma }}_{mathrm {w} }^{2}]&={frac {sum limits _{i=1}^{N}w_{i}operatorname {E} [(x_{i}-mu ^{*})^{2}]}{V_{1}}}\&=operatorname {E} [(X-operatorname {E} [X])^{2}]-{frac {V_{2}}{V_{1}^{2}}}operatorname {E} [(X-operatorname {E} [X])^{2}]\&=left(1-{frac {V_{2}}{V_{1}^{2}}}right)sigma _{text{actual}}^{2}end{aligned}}}

Donde $V_{1}=sum _{i=1}^{N}w_{i}$ y $V_{2}=sum _{i=1}^{N}w_{i}^{2}$ . Por lo tanto, el sesgo en nuestro estimador es $left(1-{frac {V_{2}}{V_{1}^{2}}}right)$ , análogo al $left({frac {N-1}{N}}right)$ sesgo en el estimador sin peso (también notar que ${displaystyle V_{1}^{2}/V_{2}=N_{eff}}$ es el tamaño de muestra eficaz). Esto significa que para imparciales nuestro estimador necesitamos pre-divider por $1-left(V_{2}/V_{1}^{2}right)$ , asegurando que el valor esperado de la diferencia estimada sea igual a la diferencia real de la distribución de muestreo.

La estimación imparcial final de la varianza de la muestra es:

{displaystyle {begin{aligned}s_{mathrm {w} }^{2} &={frac {{hat {sigma }}_{mathrm {w} }^{2}}{1-(V_{2}/V_{1}^{2})}}\[4pt]&={frac {sum limits _{i=1}^{N}w_{i}(x_{i}-mu ^{*})^{2}}{V_{1}-(V_{2}/V_{1})}},end{aligned}}}

Donde ${displaystyle operatorname {E} [s_{mathrm {w} }^{2}]=sigma _{text{actual}}^{2}}$ .

Los grados de libertad de la varianza de la muestra ponderada e imparcial varían en consecuencia desde N − 1 hasta 0.

La desviación estándar es simplemente la raíz cuadrada de la varianza anterior.

Como nota al margen, se han descrito otros enfoques para calcular la varianza de la muestra ponderada.

Covarianza de muestra ponderada

En una muestra ponderada, cada vector de fila ${displaystyle mathbf {x} _{i}}$ (Cada conjunto de observaciones individuales sobre cada una de las K variables aleatorias) se asigna un peso ${displaystyle w_{i}geq 0}$ .

Entonces el vector de peso medio ${displaystyle mathbf {mu ^{*}} }$ es dado por

mathbf {mu ^{*}} ={frac {sum _{i=1}^{N}w_{i}mathbf {x} _{i}}{sum _{i=1}^{N}w_{i}}}.

Y la matriz de covarianza ponderada viene dada por:

{displaystyle mathbf {C} ={frac {sum _{i=1}^{N}w_{i}left(mathbf {x} _{i}-mu ^{*}right)^{T}left(mathbf {x} _{i}-mu ^{*}right)}{V_{1}}}.}

Al igual que la varianza de la muestra ponderada, existen dos estimadores imparciales diferentes según el tipo de ponderación.

Pesos de frecuencia

Si los pesos son pesos de frecuencia, el imparciales estimación ponderada de la matriz de covariancia ${displaystyle textstyle mathbf {C} }$ , con la corrección de Bessel, se da por:

{displaystyle mathbf {C} ={frac {sum _{i=1}^{N}w_{i}left(mathbf {x} _{i}-mu ^{*}right)^{T}left(mathbf {x} _{i}-mu ^{*}right)}{V_{1}-1}}.}

Tenga en cuenta que este estimador puede ser imparcial solo si los pesos no están estandarizados ni normalizados, estos procesos cambian la media y la varianza de los datos y, por lo tanto, conducen a una pérdida de la tasa base (el recuento de población, que es un requisito para la corrección de Bessel).

Pesos de confiabilidad

En el caso de pesos de confiabilidad, los pesos se normalizan:

{displaystyle V_{1}=sum _{i=1}^{N}w_{i}=1.}

(Si no lo son, dividir los pesos por su suma para normalizar antes de calcular $V_{1}$ :

{displaystyle w_{i}'={frac {w_{i}}{sum _{i=1}^{N}w_{i}}}}

Entonces el vector de peso medio ${displaystyle mathbf {mu ^{*}} }$ se puede simplificar

mathbf {mu ^{*}} =sum _{i=1}^{N}w_{i}mathbf {x} _{i}.

y el imparciales estimación ponderada de la matriz de covariancia ${mathbf {C}}$ es:

{displaystyle {begin{aligned}mathbf {C} &={frac {sum _{i=1}^{N}w_{i}}{left(sum _{i=1}^{N}w_{i}right)^{2}-sum _{i=1}^{N}w_{i}^{2}}}sum _{i=1}^{N}w_{i}left(mathbf {x} _{i}-mu ^{*}right)^{T}left(mathbf {x} _{i}-mu ^{*}right)\&={frac {sum _{i=1}^{N}w_{i}left(mathbf {x} _{i}-mu ^{*}right)^{T}left(mathbf {x} _{i}-mu ^{*}right)}{V_{1}-(V_{2}/V_{1})}}.end{aligned}}}

El razonamiento aquí es el mismo que en la sección anterior.

Puesto que estamos asumiendo que los pesos están normalizados, entonces ${displaystyle V_{1}=1}$ y esto reduce a:

{displaystyle mathbf {C} ={frac {sum _{i=1}^{N}w_{i}left(mathbf {x} _{i}-mu ^{*}right)^{T}left(mathbf {x} _{i}-mu ^{*}right)}{1-V_{2}}}.}

Si todos los pesos son iguales, es decir. ${displaystyle w_{i}/V_{1}=1/N}$ , entonces la media ponderada y la covariancia reducen a la media de muestra no ponderada y la covariancia arriba.

Estimaciones con valores vectoriales

Lo anterior generaliza fácilmente el caso de tomar la media de estimaciones valoradas por vectores. Por ejemplo, las estimaciones de posición en un plano pueden tener menos certeza en una dirección que en otra. Como en el caso de escalar, la media ponderada de múltiples estimaciones puede proporcionar una estimación de probabilidad máxima. Simplemente reemplazamos la diferencia $sigma ^{2}$ por la matriz de covariancia $mathbf {C}$ y la inversa aritmética por la matriz inversa (ambos denotados de la misma manera, a través de superscriptos); la matriz de peso entonces lee:

{displaystyle mathbf {W} _{i}=mathbf {C} _{i}^{-1}.}

La media ponderada en este caso es:

{displaystyle {bar {mathbf {x} }}=mathbf {C} _{bar {mathbf {x} }}left(sum _{i=1}^{n}mathbf {W} _{i}mathbf {x} _{i}right),}

{displaystyle mathbf {C} _{bar {mathbf {x} }}=left(sum _{i=1}^{n}mathbf {W} _{i}right)^{-1},}

Por ejemplo, considere la media ponderada del punto [1 0] con alta varianza en el segundo componente y [0 1] con alta varianza en el primer componente. Después

{displaystyle mathbf {x} _{1}:={begin{bmatrix}1&0end{bmatrix}}^{top },qquad mathbf {C} _{1}:={begin{bmatrix}1&0\0&100end{bmatrix}}}

{displaystyle mathbf {x} _{2}:={begin{bmatrix}0&1end{bmatrix}}^{top },qquad mathbf {C} _{2}:={begin{bmatrix}100&0\0&1end{bmatrix}}}

entonces la media ponderada es:

{displaystyle {begin{aligned}{bar {mathbf {x} }}&=left(mathbf {C} _{1}^{-1}+mathbf {C} _{2}^{-1}right)^{-1}left(mathbf {C} _{1}^{-1}mathbf {x} _{1}+mathbf {C} _{2}^{-1}mathbf {x} _{2}right)\[5pt]&={begin{bmatrix}0.9901&0\0&0.9901end{bmatrix}}{begin{bmatrix}1\1end{bmatrix}}={begin{bmatrix}0.9901\0.9901end{bmatrix}}end{aligned}}}

lo cual tiene sentido: la estimación [1 0] es "conforme" en el segundo componente y la estimación [0 1] cumple con el primer componente, por lo que la media ponderada es casi [1 1].

Contabilización de correlaciones

En el caso general, suponga que ${displaystyle mathbf {X} =[x_{1},dotsx_{n}]^{T}}$ , $mathbf {C}$ es la matriz de covariancia relativa a las cantidades $x_{i}$ , ${bar {x}}$ es el medio común para ser estimado, y $mathbf {J}$ es una matriz de diseño igual a un vector de uno ${displaystyle [1,dots1]^{T}}$ (de longitud) $n$ ). El teorema Gauss-Markov establece que la estimación de la media que tiene la varianza mínima es dada por:

{displaystyle sigma _{bar {x}}^{2}=(mathbf {J} ^{T}mathbf {W} mathbf {J})^{-1},}

{displaystyle {bar {x}}=sigma _{bar {x}}^{2}(mathbf {J} ^{T}mathbf {W} mathbf {X}),}

donde:

{displaystyle mathbf {W} =mathbf {C} ^{-1}.}

Disminución de la fuerza de las interacciones

Considere la serie de tiempo de una variable independiente $x$ y una variable dependiente $y$ , con $n$ observaciones muestreadas en tiempos discretos $t_{i}$ . En muchas situaciones comunes, el valor $y$ a la vez $t_{i}$ depende no sólo de $x_{i}$ pero también en sus valores anteriores. Comúnmente, la fuerza de esta dependencia disminuye a medida que aumenta la separación de las observaciones en el tiempo. Para modelar esta situación, se puede reemplazar la variable independiente por su media deslizante $z$ para un tamaño de ventana $m$ .

{displaystyle z_{k}=sum _{i=1}^{m}w_{i}x_{k+1-i}.}

Pesos exponencialmente decrecientes

En el escenario descrito en la sección anterior, con más frecuencia la disminución de la fuerza de interacción obedece a una ley exponencial negativa. Si las observaciones se muestran en tiempos equidistas, entonces la disminución exponencial es equivalente a la disminución por una fracción constante $<math alttext="{displaystyle 0<Delta 0.Δ Δ .1{displaystyle 0 realizadasDelta <img alt="0<Delta$ a cada paso del tiempo. Ajuste $w=1-Delta$ podemos definir $m$ pesos normalizados por

w_{i}={frac {w^{i-1}}{V_{1}}},

Donde $V_{1}$ es la suma de los pesos no normalizados. En este caso $V_{1}$ es simplemente

V_{1}=sum _{i=1}^{m}{w^{i-1}}={frac {1-w^{m}}{1-w}},

acercamiento $V_{1}=1/(1-w)$ para grandes valores $m$ .

La constante de humedad $w$ debe corresponder a la disminución real de la fuerza de interacción. Si esto no puede ser determinado por consideraciones teóricas, entonces las siguientes propiedades de la disminución exponencial de pesos son útiles para hacer una elección adecuada: a paso $(1-w)^{-1}$ , el peso aproximadamente igual ${e^{-1}}(1-w)=0.39(1-w)$ , el área de la cola el valor $e^{-1}$ , el área principal ${1-e^{-1}}=0.61$ . El área de cola a paso $n$ es $leq {e^{-n(1-w)}}$ . Donde principalmente el más cercano $n$ observaciones materia y el efecto de las observaciones restantes puede ser ignorado con seguridad, luego elegir $w$ tal que el área de cola es suficientemente pequeña.

Promedios ponderados de funciones

El concepto de promedio ponderado se puede extender a las funciones. Los promedios ponderados de funciones juegan un papel importante en los sistemas de cálculo diferencial e integral ponderados.

Corregir la dispersión excesiva o insuficiente

Los medios ponderados se utilizan típicamente para encontrar el medio ponderado de datos históricos, en lugar de generar datos teóricamente. En este caso, habrá algún error en la varianza de cada punto de datos. Los errores típicamente experimentales pueden subestimarse debido a que el experimentador no tiene en cuenta todas las fuentes de error al calcular la diferencia de cada punto de datos. En este caso, la varianza de la media ponderada debe ser corregida para tener en cuenta el hecho de que $chi ^{2}$ es demasiado grande. La corrección que debe hacerse es

{displaystyle {hat {sigma }}_{bar {x}}^{2}=sigma _{bar {x}}^{2}chi _{nu }^{2}}

Donde $chi _{nu }^{2}$ es el reducido chi-squared:

{displaystyle chi _{nu }^{2}={frac {1}{(n-1)}}sum _{i=1}^{n}{frac {(x_{i}-{bar {x}})^{2}}{sigma _{i}^{2}}};}

La raíz cuadrada ${displaystyle {hat {sigma }}_{bar {x}}}$ se puede llamar error estándar de la media ponderada (pesos de variación, escala corregida).

Cuando todas las diferencias de datos son iguales, $sigma _{i}=sigma _{0}$ , cancelan en la varianza media ponderada, $sigma _{bar {x}}^{2}$ , que de nuevo reduce al error estándar de la media (squared), $sigma _{bar {x}}^{2}=sigma ^{2}/n$ , formulado en términos de la desviación estándar de la muestra (cuadrado),

{displaystyle sigma ^{2}={frac {sum _{i=1}^{n}(x_{i}-{bar {x}})^{2}}{n-1}}.}

Contenido relacionado

Más resultados...