Normalización (estadísticas)
En estadística y aplicaciones de estadística, normalización puede tener diversos significados. En los casos más simples, la normalización de calificaciones significa ajustar los valores medidos en diferentes escalas a una escala teóricamente común, a menudo antes de promediar. En casos más complicados, la normalización puede referirse a ajustes más sofisticados donde la intención es alinear todas las distribuciones de probabilidad de los valores ajustados. En el caso de la normalización de puntuaciones en la evaluación educativa, puede haber una intención de alinear las distribuciones con una distribución normal. Un enfoque diferente para la normalización de distribuciones de probabilidad es la normalización por cuantiles, donde se alinean los cuantiles de las diferentes medidas.
En otro uso en estadística, la normalización se refiere a la creación de versiones desplazadas y escaladas de estadísticas, donde la intención es que estos valores normalizados permitan la comparación de los valores normalizados correspondientes para diferentes conjuntos de datos de una manera que elimina los efectos de ciertas influencias graves, como en una serie temporal de anomalías. Algunos tipos de normalización implican sólo un cambio de escala para llegar a valores relativos a alguna variable de tamaño. En términos de niveles de medición, dichas proporciones sólo tienen sentido para mediciones de ratio (donde las proporciones de las mediciones son significativas), no para mediciones de intervalo (donde sólo las distancias son significativas, pero no proporciones).
En estadística teórica, la normalización paramétrica a menudo puede conducir a cantidades fundamentales (funciones cuya distribución muestral no depende de los parámetros) y a estadísticas auxiliares (cantidades fundamentales que se pueden calcular a partir de observaciones, sin conocer los parámetros).
Ejemplos
Existen diferentes tipos de normalizaciones en estadística (proporciones adimensionales de errores, residuos, medias y desviaciones estándar, que por lo tanto son invariantes de escala), algunas de las cuales pueden resumirse de la siguiente manera. Tenga en cuenta que, en términos de niveles de medición, estas proporciones solo tienen sentido para mediciones de ratio (donde las proporciones de las mediciones son significativas), no para mediciones de intervalo (donde solo las distancias son significativas). pero no proporciones). Véase también Categoría: Ratios estadísticos.
Nombre | Formula | Uso |
---|---|---|
Puntuación estándar | X− − μ μ σ σ {displaystyle {frac {X-mu }{sigma } | Normalizar errores cuando se conocen los parámetros de población. Funciona bien para las poblaciones que normalmente se distribuyen |
Estudiante t-estadístico | β β ^ ^ − − β β 0s.e. ()β β ^ ^ ){displaystyle {frac {fnMicrosoft {beta {fnMicrosoft {\fnMicrosoft {\\fnMicrosoft {\fnMicrosoft {fnMicrosoft {fnMicrosoft {\\fnMicrosoft {\fnMicrosoft {\fnMicrosoft {\\\fnMicrosoft {\\\\\fnMicrosoft {fnMicrosoft {fnMicrosoft {fnMicrosoft {fnMicrosoft {\\\fnMicrosoft {\\\\\\\\fnMicrosoft {fnMicrosoft {fnMicrosoft {fnMicrosoft {fnMicrosoft {fnMicrosoft {fnMicrosoft {\\\\\\fnMicrosoft {fnMicro }-beta - ¿Qué? | la salida del valor estimado de un parámetro de su valor hipotetizado, normalizado por su error estándar. |
Persistente estudiantil | ε ε ^ ^ iσ σ ^ ^ i=Xi− − μ μ ^ ^ iσ σ ^ ^ i{displaystyle {frac {hat {varepsilon - ¿Qué? - Sí. {X_{i}-{hat {m} - ¿Qué? } | Normalización de los residuos cuando se calculan los parámetros, especialmente en diferentes puntos de datos en el análisis de regresión. |
Hora normalizada | μ μ kσ σ k{displaystyle {frac {fnMicroc {fnMicrosoft {fnMicroc} - ¿Qué? | Normalización de los momentos, utilizando la desviación estándar σ σ {displaystyle sigma } como medida de escala. |
Coeficiente de variación | σ σ μ μ {displaystyle {frac {sigma } {mu}} | Normalización de la dispersión, usando la media μ μ {displaystyle mu } como medida de escala, especialmente para la distribución positiva, como la distribución exponencial y la distribución Poisson. |
Escalada de características Min-max | X.=X− − XminXmax− − Xmin{displaystyle X'={frac {X-X_{min }{X_{max }-X_{min } | El escalado de valores se utiliza para introducir todos los valores en el rango [0,1]. Esto también se llama normalización basada en la unidad. Esto puede generalizarse para restringir la gama de valores en el conjunto de datos entre cualquier punto arbitrario a{displaystyle a} y b{displaystyle b}, utilizando por ejemplo X.=a+()X− − Xmin)()b− − a)Xmax− − Xmin{displaystyle X'=a+{frac {left(X-X_{min }right)left(b-aright)}{X_{max }-X_{min }. |
Tenga en cuenta que algunas otras ratios, como la relación de variabilidad a media ()σ σ 2μ μ ){textstyle left({frac {sigma ^{2}{mu }right)}, también se hacen para la normalización, pero no son no dimensionales: las unidades no cancelan, y por lo tanto la relación tiene unidades, y no es invariante de escala.
Otros tipos
Otras normalizaciones no dimensionales que se pueden utilizar sin suposiciones sobre la distribución incluyen:
- Asignación de percentiles. Esto es común en pruebas estandarizadas. Vea también normalización cuntil.
- Normalización añadiendo y/o multiplicando por constantes por lo que los valores caen entre 0 y 1. Esto se utiliza para funciones de densidad de probabilidad, con aplicaciones en campos como la mecánica cuántica para asignar probabilidades a Silencio↑Silencio2.