Media (estadística)
En matemáticas y estadística, la media aritmética o promedio, o simplemente la media, es la suma de una colección de números dividida por la cuenta de números en la colección. La colección suele ser un conjunto de resultados de un experimento o un estudio de observación, o con frecuencia un conjunto de resultados de una encuesta. El término 'media aritmética' se prefiere en algunos contextos de matemáticas y estadísticas, porque ayuda a distinguirlo de otras medias, como la media geométrica y la media armónica.
Además de las matemáticas y la estadística, la media aritmética se usa con frecuencia en muchos campos diversos, como la economía, la antropología y la historia, y se usa en casi todos los campos académicos hasta cierto punto. Por ejemplo, el ingreso per cápita es el ingreso promedio aritmético de la población de una nación.
Si bien la media aritmética se usa a menudo para informar tendencias centrales, no es una estadística sólida, lo que significa que está muy influenciada por valores atípicos (valores que son mucho más grandes o más pequeños que la mayoría de los valores). Para distribuciones sesgadas, como la distribución de ingresos para la cual los ingresos de algunas personas son sustancialmente mayores que los de la mayoría de las personas, la media aritmética puede no coincidir con la noción de "medio" y las estadísticas robustas, como la mediana, pueden proporcionar una mejor descripción. de tendencia central.
Definición
Dado un conjunto de datos , la media aritmética (o media o promedio), denotada (leer bar ), es la media de la valores .
La media aritmética es la medida de tendencia central más utilizada y fácilmente comprensible en un conjunto de datos. En estadística, el término promedio se refiere a cualquiera de las medidas de tendencia central. La media aritmética de un conjunto de datos observados se define como igual a la suma de los valores numéricos de todas y cada una de las observaciones, dividida por el número total de observaciones. Simbólicamente, si tenemos un conjunto de datos formado por los valores , entonces la media aritmética se define por la fórmula: (para obtener una explicación del operador de suma, consulte suma).
Por ejemplo, considere el salario mensual de 10 empleados de una empresa: 2500, 2700, 2400, 2300, 2550, 2650, 2750, 2450, 2600, 2400. La media aritmética es
Si el conjunto de datos es una población estadística (es decir, consta de todas las observaciones posibles y no solo de un subconjunto de ellas), entonces la media de esa población se denomina media de la población y se denota con la letra griega . Si el conjunto de datos es una muestra estadística (un subconjunto de la población), entonces llamamos a la estadística resultante de este cálculo media muestral (que para un conjunto de datos se denota como ).
La media aritmética se puede definir de manera similar para vectores en múltiples dimensiones, no solo para valores escalares; esto a menudo se denomina centroide. De manera más general, debido a que la media aritmética es una combinación convexa (los coeficientes suman 1), se puede definir en un espacio convexo, no solo en un espacio vectorial.
Propiedades motivadoras
La media aritmética tiene varias propiedades que la hacen útil, especialmente como medida de tendencia central. Éstas incluyen:
- si los números tener mala , entonces . Ya que es la distancia de un número dado a la media, una forma de interpretar esta propiedad es decir que los números a la izquierda de la media están equilibrados por los números a la derecha de la media. La media es el único número único para el cual los residuos (desviaciones de la estimación) suman cero.
- Si se requiere usar un solo número como valor "típico" para un conjunto de números conocidos , entonces la media aritmética de los números hace esto mejor, en el sentido de minimizar la suma de las desviaciones al cuadrado del valor típico: la suma de . (De ello se deduce que la media de la muestra también es el mejor predictor individual en el sentido de que tiene el error cuadrático medio de la raíz más bajo) . de una muestra extraída de la población.
Contraste con la mediana
La media aritmética se puede contrastar con la mediana. La mediana se define de tal manera que no más de la mitad de los valores son mayores que la mediana y no más de la mitad son menores que la mediana. Si los elementos de los datos aumentan aritméticamente, cuando se colocan en algún orden, entonces la mediana y el promedio aritmético son iguales. Por ejemplo, considere la muestra de datos . el promedio es , como es la mediana. Sin embargo, cuando consideramos una muestra que no se puede ordenar para aumentar aritméticamente, como , la mediana y el promedio aritmético pueden diferir significativamente. En este caso, el promedio aritmético es 6,2, mientras que la mediana es 4. En general, el valor promedio puede variar significativamente de la mayoría de los valores de la muestra y puede ser mayor o menor que la mayoría de ellos.
Hay aplicaciones de este fenómeno en muchos campos. Por ejemplo, desde la década de 1980, el ingreso medio en los Estados Unidos ha aumentado más lentamente que el promedio aritmético de ingresos.
Generalizaciones
Peso promedio
Un promedio ponderado, o media ponderada, es un promedio en el que algunos puntos de datos cuentan más que otros, ya que se les da más peso en el cálculo. Por ejemplo, la media aritmética de y es , o equivalente . Por el contrario, una media ponderada en la que el primer número recibe, por ejemplo, el doble de peso que el segundo (quizás porque se supone que aparece con el doble de frecuencia en la población general de la que se tomaron muestras de estos números) se calcularía como . Aquí los pesos, que necesariamente suman el valor uno, son y , siendo el primero el doble del segundo. La media aritmética (a veces llamada "promedio no ponderado" o "promedio igualmente ponderado") se puede interpretar como un caso especial de un promedio ponderado en el que todos los pesos son iguales entre sí (igual a en el ejemplo anterior, e igual a en una situación con números que se promedian).
Distribuciones de probabilidad continuas
Si una propiedad numérica, y cualquier muestra de datos de ella, pudiera tomar cualquier valor de un rango continuo, en lugar de, por ejemplo, solo números enteros, entonces la probabilidad de que un número caiga en algún rango de valores posibles se puede describir integrando una distribución de probabilidad continua a lo largo de este rango, incluso cuando la probabilidad ingenua para un número de muestra que toma un cierto valor de infinitos muchos es cero. El análogo de un promedio ponderado en este contexto, en el que hay un número infinito de posibilidades para el valor preciso de la variable en cada rango, se llama la media de la distribución de probabilidad .. Una distribución de probabilidad más común se llama distribución normal; tiene la propiedad de que todas las medidas de su tendencia central, incluyendo no sólo la media sino también la mencionada mediana y la moda (las tres M ), son iguales entre sí. Esta igualdad no se cumple para otras distribuciones de probabilidad, como se ilustra aquí para la distribución logarítmica normal.
Anglos
Se debe tener especial cuidado al utilizar datos cíclicos, como fases o ángulos. Tomando ingenuamente la media aritmética de 1° y 359° se obtiene un resultado de 180°. Esto es incorrecto por dos razones:
- En primer lugar, las medidas de ángulo solo se definen hasta una constante aditiva de 360° (o 2π, si se mide en radianes). Así, uno podría llamarlos fácilmente 1° y −1°, o 361° y 719°, ya que cada uno de ellos da un promedio diferente.
- En segundo lugar, en esta situación, 0° (equivalente a 360°) es geométricamente un valor promedio mejor : hay una menor dispersión al respecto (los puntos están a 1° de él y a 179° de 180°, el promedio putativo).
En la aplicación general, tal descuido conducirá a que el valor promedio se desplace artificialmente hacia la mitad del rango numérico. Una solución a este problema es utilizar la formulación de optimización (es decir, definir la media como el punto central: el punto alrededor del cual se tiene la dispersión más baja) y redefinir la diferencia como una distancia modular (es decir, la distancia en el círculo : entonces la distancia modular entre 1° y 359° es 2°, no 358°).
Símbolos y codificación
La media aritmética a menudo se denota con una barra (también conocida como vinculum o macron), por ejemplo, como en{\ estilo de visualización {\ barra {x}}}(leer{\ estilo de visualización x} barra ).
Es posible que algunos programas (procesadores de texto, navegadores web) no muestren el símbolo x̄ correctamente. Por ejemplo, el símbolo x̄ en HTML es en realidad una combinación de dos códigos: la letra base x más un código para la línea anterior (̄ o ¯).
En algunos textos, como los pdf, el símbolo x̄ puede reemplazarse por un símbolo de centavo (¢) (Unicode ¢), cuando se copia a un procesador de texto como Microsoft Word.
Contenido relacionado
Ciencias formales
Estadística matemática
Teoría estadística
Distribución logarítmica normal
Historia de la medición