Glosario de probabilidad y estadística.

format_list_bulleted Contenido keyboard_arrow_down

ImprimirCitar

Lista de definiciones de términos y conceptos en estadísticas y probabilidad

Este glosario de estadística y probabilidad es una lista de definiciones de términos y conceptos utilizados en las ciencias matemáticas de la estadística y la probabilidad, sus subdisciplinas y campos relacionados. Para términos adicionales relacionados, consulte Glosario de matemáticas y Glosario de diseño experimental.

Un

Regla de decisión admisible
álgebra de variables aleatorias
hipótesis alternativas
análisis de las diferencias
evento atómico: Otro nombre para el evento elemental.

B

gráfico de barras
Teorema de Bayes
Estimador de bahías
Factor de bahías
Inferencia bayesiana
parciales: 1. Cualquier característica de una muestra que no sea representativa de la población mayor.; 2. La diferencia entre el valor esperado de un calculador y el valor verdadero.
datos binarios: Datos que pueden tomar sólo dos valores, generalmente representados por los dígitos binarios 0 y 1.
Distribución binomial
análisis bivariable: Un tipo de análisis estadístico cuantitativo en el que se analizan exactamente dos variables, con el fin de determinar la relación empírica entre ellas. Contraste Análisis multivariable.
bloqueo: En el diseño experimental, la organización de unidades experimentales en grupos ("blocks") que son similares entre sí. El bloqueo se utiliza a menudo para manejar el problema de la pseudoreplicación.
Método Box-Jenkins
cuadro

C

estudio causal: Un estudio estadístico en el que el objetivo es medir el efecto de alguna variable en el resultado de una variable diferente. Por ejemplo, un estudio causal podría hacer la pregunta: "¿Cómo se sentirá mi dolor de cabeza si tomo aspirina, contra si no tomo aspirina?" Los estudios causales pueden ser experimentales o observacionales.
límite central teorema
momento central
función característica
distribución de chi-squared
prueba de chi-squared
Análisis de grupos temáticos
muestreo de racimo
evento complementario
diseño completamente aleatorio
Estadísticas computacionales: El estudio de métodos estadísticos que están habilitados mediante métodos computacionales, en la interfaz de las estadísticas y la informática.
concomitantes: En un estudio estadístico, cualquier variable cuyos valores no se ven afectados por tratamientos experimentales, como la edad de una unidad, el género y el nivel de colesterol antes de comenzar una dieta experimental.
Distribución condicional: Dados dos variables distribuidas conjuntamente X y Y, la distribución de probabilidad condicional Y dado X (escrito "Y Silencio X") es la distribución de probabilidad Y cuando X se sabe que es un valor particular.
probabilidad condicional: La probabilidad de algún evento A, asumiendo la ocurrencia del evento B. En la notación matemática, probabilidad condicional está escrito P(ASilencioB), y se lee "la probabilidad de A, dado B".
distribución de probabilidad condicional
intervalo de confianza (CI): In inferential statistics, a range of plausible values for some unknown parameter, such as a population mean, defined as an interval with a lower bound and an upper bound. Los valores precisos de estos límites se calculan a partir de un nivel de confianza predeterminado, elegido por el investigador. El nivel de confianza representa la frecuencia de intervalos que, a largo plazo, captan el verdadero valor del parámetro desconocido; es decir, el 95% de los intervalos de confianza calculados en el nivel de confianza del 95% contienen el verdadero valor, y de igual manera para otros niveles de confianza. Por ejemplo, sobre la base de un estudio de hábitos de sueño entre una muestra aleatoria de 100 personas, un investigador puede estimar en el nivel de confianza del 95% que la población total duerme entre 5 y 9 horas por noche. Hay un 95% de probabilidades de que la verdadera población significa caiga dentro de este intervalo, porque el 95% de las muestras aleatorias tomadas de esta misma población producirá intervalos de confianza del 95% que contienen la verdadera media.
nivel de confianza: Un número que indica la probabilidad de que el intervalo de confianza (rango) captura la verdadera población significa. Por ejemplo, un intervalo de confianza con un nivel de confianza del 95% tiene una probabilidad del 95% de capturar a la población. Técnicamente, esto significa que, si el experimento se repitiera muchas veces, el 95% de las CIs computadas en este nivel contendría la verdadera media poblacional.
confounder: Una variable que influye tanto en la variable dependiente como en la variable independiente, causando una asociación espuria. La existencia de variables ocultas de confusión es una explicación cuantitativa importante por qué la correlación no implica causalidad: si los cambios en dos variables parecen estar correlacionados, es arriesgado suponer que un cambio causa al otro porque es posible que uno o más confundadores no identificados haya causado de hecho los cambios en ambas variables. Un ejemplo clásico es la correlación entre el aumento del consumo de helado y el aumento del crimen en el verano. Es irracional asumir que comer más helado hace que la gente cometa más crimen, o viceversa; es más probable que una o más variables adicionales, por ejemplo, clima más cálido, aumentar el consumo de helado y el crimen simultáneamente. En este ejemplo, el clima más cálido es el confundador.
antes
variable continua
comodidad de muestreo
correlación: Una medida numérica de la fuerza de una relación lineal entre dos variables aleatorias (una puede utilizarla para cuantificar, por ejemplo, cómo el tamaño y la altura de los zapatos están correlacionados en la población). Un ejemplo es el coeficiente de correlación de productos-momento Pearson, que se encuentra dividiendo la covariancia de las dos variables por el producto de sus desviaciones estándar. Las variables independientes, por definición, tienen una correlación de 0. Una correlación de población suele estar representada por el símbolo ${displaystyle rho }$ , y una correlación de muestra por ${displaystyle r}$ .
Contar datos: Datos resultantes de la contabilización, y que por lo tanto pueden tomar sólo valores enteros no negativos.
covariancia: Dado dos variables aleatorias X y Y, con valores esperados ${displaystyle E(X)=mu }$ y ${displaystyle E(Y)=nu }$ , el valor esperado de la variable aleatoria ${displaystyle (X-mu)(Y-nu)}$ , escrito en notación estadística como ${displaystyle operatorname {cov} (X,Y)}$ . La covariancia se utiliza para medir la correlación; se puede interpretar como el grado en que las dos variables cambian simultáneamente entre sí o "covario".

D

datos
Análisis de datos
conjunto de datos: Una muestra y los puntos de datos asociados.
Punto de datos: Una medida de tipo: puede ser un valor booleano, un número real, un vector (en cuyo caso también se llama un vector de datos), etc.
Regla de decisión
teoría de la decisión
grados de libertad
estimación de densidad
dependencia
variable dependiente
estadísticas descriptivas
diseño de experimentos
desviación
variable discreta
parcela
doble contando

E

Evento primario: Un evento que contiene sólo un solo resultado en el espacio de muestra; en un conjunto de posibilidades, una posibilidad que puede ocurrir de una manera precisa. Por ejemplo, al tirar de una carta de una cubierta estándar de tarjetas de juego, 'pulir el gato de espadas' es un evento elemental (porque sólo hay un gato de espadas en toda la cubierta), mientras que 'pulir un rey o un as' no es (porque hay un combinado cuatro reyes y cuatro ases en la cubierta).
teoría de la estimación: La rama de las estadísticas se refiere a la estimación de los valores de los parámetros basados en datos empíricos medidos con un componente aleatorio. Los parámetros describen un entorno físico subyacente de tal manera que sus valores afectan la distribución de los datos medidos; un evaluador intenta utilizar las mediciones para aproximar los parámetros desconocidos.
estimador: Función de los datos conocidos que se utilizan para estimar un parámetro desconocido; una estimación es el resultado de la aplicación efectiva de la función a un determinado conjunto de datos. Por ejemplo, el medio se puede utilizar como calculador.
Valor previsto: La suma de las probabilidades de cada posible resultado de un experimento multiplicado por su correspondiente pago o "valor". Por lo tanto, representa la cantidad promedio uno "espera" para ganar por apuesta si apuestas con probabilidades idénticas se repiten muchas veces. Por ejemplo, el valor esperado de rodar una muerte justa de seis lados es 3.5. El concepto es, intuitivamente, una generalización del promedio ponderado de todos los resultados posibles de un procedimiento o experimento particular, y puede considerarse como la media aritmética de un gran número de realizaciones independientes del experimento. El valor esperado de la variable aleatoria X se escribe normalmente como E(X) para el operador de expectativas, y ${displaystyle mu }$ (mu) para el parámetro.
experimento: Cualquier procedimiento que pueda repetirse infinitamente y que tenga un conjunto bien definido de resultados.
familia exponencial
evento: Un subconjunto del espacio muestral de un procedimiento o experimento (es decir, un posible resultado) al que se puede asignar una probabilidad. Por ejemplo, al rodar un die, "conseguir un tres" es un evento (con una probabilidad de 1.6 si la muerte es justa, como es "conseguir un cinco o un seis" (con una probabilidad de 1.3).

F

Análisis de factores
experimento factorial
frecuencia
Distribución de frecuencias
dominio de frecuencia
inferencia frecuente

G

modelo lineal general
modelo lineal generalizado
datos agrupados

H

histograma: Representación gráfica aproximada de la distribución de datos numéricos. Un histograma muestra esta distribución dividiendo toda la gama de valores en una serie de intervalos consecutivos y no superpuestos y luego contando cuántas instancias del conjunto de datos caen en cada intervalo.

Yo

independencia
variable independiente
rango intercuartil (IQR): Una medida de la dispersión estadística o difusión de un conjunto de datos, definido como la diferencia entre los percentiles 25 y 75 de los datos. Para calcular el IQR, el conjunto de datos se divide en cuatro partes o cuartiles ordenados por rango, los límites entre los cuales, al 25, 50 y 75 percentiles, se denotan ${displaystyle Q}$ ₁, ${displaystyle Q}$ ₂, y ${displaystyle Q}$ ₃, respectivamente; el IQR = ${displaystyle Q}$ ₃ ${displaystyle -}$ ${displaystyle Q}$ ₁.

J

Distribución conjunta: Dado dos variables aleatorias X y Y, la distribución conjunta de X y Y es la distribución de probabilidad de X y Y juntos.
probabilidad conjunta: La probabilidad de dos eventos que ocurren juntos. La probabilidad conjunta de A y B está escrito ${displaystyle P(Acap B)}$ o ${displaystyle P(A, B)}$ .

K

Filtro Kalman
kernel
Estimación de densidad de núcleo
kurtosis: Una medida de la "talle" de la distribución de probabilidad de una variable aleatoria real valorada. Hay diferentes formas de cuantificar, estimar e interpretar la kurtosis, pero una interpretación común es que la kurtosis representa el grado en que la forma de la distribución está influenciada por observaciones extremas infrecuentes (outliers); en este caso, la kurtosis superior significa que más de la varianza se debe a desviaciones extremas infrecuentes, en lugar de desviación de tamaño modesto frecuente.

L

L-moment
ley de grandes números (LLN): Un teorema según el cual el promedio de los resultados obtenidos de realizar el mismo experimento debe estar cerca del valor esperado del experimento, y tiende a acercarse al valor esperado ya que se realizan más ensayos. La ley sugiere que un número suficientemente grande de juicios es necesario para que los resultados de cualquier experimento sean considerados fiables, y por extensión que realizar sólo un pequeño número de ensayos puede producir una interpretación incompleta o engañosa de los resultados del experimento.
función de probabilidad: Una función de probabilidad condicional consideró una función de su segundo argumento con su primer argumento mantenido fijo. Por ejemplo, imagine tirar de una bola numerada con un número k de una bolsa de n bolas, numeradas 1 a n; una función de probabilidad para la variable aleatoria N podría describirse como la probabilidad de tirar k dado que hay n bolas: la probabilidad será 1/n por n mayor o igual a ky 0 para n más pequeño que k. A diferencia de una función de distribución de probabilidad, esta función de probabilidad no sumará hasta 1 en el espacio de la muestra.
función de pérdida
relación de probabilidad prueba

M

M-estimator
Distribución marginal: Dados dos variables distribuidas conjuntamente X y Y, la distribución marginal X es simplemente la distribución de probabilidad X cuando información sobre Y es ignorado.
marginalidad
probabilidad marginal: La probabilidad de un evento dado, ignorando cualquier información sobre otros eventos. La probabilidad marginal de A está escrito P()A). Contraste probabilidad condicional.
Cadena de Markov Monte Carlo
estadísticas matemáticas
estimación máxima de probabilidad
Quiero decir: 1. El valor esperado de una variable aleatoria.; 2. La media aritmética, es decir, el promedio matemático de un conjunto de valores numéricos, calculado dividiendo la suma de los valores por el número de valores.
mediana
mediana desviación absoluta
modo
promedio de movimiento: Una serie de promedios matemáticos o medios de diferentes subconjuntos de un conjunto de datos más grande, generalmente calculado para entender las tendencias en los datos establecidos con el tiempo.
Distribución multimodal
Análisis multivariable
estimación de densidad de núcleo multivariable
variable aleatoria multivariable: Un vector cuyos componentes son variables aleatorias en el mismo espacio de probabilidad.
Exclusividad mutua
independencia mutua: Se dice que una colección de eventos es mutuamente independientes si para cualquier subconjunto de la colección, la probabilidad conjunta de todos los eventos que ocurren es igual al producto de las probabilidades conjuntas de los eventos individuales. Piensa en el resultado de una serie de clips de monedas. Esta es una condición más fuerte que la independencia de pareja.

N

regresión no paramétrica
estadísticas no paramétricas
error de no muestreo
Distribución normal
trama normal de probabilidad
hipótesis nula (H)₀): La declaración que se está probando en una prueba de significación estadística; generalmente una declaración de 'no efecto' o 'no diferencia'. Por ejemplo, en una prueba de si la luz tiene un efecto en el sueño, la hipótesis nula sería que la luz no tiene efecto en el sueño (es decir, los patrones de sueño son los mismos independientemente de las condiciones de iluminación). La hipótesis nula es una expresión de la expectativa de que la variable dependiente no cambiará significativamente a medida que se modifique la variable independiente; el significado estadístico se mide y reporta según el grado en que se cumple esta expectativa. Contraste hipótesis alternativas.

O

opinión pública
decisión óptima
diseño óptimo
más fácil

P

p-value
Parwise independence: Un conjunto de variables aleatorias, de las cuales dos son independientes.
parámetro: Cualquier cantidad medida de una población estadística que resuma o describe un aspecto de la población, por ejemplo, una media o una desviación estándar; a menudo una cantidad que se calcula sobre la base de la cantidad correspondiente calculada mediante la obtención de muestras aleatorias de la población. Puede ser un parámetro de población, un parámetro de distribución, o un parámetro no observado.
filtro de partículas
percentil
Gráfico de tartas
estimación de puntos
poder
probabilidad anterior: En la inferencia bayesiana, se tienen en cuenta creencias anteriores u otra información disponible antes de tener en cuenta nuevos datos o observaciones.
parámetro de población: See parámetro.
probabilidad posterior: El resultado de un análisis bayesiano que encapsula la combinación de creencias anteriores o información (la probabilidad previa) con datos observados.
análisis de componentes principales (PCA)
probabilidad
densidad de probabilidad: La probabilidad en una distribución de probabilidad continua. Por ejemplo, no se puede decir que la probabilidad de que un hombre de seis pies de altura sea del 20%, pero se puede decir que tiene el 20% de probabilidades de ser de entre cinco y seis pies de altura. La densidad de probabilidad es dada por una función de densidad de probabilidad. Contraste masa de probabilidad.
función de densidad de probabilidad: La distribución de probabilidad para una variable aleatoria continua.
Distribución de la probabilidad: Una función que da la probabilidad de todos los elementos en un espacio dado; véase Lista de distribuciones de probabilidad.
Medida de probabilidad: La probabilidad de eventos en un espacio de probabilidad.
trama de probabilidad
espacio de probabilidad: Un espacio de muestra sobre el cual se ha definido una medida de probabilidad.

Q

quantile: Un punto o valor particular en el que el rango de distribución de probabilidad se divide en intervalos continuos con probabilidades iguales, o en los que las observaciones de una muestra se dividen de la misma manera. El número de grupos en los que se divide el rango es siempre uno mayor que el número de quantiles que los divide. Los quantiles de uso común incluyen cuartiles (que dividen un rango en cuatro grupos), deciles (ten grupos), y percentiles (un centenar de grupos). Los propios grupos se denominan mitades, tercios, trimestres, etc., aunque los términos para los quantiles se utilizan a veces para referirse a los grupos, en lugar de a los puntos de corte.
cuartil: Un tipo de cuantil que divide una gama de puntos de datos en cuatro grupos, denominados trimestres, de igual tamaño. Para cualquier conjunto de datos cuartil-dividido, hay exactamente tres cuartiles o puntos de corte que crean los cuatro grupos. El primer cuartil ( ${displaystyle Q}$ ₁) se define como el punto o valor medio de datos que está a medio camino entre el valor más pequeño (mínimo) y la mediana del conjunto de datos, de tal manera que el 25% de los datos se encuentra por debajo de este cuartil. El segundo cuartil ( ${displaystyle Q}$ ₂) es la mediana misma, con el 50 por ciento de los datos debajo de este punto. El tercer cuartil ( ${displaystyle Q}$ ₃) se define como el valor medio entre la mediana y el valor más grande (máximo) del conjunto de datos, de tal manera que el 75% de los datos se encuentra debajo de este cuartil. Debido a que los datos deben ser ordenados de menor a mayor para calcularlos, los cuartiles son un tipo de estadística de orden.
muestreo de cuotas

R

variable aleatoria: Una función medible en un espacio de probabilidad, a menudo real-valorado. La función de distribución de una variable aleatoria da la probabilidad de los diferentes valores de la variable. También se puede derivar la media y la varianza de una variable aleatoria. Vea también variable aleatoria discreta y variable aleatoria continua.
diseño de bloques aleatorios
rango: La longitud del intervalo más pequeño que contiene todos los datos.
estimación Bayesiana recurrente
análisis de regresión
diseño de medidas repetidas
respuesta variable: Cualquier variable cuyo valor se ve o se espera que se vea afectado por un tratamiento experimental, o por cambios en una o más variables; por ejemplo, los niveles de colesterol después de seguir una dieta determinada durante seis meses. Las variables de respuesta son aquellas que cambian o responden a algún fenómeno en estudio. El término se utiliza a menudo intercambiablemente con variable dependiente.
aleatorización restringida
estadísticas sólidas
error redondeado

S

muestra: Esa parte de una población que se observa realmente.
covariancia de la muestra
muestra media: La media aritmética de una muestra de valores extraída de una población, comúnmente denotada por ${displaystyle {overline {x}}}$ . Un ejemplo es la puntuación media de un subconjunto de 10 estudiantes de una clase. El medio de muestra se utiliza como un estimador de la población media, que en este ejemplo sería la puntuación media de prueba de todos los estudiantes de la clase.
muestra espacio: El conjunto de posibles resultados de un experimento. Por ejemplo, el espacio de muestra para rodar una muerte de seis caras será {1, 2, 3, 4, 5, 6}.
muestreo: Un proceso de selección de observaciones para obtener conocimiento sobre una población. Hay muchos métodos para elegir en qué muestra para hacer las observaciones.
bias de muestreo
distribución de muestras: La distribución de probabilidad, bajo muestreo repetido de la población, de una estadística dada.
error de muestreo
Parcela
parámetro escala
nivel de significación
simple muestra aleatoria
Paradoja de Simpson
Skewness: Una medida de la asimetría de la distribución de probabilidad de una variable aleatoria de valor real sobre su media. Roughly speaking, a distribution has positive skew (right-skewed) if the higher tail is longer, and negative skew (left-skewed) if the lower tail is longer. Las distribuciones perfectamente simétricas siempre tienen cero esquejes, aunque la esquedad cero no implica necesariamente una distribución simétrica.
parcela de spaghetti
bias de espectro
Desviación estándar: La medida de dispersión estadística más utilizada. Es la raíz cuadrada de la varianza, y generalmente se denota con la letra griega inferior ${displaystyle sigma }$ (sigma).
error estándar
puntuación estándar
estadística: El resultado de aplicar un algoritmo estadístico a un conjunto de datos. También se puede describir como una variable aleatoria observable.
dispersión estadística
Gráficos estadísticos
Pruebas de hipótesis estadística
independencia estadística: Dos eventos son independientes si el resultado de uno no afecta a la del otro (por ejemplo, conseguir un 1 en un solo rollo de die no afecta la probabilidad de conseguir un 1 en un segundo rollo). Del mismo modo, cuando afirmamos que dos variables aleatorias son independientes, intuitivamente significamos que saber algo sobre el valor de una de ellas no da ninguna información sobre el valor del otro.
inferencia estadística: Inferencia sobre una población basada en una muestra aleatoria extraída de esa población o, más generalmente, sobre un proceso aleatorio de su comportamiento observado durante un período finito de tiempo.
modelo estadístico
Población estadística: Un conjunto de entidades sobre las cuales se deben dibujar inferencias estadísticas, a menudo basadas en muestreo aleatorio. También se puede hablar de una población de mediciones o valores.
dispersión estadística: Una medida de la diversidad dentro de un conjunto de datos, expresado por la varianza o la desviación estándar.
parámetro estadístico: Un parámetro que indexa una familia de distribuciones de probabilidad.
significación estadística
estadísticas
Estudiante t-test
pantalla de tallo y hoja
muestreo estratificado
metodología de estudio
función de supervivencia
sesgo de supervivencia
distribución de probabilidad simétrica
muestreo sistemático

T

prueba estadística
datos de orden: Estándar para estructurar datos tales que "cada variable es una columna, cada observación es una fila, y cada tipo de unidad observacional es una tabla".
dominio del tiempo
series de tiempo
análisis de series temporales
pronóstico de la serie de tiempo
tratamientos: Variables en un estudio estadístico que son conceptualmente manipulables. Por ejemplo, en un estudio de salud, después de una determinada dieta es un tratamiento, mientras que la edad no es.
juicio: Puede referirse a cada repetición individual cuando se habla de un experimento compuesto por cualquier número fijo de ellos. Como ejemplo, se puede pensar que un experimento es cualquier número de uno a otro n Tostadas de monedas, dicen 17. En este caso, se puede llamar un ensayo para evitar confusión, ya que todo el experimento está compuesto por 17.
estimador trimmed
errores tipo I y tipo II

U

distribución de la probabilidad unimodal
unidades: En un estudio estadístico, los objetos a los que se asignan tratamientos. Por ejemplo, en un estudio que examina los efectos de fumar cigarrillos, las unidades serían personas.

V

diferencia: Una medida de su dispersión estadística de una variable aleatoria, indicando cuán lejos del valor esperado sus valores suelen estar. La diferencia de la variable aleatoria X típicamente designada ${displaystyle operatorname {var} (X)}$ , ${displaystyle sigma _{X}^{2}}$ , o simplemente ${displaystyle sigma ^{2}}$

W

aritmética media ponderada
mediana ponderada

X

XOR, disyunción exclusiva

Y

Corrección de Yates para la continuidad, corrección de yules

Z

z-test

Contenido relacionado

Más resultados...