Espacio de probabilidad

format_list_bulleted Contenido keyboard_arrow_down

ImprimirCitar

En la teoría de la probabilidad, un espacio de probabilidad o un triple $(Omega,{mathcal {F}},P)$ de probabilidad es una construcción matemática que proporciona un modelo formal de un proceso aleatorio o "experimento". Por ejemplo, se puede definir un espacio de probabilidad que modele el lanzamiento de un dado.

Un espacio de probabilidad consta de tres elementos:

Un espacio muestral, $Omega$ , que es el conjunto de todos los resultados posibles.
Un espacio de eventos, que es un conjunto de eventos ${ matemáticas {F}}$ , siendo un evento un conjunto de resultados en el espacio muestral.
Una función de probabilidad, que asigna a cada evento en el espacio de eventos una probabilidad, que es un número entre 0 y 1.

Para proporcionar un modelo sensible de probabilidad, estos elementos deben satisfacer una serie de axiomas, detallados en este artículo.

En el ejemplo del lanzamiento de un dado estándar, tomaríamos el espacio muestral como ${ estilo de visualización {1,2,3,4,5,6}}$ . Para el espacio de eventos, podríamos simplemente usar el conjunto de todos los subconjuntos del espacio muestral, que luego contendría eventos simples como ${ estilo de visualización {5 }}$ ("el dado cae en 5"), así como eventos complejos como ${ estilo de visualización {2,4,6}}$ ("el dado cae en un número par"). Finalmente, para la función de probabilidad, asignaríamos cada evento a la cantidad de resultados en ese evento dividido por 6; por ejemplo, ${ estilo de visualización {5 }}$ se asignaría a $1/6$ y ${ estilo de visualización {2,4,6}}$ se asignaría a ${ estilo de visualización 3/6 = 1/2}$ .

Cuando se realiza un experimento, imaginamos que la "naturaleza" "selecciona" un solo resultado, $omega$ , del espacio muestral $Omega$ . Se dice que todos los eventos en el espacio de eventos ${ matemáticas {F}}$ que contienen el resultado seleccionado $omega$ "han ocurrido". Esta "selección" ocurre de tal manera que si el experimento se repitiera muchas veces, el número de ocurrencias de cada evento, como una fracción del número total de experimentos, muy probablemente tendería hacia la probabilidad asignada a ese evento por la probabilidad función $PAG$ _

El matemático ruso Andrey Kolmogorov introdujo la noción de espacio de probabilidad, junto con otros axiomas de probabilidad, en la década de 1930. En la teoría moderna de la probabilidad, existen varios enfoques alternativos para la axiomatización, por ejemplo, el álgebra de variables aleatorias.

Introducción

Un espacio de probabilidad es un triplete matemático $(Omega,{mathcal {F}},P)$ que presenta un modelo para una clase particular de situaciones del mundo real. Al igual que con otros modelos, su autor define en última instancia qué elementos contendrá $Omega$ , ${ matemáticas {F}}$ , y. $PAG$

El espacio muestral $Omega$ es el conjunto de todos los resultados posibles. Un resultado es el resultado de una única ejecución del modelo. Los resultados pueden ser estados de la naturaleza, posibilidades, resultados experimentales y similares. Cada instancia de la situación del mundo real (o ejecución del experimento) debe producir exactamente un resultado. Si los resultados de diferentes ejecuciones de un experimento difieren de alguna manera importante, son resultados distintos. Qué diferencias importan depende del tipo de análisis que queramos hacer. Esto conduce a diferentes opciones de espacio muestral.
El σ-álgebra ${ matemáticas {F}}$ es una colección de todos los eventos que nos gustaría considerar. Esta colección puede o no incluir cada uno de los eventos elementales. Aquí, un "evento" es un conjunto de cero o más resultados; es decir, un subconjunto del espacio muestral. Se considera que un evento ha "sucedido" durante un experimento cuando el resultado de este último es un elemento del evento. Dado que el mismo resultado puede ser miembro de muchos eventos, es posible que hayan ocurrido muchos eventos dado un solo resultado. Por ejemplo, cuando el ensayo consiste en lanzar dos dados, el conjunto de todos los resultados con una suma de 7 puntos puede constituir un evento, mientras que los resultados con un número impar de puntos pueden constituir otro evento. Si el resultado es el elemento del evento elemental de dos pips en el primer dado y cinco en el segundo, entonces ambos eventos, "7 pips" y "
La medida de probabilidad $PAG$ es una función establecida que devuelve la probabilidad de un evento. Una probabilidad es un número real entre cero (los eventos imposibles tienen probabilidad cero, aunque los eventos con probabilidad cero no son necesariamente imposibles) y uno (el evento ocurre casi con seguridad, con certeza casi total). Así $PAG$ es una función ${displaystyle P:{mathcal {F}}to [0,1].}$ La función de medida de probabilidad debe satisfacer dos requisitos simples: Primero, la probabilidad de una unión contable de eventos mutuamente excluyentes debe ser igual a la suma contable de las probabilidades de cada uno de estos eventos. Por ejemplo, la probabilidad de la unión de los eventos mutuamente excluyentes ${text{Cabeza}}$ y ${text{Cola}}$ en el experimento aleatorio de lanzar una moneda, $P({text{Cabeza}}cup {text{Cola}})$ , es la suma de la probabilidad de ${text{Cabeza}}$ y la probabilidad de ${text{Cola}}$ , $P({text{Cabeza}})+P({text{Cola}})$ . Segundo, la probabilidad del espacio muestral $Omega$ debe ser igual a 1 (lo que explica el hecho de que, dada una ejecución del modelo, debe ocurrir algún resultado). En el ejemplo anterior, la probabilidad del conjunto de resultados $P({{text{Cabeza}},{text{Cola}}})$ debe ser igual a uno, porque es completamente seguro que el resultado será ${text{Cabeza}}$ o ${text{Cola}}$ (el modelo descarta cualquier otra posibilidad) en un solo lanzamiento de moneda.

No todos los subconjuntos del espacio muestral $Omega$ deben considerarse necesariamente un evento: algunos de los subconjuntos simplemente no son de interés, otros no se pueden "medir". Esto no es tan obvio en un caso como el lanzamiento de una moneda. En un ejemplo diferente, uno podría considerar longitudes de lanzamiento de jabalina, donde los eventos típicamente son intervalos como "entre 60 y 65 metros" y uniones de tales intervalos, pero no conjuntos como los "números irracionales entre 60 y 65 metros".

Definición

En resumen, un espacio de probabilidad es un espacio de medida tal que la medida de todo el espacio es igual a uno.

La definición ampliada es la siguiente: un espacio de probabilidad es un triple $(Omega,{mathcal {F}},P)$ que consta de:

el espacio muestral $Omega$ , un conjunto arbitrario no vacío,
el σ-álgebra (también llamado σ-campo) — un conjunto de subconjuntos de , llamados eventos, tales que:
- ${ matemáticas {F}}$ contiene el espacio muestral: ${displaystyle Omega in {mathcal {F}}}$ ,
- ${ matemáticas {F}}$ se cierra bajo complementos: si $Ainmathcal{F}$ , entonces también ${displaystyle (Omega setminus A)in {mathcal {F}}}$ ,
- es cerrado bajo uniones contables: si para , entonces también
  - El corolario de las dos propiedades anteriores y la ley de De Morgan es que ${ matemáticas {F}}$ también se cierra bajo intersecciones contables: si ${displaystyle A_{i}in {mathcal {F}}}$ para $i = 1,2,puntos$ , entonces también ${textstyle (bigcap _{i=1}^{infty}A_{i})in {mathcal {F}}}$
la medida de probabilidad — una función en tal que:
- P es contablemente aditivo (también llamado σ-aditivo): si ${displaystyle {A_{i}}_{i=1}^{infty}subseteq {mathcal {F}}}$ es una colección contable de conjuntos disjuntos por pares, entonces ${textstyle P(bigcup_{i=1}^{infty}A_{i})=sum_{i=1}^{infty}P(A_{i}),}$
- la medida de todo el espacio muestral es igual a uno: ${displaystyle P(Omega)=1}$ .

Caso discreto

La teoría de la probabilidad discreta solo necesita como máximo espacios muestrales contables $Omega$ . Las probabilidades se pueden atribuir a puntos de $Omega$ la función de masa de probabilidad ${displaystyle p:Omega to [0,1]}$ tal que ${textstyle sum _{omega in Omega }p(omega)=1}$ . Todos los subconjuntos de $Omega$ pueden tratarse como eventos (por lo tanto, ${displaystyle {mathcal {F}}=2^{Omega }}$ es el conjunto potencia). La medida de probabilidad toma la forma simple

{displaystyle P(A)=sum_{omega in A}p(omega)quad {text{para todos}}Asubseteq Omega.}

El mayor σ-álgebra ${displaystyle {mathcal {F}}=2^{Omega }}$ describe la información completa. En general, un σ-álgebra ${displaystyle {mathcal {F}}subseteq 2^{Omega }}$ corresponde a una partición finita o numerable, siendo ${displaystyle Omega =B_{1}cup B_{2}cup dots }$ la forma general de un evento. Vea también los ejemplos. $Ainmathcal{F}$ ${displaystyle A=B_{k_{1}}taza B_{k_{2}}taza puntos}$

El caso ${displaystyle p(omega)=0}$ está permitido por la definición, pero rara vez se usa, ya $omega$ que puede excluirse con seguridad del espacio muestral.

Caso general

Si Ω es incontable, aun así, puede ocurrir que p (ω) ≠ 0 para algún ω; tales ω se llaman átomos. Son un conjunto como mucho contable (tal vez vacío), cuya probabilidad es la suma de las probabilidades de todos los átomos. Si esta suma es igual a 1, entonces todos los demás puntos pueden excluirse del espacio muestral de manera segura, devolviéndonos al caso discreto. De lo contrario, si la suma de las probabilidades de todos los átomos está entre 0 y 1, entonces el espacio de probabilidad se descompone en una parte discreta (atómica) (quizás vacía) y una parte no atómica.

Caso no atómico

Si p (ω) = 0 para todo ω ∈ Ω (en este caso, Ω debe ser incontable, porque de lo contrario no se podría satisfacer P(Ω) = 1), entonces la ecuación (⁎) falla: la probabilidad de un conjunto no es necesariamente la suma sobre las probabilidades de sus elementos, ya que la suma sólo se define para números contables de elementos. Esto hace que la teoría del espacio de probabilidad sea mucho más técnica. Se aplica una formulación más fuerte que la sumatoria, la teoría de la medida. Inicialmente, las probabilidades se atribuyen a algunos conjuntos "generadores" (ver los ejemplos). Luego, un procedimiento de limitación permite asignar probabilidades a conjuntos que son límites de secuencias de conjuntos generadores, o límites de límites, etc. Todos estos conjuntos son el σ-álgebra ${ matemáticas {F}}$ . Para obtener detalles técnicos, consulte el teorema de extensión de Carathéodory. Los conjuntos pertenecientes a ${ matemáticas {F}}$ se denominan medibles. En general, son mucho más complicados que los grupos electrógenos, pero mucho mejores que los conjuntos no medibles.

Espacio de probabilidad completo

Se ${displaystyle (Omega,;{mathcal {F}},;P)}$ dice que un espacio de probabilidad es un espacio de probabilidad completo si para todo ${displaystyle Bin {mathcal {F}}}$ con ${ estilo de visualización P (B) = 0}$ y todo ${ estilo de visualización A ; subconjunto ; B}$ uno tiene $A in mathcal{F}$ . A menudo, el estudio de los espacios de probabilidad se restringe a espacios de probabilidad completos.

Ejemplos

Ejemplos discretos

Ejemplo 1

Si el experimento consiste en solo lanzar una moneda al aire, entonces el resultado es cara o cruz: ${displaystyle Omega ={{text{H}},{text{T}}}}$ . El σ-álgebra ${displaystyle {mathcal {F}}=2^{Omega }}$ contiene ${ estilo de visualización 2 ^ {2} = 4}$ eventos, a saber: ${displaystyle {{text{H}}}}$ ("cara"), ${ estilo de visualización {{ texto {T}} }}$ ("cruz"), ${}$ ("ni cara ni cruz") y ${displaystyle {{text{H}},{text{T}}}}$ ("cara o cruz"); en otras palabras, ${displaystyle {mathcal {F}}={{},{{text{H}}},{{text{T}}},{{text{H} },{texto{T}}}}}$ . Hay un cincuenta por ciento de posibilidades de sacar cara y un cincuenta por ciento de cruz, por lo que la medida de probabilidad en este ejemplo es ${ estilo de visualización P ( {}) = 0}$ , ${displaystyle P({{text{H}}})=0.5}$ , ${displaystyle P({{text{T}}})=0.5}$ , ${displaystyle P({{text{H}},{text{T}}})=1}$ .

Ejemplo 2

La moneda justa se lanza tres veces. Hay 8 resultados posibles: Ω = {HHH, HHT, HTH, HTT, THH, THT, TTH, TTT} (aquí, "HTH", por ejemplo, significa que la primera vez que la moneda cayó cara, la segunda cruz y la última cabezas de nuevo). La información completa se describe mediante el σ-álgebra ${displaystyle {mathcal {F}}=2^{Omega }}$ de 2 = 256 eventos, donde cada uno de los eventos es un subconjunto de Ω.

Alice solo conoce el resultado del segundo lanzamiento. Por lo tanto, su información incompleta se describe mediante la partición Ω = A ₁ ⊔ A ₂ = {HHH, HHT, THH, THT} ⊔ {HTH, HTT, TTH, TTT}, donde ⊔ es la unión disjunta y el σ-álgebra correspondiente ${displaystyle {mathcal {F}}_{text{Alicia}}={{},A_{1},A_{2},Omega }}$ . Bryan solo conoce el número total de cruces. Su partición contiene cuatro partes: Ω = B ₀ ⊔ B ₁ ⊔ B ₂ ⊔ B ₃ = {HHH} ⊔ {HHT, HTH, THH} ⊔ {TTH, THT, HTT} ⊔ {TTT}; en consecuencia, su σ-álgebra ${displaystyle {mathcal {F}}_{text{Bryan}}}$ contiene 2 = 16 eventos.

Las dos σ-álgebras son incomparables: ni ${displaystyle {mathcal {F}}_{text{Alice}}subseteq {mathcal {F}}_{text{Bryan}}}$ ni ${displaystyle {mathcal {F}}_{text{Bryan}}subseteq {mathcal {F}}_{text{Alice}}}$ ; ambos son sub-σ-álgebras de 2.

Ejemplo 3

Si se extraen al azar 100 votantes de entre todos los votantes de California y se les pregunta por quién votarán para gobernador, entonces el conjunto de todas las secuencias de 100 votantes californianos sería el espacio muestral Ω. Suponemos que se utiliza el muestreo sin reemplazo: solo se permiten secuencias de 100 votantes diferentes. Por simplicidad se considera una muestra ordenada, es decir una secuencia {Alice, Bryan} es diferente de {Bryan, Alice}. También damos por sentado que cada votante potencial conoce exactamente su elección futura, es decir, no elige al azar.

Alice solo sabe si Arnold Schwarzenegger ha recibido o no al menos 60 votos. Su información incompleta se describe mediante el σ-álgebra ${displaystyle {mathcal {F}}_{text{Alicia}}}$ que contiene: (1) el conjunto de todas las secuencias en Ω donde al menos 60 personas votan por Schwarzenegger; (2) el conjunto de todas las secuencias donde menos de 60 votan por Schwarzenegger; (3) todo el espacio muestral Ω; y (4) el conjunto vacío ∅.

Bryan sabe el número exacto de votantes que van a votar por Schwarzenegger. Su información incompleta se describe mediante la partición correspondiente Ω = B ₀ ⊔ B ₁ ⊔ ⋯ ⊔ B ₁₀₀ y el álgebra σ ${displaystyle {mathcal {F}}_{text{Bryan}}}$ consta de 2 eventos.

En este caso, el σ-álgebra de Alice es un subconjunto del de Bryan: ${displaystyle {mathcal {F}}_{text{Alice}}subset {mathcal {F}}_{text{Bryan}}}$ . El σ-álgebra de Bryan es a su vez un subconjunto de la σ-álgebra 2 de "información completa" mucho más grande que consta de 2 eventos, donde n es el número de todos los votantes potenciales en California.

Ejemplos no atómicos

Ejemplo 4

Se elige un número entre 0 y 1 al azar, de manera uniforme. Aquí Ω = [0,1], ${ matemáticas {F}}$ es el σ-álgebra de los conjuntos de Borel en Ω, y P es la medida de Lebesgue en [0,1].

En este caso los intervalos abiertos de la forma (a, b), donde 0 < a < b < 1, podrían tomarse como conjuntos generadores. A cada conjunto de este tipo se le puede atribuir la probabilidad de P ((a, b)) = (b − a), lo que genera la medida de Lebesgue en [0,1] y el σ-álgebra de Borel en Ω.

Ejemplo 5

Una moneda justa se lanza al aire sin cesar. Aquí se puede tomar Ω = {0,1}, el conjunto de todas las secuencias infinitas de números 0 y 1. Conjuntos de cilindros {(x ₁, x ₂,...) ∈ Ω: x ₁ = a ₁,..., x _n = a _n } pueden usarse como grupos electrógenos. Cada uno de estos conjuntos describe un evento en el que los primeros n lanzamientos han resultado en una secuencia fija (a ₁,..., a _n), y el resto de la secuencia puede ser arbitraria. A cada evento de este tipo se le puede dar naturalmente la probabilidad de 2.

Estos dos ejemplos no atómicos están estrechamente relacionados: una secuencia (x ₁, x ₂,...) ∈ {0,1} conduce al número 2 x ₁ + 2 x ₂ + ⋯ ∈ [0,1]. Esta no es una correspondencia uno a uno entre {0,1}y [0,1] sin embargo: es un isomorfismo módulo cero, lo que permite tratar los dos espacios de probabilidad como dos formas del mismo espacio de probabilidad. De hecho, todos los espacios de probabilidad no atómicos no patológicos son iguales en este sentido. Son los llamados espacios de probabilidad estándar. Las aplicaciones básicas de los espacios de probabilidad son insensibles a la estandarización. Sin embargo, el condicionamiento no discreto es fácil y natural en espacios de probabilidad estándar, de lo contrario se vuelve oscuro.

Conceptos relacionados

Distribución de probabilidad

Cualquier distribución de probabilidad define una medida de probabilidad.

Variables aleatorias

Una variable aleatoria X es una función medible X: Ω → S del espacio muestral Ω a otro espacio medible S llamado espacio de estado.

Si A ⊂ S, la notación Pr(X ∈ A) es una forma abreviada de uso común para ${displaystyle Pr({omega in Omega:X(omega)in A})}$ .

Definición de los eventos en términos del espacio muestral

Si Ω es contable, casi siempre lo definimos ${ matemáticas {F}}$ como el conjunto potencia de Ω, es decir, ${displaystyle {mathcal {F}}=2^{Omega }}$ que es trivialmente una σ-álgebra y la más grande que podemos crear usando Ω. Por lo tanto, podemos omitir ${ matemáticas {F}}$ y simplemente escribir (Ω,P) para definir el espacio de probabilidad.

Por otro lado, si Ω es incontable y lo usamos ${displaystyle {mathcal {F}}=2^{Omega }}$ , tenemos problemas para definir nuestra medida de probabilidad P porque ${ matemáticas {F}}$ es demasiado "grande", es decir, a menudo habrá conjuntos a los que será imposible asignar una única medida. En este caso, tenemos que usar una σ-álgebra más pequeña ${ matemáticas {F}}$ , por ejemplo, el álgebra de Borel de Ω, que es la σ-álgebra más pequeña que hace que todos los conjuntos abiertos sean medibles.

La probabilidad condicional

La definición de Kolmogorov de espacios de probabilidad da lugar al concepto natural de probabilidad condicional. Todo conjunto A con probabilidad distinta de cero (es decir, P (A) > 0) define otra medida de probabilidad

{displaystyle P(B|A)={P(Bcap A) sobre P(A)}}

en el espacio Esto generalmente se pronuncia como la "probabilidad de B dada A ".

Para cualquier evento B tal que P (B) > 0 la función Q definida por Q (A) = P (A | B) para todos los eventos A es en sí misma una medida de probabilidad.

Independencia

Se dice que dos eventos, A y B, son independientes si P (A ∩ B) = P (A) P (B).

Se dice que dos variables aleatorias, X e Y, son independientes si cualquier evento definido en términos de X es independiente de cualquier evento definido en términos de Y. Formalmente, generan σ-álgebras independientes, donde se dice que dos σ-álgebras G y H, que son subconjuntos de F, son independientes si cualquier elemento de G es independiente de cualquier elemento de H.

Exclusividad mutua

Se dice que dos eventos, A y B, son mutuamente excluyentes o disjuntos si la ocurrencia de uno implica la no ocurrencia del otro, es decir, su intersección es vacía. Esta es una condición más fuerte que la probabilidad de que su intersección sea cero.

Si A y B son eventos disjuntos, entonces P (A ∪ B) = P (A) + P (B). Esto se extiende a una secuencia de eventos (finita o contablemente infinita). Sin embargo, la probabilidad de la unión de un conjunto incontable de eventos no es la suma de sus probabilidades. Por ejemplo, si Z es una variable aleatoria normalmente distribuida, entonces P (Z = x) es 0 para cualquier x, pero P (Z ∈ R) = 1.

El evento A ∩ B se denomina " A y B ", y el evento A ∪ B como " A o B ".

Contenido relacionado

Más resultados...