Função de distribuição cumulativa
Em teoria e estatísticas de probabilidade, o função de distribuição cumulativa (CDF) de uma variável aleatória real X- Sim., ou apenas função de distribuição de X- Sim., avaliado em xNão., é a probabilidade que X- Sim. terá um valor inferior ou igual a xNão..
Cada distribuição de probabilidade suportada nos números reais, discreta ou "misturada", bem como contínua, é identificada exclusivamente por uma função crescente monotone contínua direita (uma função càdlàg) F:R→ → Não.0,1]{displaystyle F:mathbb [R] satisfazendo Limpar.x→ → - Sim. - Sim. ∞ ∞ F(x)= = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = =0{displaystyle lim _{xrightarrow -infty }F(x)=0} e Limpar.x→ → ∞ ∞ F(x)= = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = =1{displaystyle lim _{xrightarrow infty }F(x)=1}.
No caso de uma distribuição contínua escalar, ele dá a área sob a função de densidade de probabilidade de menos infinito a xNão.. Também são utilizadas funções de distribuição cumulativa para especificar a distribuição de variáveis aleatórias multivariadas.
Definição
A função de distribuição cumulativa de uma variável aleatória real X- Sim. é a função dada por
FX(x)= = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = =P (X≤ ≤ x)Não. F_{X}(x)=operatorname (P} (Xleq x)} | (Eq.1) |
onde o lado direito representa a probabilidade de que a variável aleatória X- Sim. assume um valor inferior ou igual a xNão..
A probabilidade de X- Sim. reside no intervalo semi-fechado (um,b)](a,b)}, onde <math alttext="{displaystyle aum<b)- Sim.<img alt="a, é, portanto,
<math alttext="{displaystyle operatorname {P} (aP (um<X≤ ≤ b))= = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = =FX(b))- Sim. - Sim. FX(um){displaystyle operatorname} {P} (a<Xleq b)=F_{X}(b)-F_{X}(a)} <img alt="{displaystyle operatorname {P} (a | (Eq.2) |
Na definição acima, o "menor ou igual a" O sinal, "≤", é uma convenção, não universalmente usada (por exemplo, a literatura húngara usa "<"), mas a distinção é importante para distribuições discretas. O uso adequado das tabelas das distribuições binomial e de Poisson depende dessa convenção. Além disso, fórmulas importantes, como a fórmula de inversão de Paul Lévy para a função característica, também dependem do "menor que ou igual" formulação.
Se tratar várias variáveis aleatórias X,Y,...... {displaystyle X,Y,ldots } etc. as letras correspondentes são usadas como subscrições enquanto, se tratando apenas uma, o subscrito é geralmente omitido. É convencional usar uma capital FNão. para uma função de distribuição cumulativa, em contraste com a minúscula fNão. usado para funções de densidade de probabilidade e funções de massa de probabilidade. Isso se aplica ao discutir distribuições gerais: algumas distribuições específicas têm sua própria notação convencional, por exemplo, a distribuição normal usa Φ Φ Não. Não. e φ φ - Sim. em vez de FNão. e fNão., respectivamente.
A função de densidade de probabilidade de uma variável aleatória contínua pode ser determinada a partir da função de distribuição cumulativa diferenciando usando o teorema Fundamental de Calculus; ou seja, dada F(x)(x)},
O CDF de uma variável aleatória contínua X- Sim. pode ser expressa como a integral de sua função de densidade de probabilidade fXNão. f_{X}} da seguinte forma:
No caso de uma variável aleatória X- Sim. que tem distribuição com um componente discreto em um valor b)Não.,
Se FXNão. F_{X}} é contínuo em b)Não., isto equivale a zero e não há nenhum componente discreto em b)Não..
Propriedades
Cada função de distribuição cumulativa FXNão. F_{X}} é não crescente e contínuo direito, o que o torna uma função càdlàg. Além disso,
Toda função com essas quatro propriedades é um CDF, ou seja, para cada uma dessas funções, uma variável aleatória pode ser definida de modo que a função seja a função de distribuição cumulativa dessa variável aleatória.
Se X- Sim. é uma variável aleatória puramente discreta, então atinge valores x1,x2,...... {displaystyle x_{1},x_{2},ldots } com probabilidade pEu...= = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = =p(xEu...)Não. p_{i}=p(x_{i})}, e o CDF de X- Sim. será descontinuado nos pontos xEu...Não. x_{i}}:
Se o CDF FXNão. F_{X}} de uma variável aleatória real valorizada X- Sim. é contínuo, então X- Sim. é uma variável aleatória contínua; se além disso FXNão. F_{X}} é absolutamente contínuo, então existe uma função Lebesgue-integrável fX(x)(x)} tal que
Se X- Sim. tem L1-norm finito, ou seja, a expectativa de |X||X|} é finito, então a expectativa é dada pela integral de Riemann-Stieltjes
Em particular, temos
Exemplos
Como um exemplo, suponha X- Sim. é uniformemente distribuído no intervalo da unidade Não.0,1][0,1]}.
Então o CDF de X- Sim. é dado por
Suponha que em vez disso X- Sim. leva apenas os valores discretos 0 e 1, com probabilidade igual.
Então o CDF de X- Sim. é dado por
Suponha X- Sim. é distribuído exponencialmente. Então o CDF de X- Sim. é dado por
Aqui λ > 0 é o parâmetro da distribuição, geralmente chamado de parâmetro de taxa.
Suponha X- Sim. é distribuído normal. Então o CDF de X- Sim. é dado por
Aqui o parâmetro μ μ - Sim. é a média ou expectativa da distribuição; e σ σ - Sim. é seu desvio padrão.
Uma tabela do CDF da distribuição normal padrão é frequentemente usada em aplicações estatísticas, onde é chamada de tabela normal padrão, tabela normal unitária ou tabela Z.
Suponha X- Sim. é distribuído binomial. Então o CDF de X- Sim. é dado por
Aqui. pNão. é a probabilidade de sucesso e a função denota a distribuição de probabilidade discreta do número de sucessos em uma sequência de nNão. experiências independentes, e ? ? kGerenciamento de contas Gerenciamento de contas {displaystyle lfloor krfloor } é o "floor" abaixo kNão., ou seja, o maior inteiro menos ou igual a kNão..
Funções derivadas
Função de distribuição cumulativa complementar (distribuição de cauda)
Às vezes, é útil estudar a questão oposta e perguntar com que frequência a variável aleatória está acima de um determinado nível. Isso é chamado de função de distribuição cumulativa complementar (ccdf) ou simplesmente a distribuição de cauda ou excedência e é definido como
Isso tem aplicações em testes estatísticos de hipóteses, por exemplo, porque o valor p unilateral é a probabilidade de observar uma estatística de teste pelo menos tão extremo quanto o observado. Assim, desde que o teste estatístico, T, tem uma distribuição contínua, o valor p unilateral é simplesmente dado pelo ccdf: para um valor observado )Não. da estatística de teste
Na análise de sobrevivência, F? ? X(x)(x)} é chamado de função de sobrevivência e denotado S(x)(x)}, enquanto o termo função de confiabilidade é comum em engenharia.
- Propriedades
- Para uma variável aleatória contínua não negativa com expectativa, a desigualdade de Markov afirma que F? ? X(x)≤ ≤ E (X)x.{displaystyle {bar {F}}_{X}(x)leq {frac {operatorname {E} (X)}{x}}.}
- Como x→ → ∞ ∞ ,F? ? X(x)→ → 0{displaystyle xto infty{bar {F}}_{X}(x)to 0}e de facto F? ? X(x)= = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = =o(1/x)(x)=o(1/x)} desde que E (X){displaystyle operatorname {E} (X)} é finito.
Prova:
Assumindo X- Sim. tem uma função de densidade fXNão. f_{X}}, para qualquer 0}" xmlns="http://www.w3.org/1998/Math/MathML">c>0- Sim.0 " aria-hidden="true" class="mwe-math-fallback-image-inline" src="https://wikimedia.org/api/rest_v1/media/math/render/svg/2ba126f626d61752f62eaacaf11761a54de4dc84" style="vertical-align: -0.338ex; width:5.268ex; height:2.176ex;"/>
Então, em reconhecerE (X)= = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = =∫ ∫ 0∞ ∞ xfX(x)Dx≥ ≥ ∫ ∫ 0cxfX(x)Dx+c∫ ∫ c∞ ∞ fX(x)Dx{displaystyle operatorname} {E} (X)=int _{0}^{infty }xf_{X}(x),dxgeq int _{0}^{c}xf_{X}(x),dx+cint _{c}^{infty }f_{X}(x),dx}e termos de rearranjo,F? ? X(c)= = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = =∫ ∫ c∞ ∞ fX(x)Dx{displaystyle {bar {F}}_{X}(c)=int _{c}^{infty }f_{X}(x),dx}como reivindicado.0≤ ≤ cF? ? X(c)≤ ≤ E (X)- Sim. - Sim. ∫ ∫ 0cxfX(x)Dx→ → 0comoc→ → ∞ ∞ {displaystyle 0leq c{bar {F}}_{X}(c)leq operatorname {E} (X)-int _{0}^{c}xf_{X}(x),dxto 0{text{ as }}cto infty } - Para uma variável aleatória com expectativa, e para uma variável aleatória não negativa o segundo termo é 0.E (X)= = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = =∫ ∫ 0∞ ∞ F? ? X(x)Dx- Sim. - Sim. ∫ ∫ - Sim. - Sim. ∞ ∞ 0FX(x)Dx{displaystyle operatorname} {E} (X)=int _{0}^{infty }{bar {F}}_{X}(x),dx-int _{-infty }^{0}F_{X}(x),dx}
Se a variável aleatória só pode tomar valores inteiros não negativos, isso equivale aE (X)= = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = =Gerenciamento Gerenciamento n= = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = =0∞ ∞ F? ? X(n).{displaystyle operatorname} {E} (X)=sum _{n=0}^{infty }{bar {F}}_{X}(n).}
Distribuição cumulativa dobrada
Enquanto o enredo de uma distribuição cumulativa FNão. muitas vezes tem uma forma semelhante a S, uma ilustração alternativa é o distribuição cumulativa dobrada ou lote de montanha, que dobra a metade superior do gráfico sobre, que é
- 0.5}}}" xmlns="http://www.w3.org/1998/Math/MathML">Ffold(x)= = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = =F(x)1(F(x)≤ ≤ 0,5?+(1- Sim. - Sim. F(x))1(F(x)>0,5?{displaystyle F_{text{fold}}(x)=F(x)1_{{F(x)leq 0.5}}+(1-F(x)1_{{F(x)>0.5}}}
0.5}}}" aria-hidden="true" class="mwe-math-fallback-image-inline" src="https://wikimedia.org/api/rest_v1/media/math/render/svg/64fb171fc50495773d22a592a91603af18b6170b" style="vertical-align: -1.171ex; width:48.811ex; height:3.176ex;"/>
Onde? 1(A?Não. 1_ denota a função indicadora e o segundo summand é a função sobrevivente, assim usando duas escalas, uma para o upslope e outra para o downslope. Esta forma de ilustração enfatiza a mediana, dispersão (especificamente, o desvio absoluto médio da mediana) e cegueira da distribuição ou dos resultados empíricos.
Função de distribuição inversa (função quantílica)
Se o CDF F é estritamente crescente e contínua, então F- Sim. - Sim. 1(p),p∈ ∈ Não.0,1],(p),pin [0,1],} é o número real único xNão. tal que F(x)= = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = =p(x)=p}. Isso define o função de distribuição inversa ou função quantil.
Algumas distribuições não têm um inverso único (por exemplo, se fX(x)= = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = =0(x)=0} para todos <math alttext="{displaystyle a<xum<x<b)- Sim.<img alt="a<x, causando FXNão. F_{X}} para ser constante). Neste caso, pode-se usar o função de distribuição inversa generalizada, que é definido como
- F- Sim. - Sim. 1(p)= = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = =inf(x∈ ∈ R:F(x)≥ ≥ p?,Gerenciamento de contas Gerenciamento de contas p∈ ∈ Não.0,1].Não. F^{-1}(p)=inf{xin mathbb {R}:F(x)geq p},quad forall pin [0,1]. ?
- Exemplo 1: A mediana é F- Sim. - Sim. 1(0,5)(0.5)}.
- Exemplo 2: Colocar ? ? = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = =F- Sim. - Sim. 1(0,95)(0.95)}. Depois ligamos. ? ? - Sim. o percentil 95.
Algumas propriedades úteis do cdf inverso (que também são preservadas na definição da função de distribuição inversa generalizada) são:
- F- Sim. - Sim. 1Não. F^{-1}} não é crescente
- F- Sim. - Sim. 1(F(x))≤ ≤ x(F(x)leq x}
- F(F- Sim. - Sim. 1(p))≥ ≥ p(F^{-1}(p)geq p}
- F- Sim. - Sim. 1(p)≤ ≤ x{displaystyle F^{-1}(p)leq x} se e somente se p≤ ≤ F(x)(x)}
- Se YNão. Sim. tem um UNão.0,1]- Sim. distribuição em seguida F- Sim. - Sim. 1(Y)(Y)} é distribuído como FNão.. Isso é usado na geração de números aleatórios usando o método inverso de amostragem.
- Se (Xα α ?Não. O que é? }}} é uma coleção de independente FNão.-variáveis aleatórias distribuídas definidas no mesmo espaço amostral, existem variáveis aleatórias Yα α Não. Sim. tal que Yα α Não. Sim. é distribuído como UNão.0,1]- Sim. e F- Sim. - Sim. 1(Yα α )= = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = =Xα α Não. F^{-1}(Y_{alpha) }=X_{alpha }} com probabilidade 1 para todos α α - Sim..
O inverso do cdf pode ser usado para traduzir os resultados obtidos para a distribuição uniforme para outras distribuições.
Função de distribuição empírica
A função de distribuição empírica é uma estimativa da função de distribuição cumulativa que gerou os pontos na amostra. Converge com probabilidade 1 para essa distribuição subjacente. Existem vários resultados para quantificar a taxa de convergência da função de distribuição empírica para a função de distribuição cumulativa subjacente.
Caso multivariado
Definição para duas variáveis aleatórias
Ao lidar simultaneamente com mais de uma variável aleatória função de distribuição cumulativa conjunta também pode ser definido. Por exemplo, para um par de variáveis aleatórias X,Y- Sim., o CDF conjunto FXYNão. F_{XY}} é dado por
FX,Y(x,Sim.)= = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = =P (X≤ ≤ x,Y≤ ≤ Sim.)Não. F_{X, Y}(x,y)=operatorname {P} (Xleq x,Yleq y)} | (Eq.3) |
onde o lado direito representa a probabilidade de que a variável aleatória X- Sim. assume um valor inferior ou igual a xNão. e que YNão. Sim. assume um valor inferior ou igual a Sim.- Sim..
Exemplo de função de distribuição cumulativa conjunta:
Para duas variáveis contínuas X e Y:
Para duas variáveis aleatórias discretas, é benéfico gerar uma tabela de probabilidades e abordar a probabilidade cumulativa para cada intervalo potencial de X e Y, e aqui está o exemplo:
dada a função de massa de probabilidade conjunta em forma de tabela, determine a função de distribuição cumulativa conjunta.
Y = 2 | Y = 4 | Y = 6 | Y = 8 | |
X = 1 | 0 | 0.1 | 0 | 0.1 |
X = 3 | 0 | 0 | 0,2 | 0 |
X = 5 | 0 | 0 | 0 | 0,15 |
X = 7 | 0 | 0 | 0,15 | 0 |
Solução: usando a tabela de probabilidades fornecida para cada intervalo potencial de X e Y, a função de distribuição cumulativa conjunta pode ser construída em forma de tabela:
Y < 2 | 2 ≤ Y < 4 | 4 ≤ Y < 6 | 6 ≤ Y < 8 | Y ≥ 8 | |
X < 1 | 0 | 0 | 0 | 0 | 0 |
1 ≤ X < 3 | 0 | 0 | 0.1 | 0.1 | 0,2 |
3 ≤ X < 5 | 0 | 0 | 0.1 | 0 | 0 |
5 ≤ X < 7 | 0 | 0 | 0 | 0.6 | 0,85 |
X ≥ 7 | 0 | 0 | 0 | 0,75 | 1 |
Definição para mais de duas variáveis aleatórias
Para NNão. variáveis aleatórias X1,...... ,XN{displaystyle X_{1},ldotsX_{N}}, o CDF conjunto FX1,...... ,XNNão. F_{X_{1},ldotsX_{N}}} é dado por
FX1,...... ,XN(x1,...... ,xN)= = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = =P (X1≤ ≤ x1,...... ,XN≤ ≤ xN)Não. F_{X_{1},ldotsX_{N}}(x_{1},ldotsx_{N})=operatorname {P} (X_{1}leq x_{1},ldotsX_{N}leq x_{N})} | (Eq.4) |
Interpretação NNão. variáveis aleatórias como um vetor aleatório X= = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = =(X1,...... ,XN)T{displaystyle mathbf] {X} =(X_{1},ldotsX_{N})^{T}} produz uma notação mais curta:
Propriedades
Todo CDF multivariado é:
- Monotonicamente não crescente para cada uma de suas variáveis,
- Contínua direita em cada uma de suas variáveis,
- 0≤ ≤ FX1...... Xn(x1,...... ,xn)≤ ≤ 1,{displaystyle 0leq F_{X_{1}ldots X_{n}}(x_{1},ldotsx_{n})leq 1,}
- Limpar.x1,...... ,xn→ → +∞ ∞ FX1...... Xn(x1,...... ,xn)= = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = =1eLimpar.xEu...→ → - Sim. - Sim. ∞ ∞ FX1...... Xn(x1,...... ,xn)= = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = =0,para todosEu....{displaystyle lim _{x_{1},ldotsx_{n}rightarrow +infty }F_{X_{1}ldots X_{n}}(x_{1},ldotsx_{n})=1{text{ e }}lim _{x_{i}rightarrow -infty }F_{X_{1}ldots X_{n}}(x_{1},ldotsx_{n})=0,{text{para todos }}i.}
Nem todas as funções que satisfazem as quatro propriedades acima são um CDF multivariado, diferentemente no caso de dimensão única. Por exemplo, deixe F(x,Sim.)= = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = =0(x,y)=0} para <math alttext="{displaystyle xx<0- Sim.<img alt="x ou <math alttext="{displaystyle x+yx+Sim.<1{displaystyle x+y<1}}<img alt="{displaystyle x+y ou <math alttext="{displaystyle ySim.<0- Sim.<img alt="{displaystyle y e deixar F(x,Sim.)= = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = =1(x,y)=1} Caso contrário. É fácil ver que as condições acima são atendidas, e ainda FNão. não é um CDF desde que se fosse, então <math alttext="{textstyle operatorname {P} left({frac {1}{3}}<Xleq 1,{frac {1}{3}}P (13<X≤ ≤ 1,13<Y≤ ≤ 1)= = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = =- Sim. - Sim. 1Nome do operador {P} left({frac {1}{3}}<Xleq 1,{frac {1}{3}}<Yleq 1right)=-1}<img alt="{textstyle operatorname {P} left({frac {1}{3}}<Xleq 1,{frac {1}{3}} como explicado abaixo.
A probabilidade de um ponto pertencer a um hiperretângulo é análoga ao caso unidimensional:
Caso complexo
Variável aleatória complexa
A generalização da função de distribuição cumulativa de variáveis aleatórias reais a complexas não é óbvia porque expressões da forma P(Z.≤ ≤ 1+2Eu...)(Zleq 1+2i)} Não faz sentido. Contudo expressões da forma P(R R (Z.)≤ ≤ 1,Eu... Eu... (Z.)≤ ≤ 3){displaystyle P(Re {(Z)}leq 1,Im {(Z)}leq 3)} Faz sentido. Portanto, definimos a distribuição cumulativa de variáveis aleatórias complexas através da distribuição conjunta de suas partes reais e imaginárias:
Vetor aleatório complexo
Generalização da Eq.4 produz
Uso em análise estatística
O conceito da função de distribuição cumulativa aparece explicitamente na análise estatística de duas maneiras (semelhantes). A análise de frequência cumulativa é a análise da frequência de ocorrência de valores de um fenômeno menores que um valor de referência. A função de distribuição empírica é uma estimativa direta formal da função de distribuição cumulativa para a qual propriedades estatísticas simples podem ser derivadas e que podem formar a base de vários testes de hipóteses estatísticas. Esses testes podem avaliar se há evidência contra uma amostra de dados que surgiu de uma determinada distribuição, ou evidência contra duas amostras de dados que surgiram da mesma distribuição populacional (desconhecida).
Testes de Kolmogorov-Smirnov e Kuiper
O teste de Kolmogorov–Smirnov é baseado em funções de distribuição cumulativas e pode ser usado para testar se duas distribuições empíricas são diferentes ou se uma distribuição empírica é diferente de uma distribuição ideal. O teste de Kuiper intimamente relacionado é útil se o domínio da distribuição for cíclico como no dia da semana. Por exemplo, o teste de Kuiper pode ser usado para verificar se o número de tornados varia durante o ano ou se as vendas de um produto variam por dia da semana ou dia do mês.
Contenido relacionado
Modelo linear
Conjunto contável
Fractal