Matriz de covariância

format_list_bulleted Contenido keyboard_arrow_down

ImprimirCitar

Uma função de densidade de probabilidade gaussiana bivariada centrada em (0, 0), com matriz de covariância dada por ${\begin{bmatrix}1&0.5\0.5&1\end{bmatrix}}$

A amostra aponta de uma distribuição gaussiana bivariada com um desvio padrão de 3 em aproximadamente a direção direita inferior esquerda-upper e de 1 na direção ortogonal. Porque... x e *Sim.* componentes co-vary, as variações de $Não.$ e $- Sim.$ não descrever totalmente a distribuição. A $2\times 2$ matriz de covariância é necessária; as direções das setas correspondem aos eigenvectores desta matriz de covariância e seus comprimentos às raízes quadradas dos eigenvalues.

Na teoria e estatística de probabilidade, a matriz de covariância (também conhecida como matriz de auto-covariância , Matriz de dispersão , Matriz de variância , ou A matriz de variância -covariância ) é uma matriz quadrada que fornece a covariância entre cada par de elementos de um determinado vetor aleatório.

Intuitivamente, a matriz de covariância generaliza a noção de variância em múltiplas dimensões. Como exemplo, a variação em uma coleção de pontos aleatórios no espaço bidimensional não pode ser caracterizada totalmente por um único número, nem as variações no $Não.$ e $- Sim.$ direções contêm todas as informações necessárias; uma $2\times 2$ a matriz seria necessária para caracterizar totalmente a variação bidimensional.

Qualquer matriz de covariância é semi-definida simétrica e positiva e sua diagonal principal contém variações (isto é, a covariância de cada elemento consigo mesmo).

A matriz de covariância de um vetor aleatório $(X} }$ é tipicamente denotado por $\operatorname} Não. {X} \mathbf {X} }$ , $Não. "Sigma"$ ou $Não. S.$ .

Definição

Ao longo deste artigo, negritos não subscritos $(X} }$ e $- Sim.$ são usados para se referir a vetores aleatórios, e Roman subscripted $Não. X_{i}}$ e $Não. Y_{i}}$ são usados para se referir a variáveis aleatórias escalares.

Se as entradas no vetor da coluna $\mathbf] {X} =(X_{1},X_{2},\dotsX_{n})^{\mathsf {T}}$ são variáveis aleatórias, cada uma com variância finita e valor esperado, então a matriz de covariância $\operatorname} Não. {X} \mathbf {X} }$ é a matriz cuja $(i,j)}$ entrada é a covariância $\operatorname} Não. _{X_{i}X_{j}}=\operatorname {cov} [X_{i},X_{j}]=\operatorname {E} [(X_{i}-\operatorname (E} [X_{i}])(X_{j}-\operatorname [E] [X_{j]]$ onde o operador ${\displaystyle \operatorname} Não.$ denota o valor esperado (mean) de seu argumento.

Nomenclaturas e notações conflitantes

As nomenclaturas diferem. Alguns estatísticos, seguindo o probabilista William Feller em seu livro de dois volumes Uma introdução à teoria da probabilidade e suas aplicações, chamar a matriz $\operatorname} Não. {X} \mathbf {X} }$ o Variação do vetor aleatório $(X} }$ , porque é a generalização natural a dimensões mais altas da variância 1-dimensional. Outros chamam-lhe o matriz de covariância, porque é a matriz de covariâncias entre os componentes escalares do vetor $(X} }$ . $\operatorname {var} (\mathbf {X})=\operatorname {cov} (\mathbf {X}\mathbf {X})=\operatorname {E} \left[(\mathbf (X} -\operatorname {E} [\mathbf {X} ] {X} -\operatorname {E} [\mathbf {X} ])^{\mathsf {T}}\right].$

Ambas as formas são bastante padrão, e não há ambiguidade entre elas. A matriz $\operatorname} Não. {X} \mathbf {X} }$ é também muitas vezes chamado de matriz de variância-covariância, uma vez que os termos diagonais são de fato variações.

Em comparação, a notação para a matriz de covariância cruzada entre dois vetores é $\operatorname {cov} (\mathbf {X}\mathbf {Y})=\operatorname Não. {X} \mathbf {Y} }=\operatorname {E} \left[(\mathbf {X} -\operatorname {E} [\mathbf {X} ])(\mathbf {Y} -\operatorname {E} [\mathbf {Y} ])^{\mathsf {T}}\right].$

Propriedades

Relação com a matriz de autocorrelação

A matriz de auto-covariância $\operatorname} Não. {X} \mathbf {X} }$ está relacionado com a matriz de autocorrelação $\operatorname} Não. {X} \mathbf {X} }$ por $\operatorname} Não. (X) O nome do operador [E] (X} -\operatorname {E} [\mathbf {X} ] {X} -\operatorname {E} [\mathbf {X} ]^{\mathsf {T}}=\operatorname Não. (X) - Nome do operador [E] [\mathbf {X}]\operatorname {E} [\mathbf] (X})^{\mathsf {T}}$ onde a matriz de correção automática é definida como $\operatorname} Não. (X) O nome do operador {E} [\mathbf {X} \mathbf {X} ^{\mathsf {T}}}]$ .

Relação à matriz de correlação

Uma entidade estreitamente relacionada à matriz de covariância é a matriz dos coeficientes de correlação de produto-momento de Pearson entre cada uma das variáveis aleatórias no vetor aleatório $(X} }$ , que pode ser escrito como $\operatorname {corr} (\mathbf {X})={\big (}\operatorname {diag} (\operatorname {K}) _{\mathbf {X} \mathbf {X} }){\big}^{-{\frac {1}{2}}}\,\operatorname {K} _{\mathbf {X} \mathbf {X} }\,{\big (}\operatorname {diag} (\operatorname {K} _{\mathbf {X} \mathbf {X} }){\big}^{-{\frac {1}{2}}},$ Onde? $\operatorname {diag} (\operatorname {K} _{\mathbf {X} \mathbf {X} })$ é a matriz dos elementos diagonais de $\operatorname} Não. {X} \mathbf {X} }$ (i.e., uma matriz diagonal das variâncias de $Não. X_{i}}$ para $- Sim.$ ).

Equivalentemente, a matriz de correlação pode ser vista como a matriz de covariância das variáveis aleatórias padronizadas $Não. X_{i}/\sigma (X_{i})}$ para $- Sim.$ . $\operatorname {corr} (\mathbf {X})={\begin{bmatrix}1&{\frac {\operatorname {E} [(X_{1}-\mu _{1})(X_{2}-\mu _{2})]}{\sigma (X_{1})\sigma (X_{2})}}&\cdots &{\frac Nome do operador {E} [(X_{1}-\mu _{1})(X_{n}-\mu _{n})]}{\sigma (X_{1})\sigma (X_{n})}}\\\\\{\frac {\operatorname {E} [(X_{2}-\mu _{2})(X_{1}-\mu _{1})} {E} [(X_{2}-\mu _{2})(X_{n}-\mu _{n})]}{\sigma (X_{2})\sigma (X_{n})}}\\\\\vdots &\vdots &\ddots &\vdots \\\\\{\frac {\operatorname {E} [(X_{n}-\mu _{n})(X_{1}-\mu _{1})]}{\sigma (X_{n})\sigma (X_{1})}}&{\frac {\operatorname {E} [(X_{n}-\mu _{n})(X_{2})-\mu _{2}]$

Cada elemento na diagonal principal de uma matriz de correlação é a correlação de uma variável aleatória consigo mesma, que sempre é igual a 1. Cada elemento fora da diagonal está entre -1 e +1 inclusive.

Inverso da matriz de covariância

O inverso desta matriz, $\operatorname} Não. (X) (X) }^{-1}$ , se existir, é a matriz de covariância inversa (ou matriz de concentração inversa), também conhecida como a matriz de precisão (ou matriz de concentração).

Assim como a matriz de covariância pode ser escrita como o dimensionamento de uma matriz de correlação pelas variações marginais: $\operatorname {cov} (\mathbf {X})={\begin{bmatrix}\sigma _{x_{1}}&&&&0\&\sigma _{x_{2}}\&&\ddots \\0&&&\sigma _{x_{n}}\end{bmatrix}}{\begin{bmatrix}1&\rho _{x_{1},x_{2}}&\cdots &\rho _{x_{1},x_{n}}\\rho _{x_{2},x_{1}}&1&\cdots &\rho _{x_{2},x_{n}}\\vdots &\vdots &\ddots &\vdots \\rhots _{x_{n},x_{1}}&\rho _{x_{n},x_{2}}&\cdots &1\\\end{bmatrix}}{\begin{bmatrix}\sigma _{x_{1}}&&&&0\&\sigma _{x_{2}}\&&\ddots \\0&&&\sigma _{x_{n}}\end{bmatrix}}$

Assim, usando a ideia de correlação parcial e variância parcial, a matriz de covariância inversa pode ser expressa analógicamente: $\operatorname {cov} (\mathbf {X})^{-1}={\begin{bmatrix}{\frac {1}{\sigma _{x_{1}|x_{2}...}}}&&&0\&{\frac Não. _{x_{2}|x_{1},x_{3}...}}}\\&\ddots \\0&&&&{\frac {1}{\sigma _{x_{n}|x_{1}...x_{n-1}}}}\end{bmatrix}}{\begin{bmatrix}1&-\rho _{x_{1},x_{2}\mid x_{3}...}&\cdots &-\rho _{x_{1},x_{n}\mid x_{2}...x_{n-1}}\-\rho _{x_{2},x_{1}\mid x_{3}...}&1&\cdots &-\rho _{x_{2},x_{n}\mid x_{1},x_{3}...x_{n-1}}\\vdots &\vdots &\ddots &\vdots \\-\rhots _{x_{n},x_{1}\mid x_{2}...x_{n-1}}&-\rho _{x_{n},x_{2}\mid x_{1},x_{3}...x_{n-1}}&\cdots &1\\end{bmatrix}}{\begin{bmatrix}{\frac {1}{\sigma _{x_{1}|x_{2}...}}}&&&0\&{\frac Não. _{x_{2}|x_{1},x_{3}...}}}\\&\ddots \\0&&&&{\frac {1}{\sigma _{x_{n}|x_{1}...x_{n-1}}}}\end{bmatrix}}$ Esta dualidade motiva uma série de outras dualidades entre marginalização e condicionamento para variáveis aleatórias gaussianas.

Propriedades básicas

Para $\operatorname} Não. (X) {X} }=\operatorname {var} (\mathbf {X})=\operatorname {E} \left[\left(\mathbf) {X} -\nome do operador (E} [\mathbf {X} ]\right)\left(\mathbf {X} -\operatorname) (E} [\mathbf {X} ]\right)^{\mathsf {T}}\right]$ e $O que é isso? O nome do operador [E] [{\textbf {X}}]}$ , onde $\mathbf] {X} =(X_{1},\ldotsX_{n})^{\mathsf {T}}$ é um $Não.$ - variável aleatória dimensional, as seguintes propriedades básicas aplicam-se:

$\operatorname} Não. (X) O nome do operador {E} (\mathbf {XX^{\mathsf {T}}})-{\boldsymbol - Sim. {X} }^{\mathsf {T}}$
$\operatorname} {K} _{\mathbf {X} \mathbf {X} }\,$ é positiva, isto é. $(a) ^{T}\operatorname {K} _{\mathbf {X} \mathbf {X} }\mathbf {a} \geq 0\quad {\text{para todos }}\mathbf {a} \in \mathbb {R} ^{n}}$
$\operatorname} {K} _{\mathbf {X} \mathbf {X} }\,$ é simétrico, ou seja. $\operatorname} Não. (X) {X} }^{\mathsf {T}}=\operatorname {K} _{\mathbf {X} \mathbf {X} }$
Para qualquer constante (ou seja, não aleatória) $m\times n$ matriz de matriz $(A} }$ e constante $m\times 1$ vetor $- Sim.$ , um tem $\operatorname {var} (\mathbf {AX} +\mathbf {a})=\mathbf {A} \,\operatorname {var} (\mathbf {X})\,\mathbf {A} ^{\mathsf {T}}}$
Se $- Sim.$ é outro vetor aleatório com a mesma dimensão que $(X} }$ , então $\operatorname {var} (\mathbf) {X} +\mathbf {Y})=\operatorname {var} (\mathbf {X})+\operatorname {cov} (\mathbf {X}\mathbf {Y})+\operatorname {cov} (\mathbf {Y}\mathbf {X})+\operatorname {var} (\mathbf {Y})})$ Onde? $\operatorname {cov} (\mathbf {X}\mathbf {Y})$ é a matriz de covariância cruzada $(X} }$ e $- Sim.$ .

Bloco de matrizes

A média conjunta $- Sim.$ e matriz de covariância conjunta $- Não. Sim. )$ de $(X} }$ e $- Sim.$ pode ser escrito em forma de bloco $O que é isso? * * * *introduzido*** Sim. }}_{X}\\{\boldsymbol Sim. }}_{Y}\end{bmatrix}},\qquad {\boldsymbol Sim. }}= Nome do operador {K} _{\mathbf {XX} &\operatorname {K} _{\mathbf {XY} }\\\operatorname {K} _{\mathbf {YX} &\operatorname {K} _{\mathbf {YY} }\end{bmatrix}}}$ Onde? $\operatorname} {K} _{\mathbf {XX} }=\operatorname {var} (\mathbf {X})$ , $\operatorname} {K} _{\mathbf {YYY} }=\operatorname {var} (\mathbf {Y})$ e $\operatorname} Tradução e Legendagem: Não. {YX} }^{\mathsf {T}}=\operatorname {cov} (\mathbf {X}\mathbf {Y})$ .

${\displaystyle \operatorname} (K)$ e ${\displaystyle \operatorname} (K)$ pode ser identificado como as matrizes de variância das distribuições marginais para $(X} }$ e $- Sim.$ respectivamente.

Se $(X} }$ e $- Sim.$ são normalmente distribuídos em conjunto, $\mathbf {X}\mathbf {Y} \sim \ {\mathcal {N}}({\boldsymbol {\mu }},\operatorname {\boldsymbol {\Sigma }}),$ então a distribuição condicional para $- Sim.$ dados $(X} }$ é dado por $\mathbf {Y} \mid \mathbf {X} \sim \ {\mathcal {N}}({\boldsymbol {\mu }}_{\mathbf {Y|X} },\operatorname {K} _{\mathbf {Y|X} }),$ definido por meio condicional $O que é isso? }}_{\mathbf {Y} |\mathbf {X} }={\boldsymbol Não é verdade. }\operatorname {K} _{\mathbf {XX} }^{-1}\left(\mathbf) - Sim. Sim. }}_{\mathbf {X} }\right)}$ e variância condicional ${\displaystyle \operatorname} Não. (Y|X} }=\operatorname Não. Nome do operador }\operatorname {K} _{\mathbf {XX} }^{-1}\operatorname Não.$

A matriz $\operatorname} }\operatorname {K} _{\mathbf {XX} }^{-1}$ é conhecida como matriz de coeficientes de regressão, enquanto em álgebra linear $\operatorname} {K} _{\mathbf {Y|X} }$ é o complemento Schur de ${\displaystyle \operatorname} (K)$ em $- Não. Sim. )$ .

A matriz de coeficientes de regressão pode muitas vezes ser dada na forma transpose, ${\displaystyle \operatorname} {K} _{\mathbf {XX} }^{-1}\operatorname (K)$ , adequado para pós-multiplicando um vetor de linha de variáveis explicativas $\mathbf {X} ^{\mathsf {T}}$ em vez de pré-multiplicar um vetor de coluna $(X} }$ . Nesta forma correspondem aos coeficientes obtidos invertendo a matriz das equações normais dos mínimos quadrados ordinários (OLS).

Matriz de covariância parcial

Uma matriz de covariância com todos os elementos diferentes de zero nos diz que todas as variáveis aleatórias individuais estão inter-relacionadas. Isso significa que as variáveis não estão diretamente correlacionadas, mas também correlacionadas por outras variáveis indiretamente. Freqüentemente, essas correlações indiretas e comuns são triviais e desinteressantes. Eles podem ser suprimidos calculando a matriz de covariância parcial, que é a parte da matriz de covariância que mostra apenas a parte interessante das correlações.

Se dois vetores de variáveis aleatórias $(X} }$ e $- Sim.$ estão correlacionados via outro vetor $- Sim.$ , as últimas correlações são suprimidas em uma matriz ${\displaystyle \operatorname} {K} _{\mathbf {XY\mid I} }=\operatorname {pcov} (\mathbf {X}\mathbf {Y} \mid \mathbf {I})=\operatorname {cov} (\mathbf {X})-\operatorname {cov} (\mathbf {X}\mathbf}) {X}\mathbfname {I} ?$ A matriz de covariância parcial ${\displaystyle \operatorname} (K)$ é efetivamente a matriz de covariância simples ${\displaystyle \operatorname} (K)$ como se as variáveis aleatórias desinteressantes $- Sim.$ foram mantidos constantes.

Matriz de covariância como parâmetro de distribuição

Se um vetor de coluna $(X} }$ de $Não.$ variáveis aleatórias possivelmente correlacionadas são distribuídas em conjunto normalmente, ou mais geralmente distribuídas ellipticamente, então sua função de densidade de probabilidade $\operatorname {f} (\mathbf {X})$ pode ser expressa em termos da matriz de covariância $- Não. Sim. )$ como segue $\operatorname {f} (\mathbf {X})=(2\pi)^{-n/2}|{\boldsymbol Sim. }}|^{-1/2}\exp \left(-{\tfrac {1}{2}}\mathbf {(X-\mu)^{\mathsf {T}}\Sigma ^{-1}(X-\mu)} \right),$ Onde? $O que é isso? }}=\nome do operador Não.$ e $[displaystyle |{\boldsymbol] - Sim.$ é o determinante de $- Não. Sim. )$ .

Matriz de covariância como operador linear

Aplicado a um vetor, a matriz de covariância mapeia uma combinação linear c das variáveis aleatórias X em um vetor de covariâncias com essas variáveis: $\mathbf {c} ^{\mathsf {T}}\Sigma =\operatorname {cov} (\mathbf {c} ^{\mathsf {T}}\mathbf {X}\mathbf {X})$ . Tratada como forma bilinear, produz a covariância entre as duas combinações lineares: $\mathbf {d} ^{\mathsf (T) [Sigma }}\mathbf {c} =\operatorname {cov} (\mathbf {d} ^{\mathbf {T}}\mathbf {X}\mathbf {c} ^{\mathsf {T}}\mathbf {X})$ . A variação de uma combinação linear é então ${\displaystyle \mathbf {c} ^{\mathsf (T) Sim.$ , sua covariância com si mesmo.

Da mesma forma, a matriz de covariância inversa (pseudo) fornece um produto interno $\langle c-\mu |\Sigma ^{+}|c-\mu \rangle$ , que induz a distância de Mahalanobis, uma medida da "inigualdade" de c.

Que matrizes são matrizes de covariância?

Da identidade logo acima, deixe $(b)$ ser um $(p\times 1)}$ vetor real, então $\operatorname {var} (\mathbf {b} ^{\mathsf {T}}\mathbf {X})=\mathbf {b} ^{\mathsf {T}}\operatorname {var} (\mathbf {X})\mathbf {b}\,$ que deve ser sempre nonnegative, uma vez que é a variância de uma variável aleatória real, então uma matriz de covariância é sempre uma matriz positiva-semidefinita.

O argumento acima pode ser expandido da seguinte forma: ${\begin{aligned}&w^{\mathsf {T}}\operatorname {E} \left[(\mathbf) (X} -\operatorname {E} [\mathbf {X} ] {X} -\operatorname {E} [\mathbf {X} ]^{\mathsf {T}}\right]w=\operatorname {E} \left[w^{\mathsf {T}}(\mathbf) {X} -\nome do operador (E) [\mathbf {X} ] {X} -\operatorname {E} [\mathbf {X} ]^{\mathsf {T}}w\right]\&=\operatorname {E} {\big [}{\big (}w^{\mathsf {T}}(\mathbf) {X} -\nome do operador {E} [\mathbf {X} ]){\big}^{2}{\big ]}\geq 0,\end{aligned}}$ onde a última desigualdade segue da observação de que ${\displaystyle w^{\mathsf {T}}(\mathbf) {X} -\nome do operador Não.$ é um escalão.

Por outro lado, cada matriz semi-definita positiva simétrica é uma matriz de covariância. Para ver isto, suponha $- Sim.$ é um $p\times p$ matriz simétrica positiva-semidefinita. Do caso finito-dimensional do teorema espectral, segue-se que $- Sim.$ tem uma raiz quadrada simétrica nonnegativa, que pode ser denotada por M^1/2-2001. Vamos. $(X} }$ ser qualquer $p\times 1$ coluna vetor-valorizada variável aleatória cuja matriz de covariância é $p\times p$ matriz de identidade. Então... $\operatorname {var} (\mathbf) {M} ^{1/2}\mathbf {X})=\mathbf {M} ^{1/2}\,\operatorname {var} (\mathbf {X})\,\mathbf {M} ^{1/2}=\mathbf {M}$

vetores aleatórios complexos

A variação de um complexo escalar-valorizado variável aleatória com valor esperado $- Sim.$ é convencionalmente definido usando conjugação complexa: $\operatorname {var} (Z)=\operatorname {E} \left[(Z-\mu _{Z}){\overline {(Z-\mu _{Z})}}\right],$ onde o complexo conjugar um número complexo $Não.$ é denotado ${\overline {z}}$ ; assim, a variância de uma variável aleatória complexa é um número real.

Se $\mathbf] {Z} =(Z_{1},\ldotsZ_{n})^{\mathsf {T}}$ é um vetor coluna de variáveis aleatórias de valor complexo, então o transpose conjugado $\mathbf {Z} ^{\mathsf {H}}$ é formado por ambos transpondo e conjugando. Na expressão seguinte, o produto de um vetor com sua transposição conjugada resulta em uma matriz quadrada chamada a matriz de covariância, como sua expectativa: $\operatorname} (K) O nome do operador {cov} [\mathbf {Z}\mathbf] {Z} ]=\operatorname {E} \left[(\mathbf - Sim. }}_{\mathbf {Z} } (\mathbf) Não. Sim. }}_{\mathbf {Z} })^{\mathsf {H}}\right],$ A matriz assim obtida será hermitiana positiva-semidefinita, com números reais na diagonal principal e números complexos off-diagonal.

Propriedades

A matriz de covariância é uma matriz hermitiana, ou seja. $\operatorname} (K) {Z} }^{\mathsf {H}}=\operatorname {K} _{\mathbf {Z} \mathbf {Z} }$ .
Os elementos diagonais da matriz de covariância são reais.

Matriz de Pseudo-covariância

Para vetores aleatórios complexos, outro tipo de segundo momento central, o matriz pseudo-covariância (também chamado) matriz de relação) é definido como segue: $\operatorname {J} _{\mathbf {Z} \mathbf {Z} }=\operatorname {cov} [\mathbf {Z}] {Z} }}=\operatorname {E} \left[(\mathbf - Sim. }}_{\mathbf {Z} } (\mathbf) Não. Sim. }}_{\mathbf {Z} })^{\mathsf {T}}\right$

Ao contrário da matriz de covariância definida acima, a transposição hermitiana é substituída por transposição na definição. Seus elementos diagonais podem ser valorizados complexos; É uma matriz simétrica complexa.

Estimativa

Se ${\displaystyle \mathbf {M} _{\mathbf (X)$ e $\mathbf {M} _{\mathbf {Y} }$ são matrizes de dados centralizados de dimensão $p\times n$ e $q\times n$ respectivamente, ou seja, com n colunas de observações de p e q linhas de variáveis, das quais os meios de linha foram subtraídos, então, se os meios de linha foram estimados a partir dos dados, matrizes de covariância de amostra $\mathbf {Q} _{\mathbf {X} }$ e $\mathbf {Q} _{\mathbf {XY} }$ pode ser definido como $\mathbf {Q} _{\mathbf {XX} }={\frac {1}{n-1}\mathbf Não. {X} }\mathbf {M} {X} }^{\mathsf {T}},\qquad \mathbf - Não. {1}{n-1}\mathbf Não. {X} }\mathbf {M} {Y} }^{\mathsf {T}}$ ou, se a linha significa fosse conhecida a priori, $\mathbf {Q} _{\mathbf {XX} }={\frac {1}{n}\mathbf Não. {X} }\mathbf {M} {X} }^{\mathsf {T}},\qquad \mathbf - Não. {1}{n}\mathbf Não. {X} }\mathbf {M} {Y} }^{\mathsf {T}}$

Essas matrizes de covariância da amostra empírica são os estimadores mais diretos e usados com mais frequência para as matrizes de covariância, mas também existem outros estimadores, incluindo estimadores regularizados ou de encolhimento, que podem ter melhores propriedades.

Aplicações

A matriz de covariância é uma ferramenta útil em muitas áreas diferentes. A partir dele, uma matriz de transformação pode ser derivada, chamada de transformação de clareamento, que permite que alguém a correlacione completamente os dados ou, de um ponto de vista diferente, para encontrar uma base ideal para representar os dados de uma maneira compacta (consulte o quociente de Rayleigh para A prova formal e propriedades adicionais de matrizes de covariância). Isso é chamado de análise de componentes principais (PCA) e a transformação Karhunen-Loève (KL-Transform).

A matriz de covariância desempenha um papel fundamental na economia financeira, especialmente na teoria do portfólio e seu teorema de separação de fundos mútuos e no modelo de preços de ativos de capital. A matriz de covariâncias entre vários ativos ' Os retornos são usados para determinar, sob certas suposições, as quantidades relativas de diferentes ativos que os investidores devem (em uma análise normativa) ou prevê -se (em uma análise positiva) optar por manter em um contexto de diversificação.

Use na otimização

A estratégia de evolução, uma família específica de heurísticas de busca randomizada, baseia -se fundamentalmente em uma matriz de covariância em seu mecanismo. O operador de mutação característico desenha a etapa de atualização de uma distribuição normal multivariada usando uma matriz de covariância em evolução. Há uma prova formal de que a matriz de covariância da estratégia de evolução se adapta ao inverso da matriz hessiana do cenário de busca, até um fator escalar e pequenas flutuações aleatórias (comprovado para uma estratégia de parente e um modelo estático, À medida que o tamanho da população aumenta, depender da aproximação quadrática). Intuitivamente, esse resultado é suportado pela lógica de que a distribuição ideal de covariância pode oferecer etapas de mutação cujos contornos de probabilidade de equidência correspondem aos conjuntos de nível da paisagem e, portanto, maximizam a taxa de progresso.

Mapeamento de covariância

Em mapeamento de covariância os valores dos $\operatorname {cov} (\mathbf {X}\mathbf {Y})$ ou $\operatorname {pcov} (\mathbf {X}\mathbf {Y} \mid \mathbf {I})$ matriz são plotadas como um mapa 2-dimensional. Quando vetores $(X} }$ e $- Sim.$ são funções aleatórias discretas, o mapa mostra relações estatísticas entre diferentes regiões das funções aleatórias. As regiões estatisticamente independentes das funções aparecem no mapa como planalto de nível zero, enquanto as correlações positivas ou negativas aparecem, respectivamente, como colinas ou vales.

Na prática, os vetores de coluna ${\displaystyle \mathbf {X}\mathbf} Não.$ e $- Sim.$ são adquiridos experimentalmente como linhas de $Não.$ amostras, por exemplo. $\left[\mathbf] {X} _{1},\mathbf {X} _{2},\dots\mathbf {X} _{n}\right]={\begin{bmatrix}X_{1}(t_{1})&X_{2}(t_{1})&\cdots &X_{n}(t_{1})\\\\\\X_{1}(t_{2$ Onde? $(t_{i})}$ é o Eu...-o valor discreto na amostra JJ da função aleatória $(T)}$ . Os valores esperados necessários na fórmula de covariância são estimados usando a média da amostra, por exemplo. $\langle \mathbf] {X} \rangle ={\frac {1}{n}}\sum _{j=1}^{n}\mathbf {X} _{j}$ e a matriz de covariância é estimada pela matriz de covariância da amostra $\operatorname {cov} (\mathbf {X}\mathbf {Y})\approx \langle \mathbf {XY^{\mathf {T}}} \rangle -\langle \mathbf {X} \rangle \langle \mathbf {Y} ^{\mathsf {T}}\rangle$ onde os suportes angulares denotam amostra média como antes, exceto que a correção do Bessel deve ser feita para evitar viés. Usando esta estimativa a matriz de covariância parcial pode ser calculada como $\operatorname {pcov} (\mathbf {X}\mathbf {Y} \mid \mathbf {I})=\operatorname {cov} (\mathbf {X}\mathbf {Y})-\operatorname {cov} (\mathbf {X}\mathbf {I})\left(\operatorname {cov$ onde o backslash denota o operador de divisão de matriz esquerda, que ignora a exigência de inverter uma matriz e está disponível em alguns pacotes computacionais como Matlab.

Fig. 1 ilustra como um mapa de covariância parcial é construído em um exemplo de uma experiência realizada no laser livre-eletrônico FLASH em Hamburgo. A função aleatória $(T)}$ é o espectro de tempo de voo de íons de uma explosão de Coulomb de moléculas de nitrogênio multiplicado por um pulso laser. Uma vez que apenas algumas centenas de moléculas são ionizadas em cada pulso laser, o espectro de tiro único é altamente flutuante. No entanto, coletando tipicamente $m=10^{4}$ tal espectro, $\mathbf {X} _{j}(t)$ , e avaliá-los $Não.$ produz um espectro suave ${\displaystyle \langle \mathbf] Não.$ , que é mostrado em vermelho na parte inferior da Fig. 1. O espectro médio ${\displaystyle \langle \mathbf] - Sim.$ revela vários íons de nitrogênio em uma forma de picos ampliados por sua energia cinética, mas para encontrar as correlações entre as fases de ionização e o momento do íon requer o cálculo de um mapa de covariância.

No exemplo de Fig. 1 espectro $\mathbf {X} _{j}(t)$ e $\mathbf {Y} _{j}(t)$ são os mesmos, exceto que o intervalo do tempo de voo $Não.$ difere. Painel um mostra $\langle \mathbf {XY^{\mathsf {T}}} \rangle$ , painel b) mostra $\langle \mathbf] {X} \rangle \langle \mathbf {Y} ^{\mathsf {T}}\rangle$ e painel c mostra sua diferença, que é $\operatorname {cov} (\mathbf {X}\mathbf {Y})$ (note uma mudança na escala da cor). Infelizmente, este mapa Ã© sobrecarregado por correlaÃ§Ãμes desinteressantes e comuns induzidas pela intensidade do laser flutuando de tiro a tiro. Para suprimir tais correlações a intensidade do laser $Não. I_{j}}$ é gravado em cada tiro, colocado em $- Sim.$ e $\operatorname {pcov} (\mathbf {X}\mathbf {Y} \mid \mathbf {I})$ é calculado como painéis D e e Mostra. A supressão das correlações desinteressantes é, no entanto, imperfeita porque existem outras fontes de flutuações de modo comum do que a intensidade do laser e, em princípio, todas essas fontes devem ser monitoradas no vetor $- Sim.$ . No entanto, na prática, muitas vezes é suficiente para compensar a correção de covariância parcial como painel f mostra, onde correlações interessantes de íon momenta são agora claramente visíveis como linhas retas centradas em fases de ionização de nitrogênio atômico.

Espectroscopia infravermelha bidimensional

A espectroscopia de infravermelho bidimensional emprega análise de correlação para obter espectros 2D da fase condensada. Existem duas versões desta análise: síncrona e assíncrona. Matematicamente, o primeiro é expresso em termos da matriz de covariância da amostra e a técnica é equivalente ao mapeamento de covariância.

Ver também

Função de covariância
Decomposição do valor
Matriz Gramiana
Distribuição Lewandowski-Kurowicka-Joe
Estatísticas multivariadas
Componentes principais
Forma quadrática (estatística)

Referências

↑ a b c Park, Kun Il (2018). Fundamentos de Probabilidade e Processos Estocásticos com Aplicações às Comunicações. Springer. ISBN 978-319-68074-3.
^ William Feller (1971). Uma introdução à teoria da probabilidade e suas aplicações. Wiley. ISBN 978-0-471-25709-7. Retrieved 10 de Agosto 2012.
^ Wasserman, Larry (2004). Todas as estatísticas: um curso conciso em inferência estatística. Springer. ISBN 0-387-40272-1.
^ Taboga, Marco (2010). «Leturas sobre teoria da probabilidade e estatística matemática».
^ Eaton, Morris L. (1983). Estatísticas multivariadas: uma abordagem de espaço vetorial. John Wiley and Sons. pp. 116–117. ISBN 0-471-02776-6.
↑ a b W J Krzanowski "Principles of Multivariate Analysis" (Oxford University Press, Nova Iorque, 1988), Chap. 14.4; K V Mardia, J T Kent e J M Bibby "Multivariate Analysis (Academic Press, London, 1997), Chap. 6.5.3; T W Anderson "An Introduction to Multivariate Statistical Analysis" (Wiley, New York, 2003), 3rd ed., Chaps. 2.5.1 e 4.3.1.
^ Lapidoth, Amos (2009). Uma Fundação em Comunicação Digital. Cambridge University Press. ISBN 978-0-521-19395-5.
^ Brookes, Mike. «The Matrix Reference Manual» (em inglês).
^ Shir, O.M.; A. Yehudayoff (2020). «Sobre a relação covariance-Hessian em estratégias de evolução». Ciência da Computação Teórica. 801. Elsevier: 157–174. - Sim.1806.03674. - Sim.10.1016/j.tcs.2019.09.002.
^ L J Frasinski "Técnicas de mapeamento de covariância" J. Phys. B: At. Mol. Opt. Phys. 49 152004 (2016), acesso aberto
↑ a b O Kornilov, M Eckstein, M Rosenblatt, C P Schulz, K Motomura, A Rouzée, J Klei, L Foucar, M Siano, A Lübcke, F. Schapper, P Johnsson, D M P P P P P Holland, T Schlatholter, T Marchenko, S Düsterped parcial, K Ueda, M J J Vrak J. Phys. B: At. Mol. Opt. Phys. 46. 164028 (2013), acesso aberto
^ I Noda "método generalizado de correlação bidimensional aplicável ao infravermelho, Raman e outros tipos de espectroscopia" Appl. Spectrosc. 47 1329–36 (1993)

Leitura adicional

"Matriz de covariância", Enciclopédia da Matemática, EMS Press, 2001 [1994]
"Covariance Matrix Explained With Pictures", uma maneira fácil de visualizar matrizes de covariância!
Weisstein, Eric W. "Covariance Matrix". Matemática.
van Kampen, N. G. (1981). Processos estocásticos em física e química. Nova Iorque: North-Holland. ISBN 0-444-86200-5.

Estatísticas

Linha de produção
índice

Estatísticas descritivas

Dados contínuos

Centro	Meio Aritmética Aritmética - Geometria Contra-harmónica Cubic Geralizado/poder Geometria Harmonia Heroína Heinz Lehmer. Median Modo
Dispersão	Desvio absoluto médio Coeficiente de variação Gama interquartil Percentagem Gama Desvio padrão Variação
Forma	teorema do limite central Momentos Kurtosis L-momentos Skewness

Dados de contagem

Índice de dispersão

Quadros de síntese

Tabela de contingência
Distribuição de frequência
Dados agrupados

Dependência

Correlação parcial
Correlação do produto-momento da Pearson
Correlação aleatória
- Kendall's τ
- O Spearman's
enredo de dispersão

Gráficos

Gráfico de barras
Biplot
Lote de caixa
Gráfico de controle
Correção
Gráfico de fãs
Terreno florestal
Histograma
Gráfico de peças
Q-Q plotagem
Gráfico de radar
Gráfico de execução
enredo de dispersão
Exibição Stem-and-leaf
enredo de Violino

Coleta de dados

Design de estudo	Tamanho do efeito Dados perdidos Design ideal População Replicação Determinação do tamanho da amostra Estatística Poder estatístico
Metodologia de pesquisa	Amostragem Cluster Strat Processo de parecer Pergunta Erro padrão
Experiências controladas	Bloqueio Experiência fatorial Interação Atribuição aleatória Ensaio controlado randomizado Experiência aleatória Controlo científico
Designs adaptativos	Ensaio clínico adaptativo aproximação estocástica Projetos para cima e para baixo
Estudos observacionais	Estudo de coorte Estudo transversal Experiência natural Quasi-experiência

Inferência estatística

Teoria estatística

População
Estatística
Distribuição de probabilidade
Distribuição de amostragem
- Estatística de ordem
Distribuição empírica
- Estimação de densidade
Modelo estatístico
- Especificação do modelo
- Espaço Lp
Parâmetro
- localização
- escala
- forma
Família paramétrica
- Gostosidade (monotone)
- Família em escala de localização
- Família experiencial
Completa
Suficiência
Funcionamento estatístico
- Bootstrap
- U
- V
Decisão ótima
- função de perda
Eficiência
Distância estatística
- divergência
Assintomática
Robusto

Inferência freqüente

Estimativa de pontos	Equações de estimativa Máxima probabilidade Método de momentos M-estimador Distância mínima Estimadores imparciais Variância mínima mediada Rao-Blackwellization Teorema de Lehmann Mediana imparcial Plug-in
Estimação interval	Intervalo de confiança Pivot Intervalo de probabilidade Intervalo de predição Intervalo de tolerância Resampling Bootstrap Boa sorte.
Testando hipóteses	1- & 2 caudas Poder Teste uniformemente mais poderoso Teste de Permutação Teste de Randomização Várias comparações
Testes paramétricos	Ratio da probabilidade Multiplicador de pontuação/lagrange Wald

Testes específicos

Teste Z (normal) Teste t do estudante Teste de F
Bondade de ajuste	Chi-quarto Teste de G Kolmogorov–Smirnov Anderson–Darling Lilliefors Jarque–Bera Normalidade (Shapiro-Wilk) Teste de probabilidade Seleção de modelos Validação cruzada AIC BIC
Estatísticas aleatórias	Sinalização Amostra mediana Classificação assinada (Wilcoxon) Estimador de Hodges-Lehmann Rescaldo da Sessão (Mann–Whitney) Inovação não paramétrica 1 via (Kruskal-Wallis) 2-way (Friedman) Alternativa ordenada (Jonckheere–Terpstra) Teste de Van der Waerden

Inferência bayesiana

Probabilidade bayesiana
- anterior
- posterior
Intervalo crível
Fator de baías
Estimador bayesiano
- Estimador posterior máximo

Correlação
Análise de regressão

Correlação	Pearson product-moment Correlação parcial Variável de confusão Coeficiente de determinação
Análise de regressão	Erros e resíduos Validação de regressão Modelos de efeitos mistos Modelos de equações simultâneas Linhas de regressão adaptativa multivariadas (MARS)
Regressão linear	Regressão linear simples Ordinário menos quadrados Modelo linear geral Regressão bayesiana
Previsores não padronizados	Regressão não linear Não diferenciado Semi-adesão Isotónica Robusto. Heteroscedasticidade Homoscedasticidade
Modelo linear generalizado	Famílias exonenciais Logistic (Bernoulli) / Regressões Binomial / Poisson
Partição da variância	Análise da variância (ANOVA, anova) Análise da covariância ANOVA Multivariada Graus de liberdade

Categorical / Multivariate / Série Tempo / Análise de Sobrevivência

Categorismo

Cohen's kappa
Tabela de contingência
Modelo gráfico
Modelo log-linear
Teste de McNemar
Estatísticas de Cochran–Mantel–Haenszel

Multivariação

Regressão
Manova
Componentes principais
Correlação canônica
Análise discriminatória
Análise de cluster
Classificação
Modelo de equação estrutural
- Análise de fatores
Distribuição multivariada
- Distribuição elíptica
  - Normal

Série do tempo

Geral	Decomposição Tendência Armazém Ajuste sazonal Alisamento experiencial Cooperação Interrupção estrutural Causalidade de Granger
Testes específicos	Dickey–Fuller Johansen Q-estatística (Ljung-Box) Durbin–Watson Breusch – Godfrey
Domínio de tempo	Correlação automática (ACF) parcial (PACF) Correlação cruzada (XCF) Modelo ARMA Modelo ARIMA (Box–Jenkins) heteroskedasticidade condicional autoregressiva (ARCH) Autoregressão vetorial (VAR)
Domínio de frequência	Estimação da densidade espectral Análise de Fourier Análise espectral de Least-squares Wavelet A probabilidade de Whittle

Sobrevivência

Função de sobrevivência	Estimador Kaplan–Meier (limite de produto) Modelos de perigo proporcional Modelo de tempo de falha acelerado (AFT) Primeiro tempo de bater
Função de perigo	Estimador Nelson–Aalen
Teste de teste	Teste de log-rank

Aplicações

Bioestatística	Bioinformática Ensaios clínicos / estudos Epidemiologia Estatísticas médicas
Estatísticas de engenharia	Chemometria Engenharia de métodos Design probabilístico Controle de processo / qualidade Confiabilidade Identificação do sistema
Estatísticas sociais	Ciência autônoma Censo Estatísticas do crime Demografia Econometria Jurimetria Contas nacionais Estatísticas oficiais Estatísticas da população Psicometria
Estatísticas espaciais	Cartografia Estatísticas ambientais Sistema de informação geográfica Geoestatística Kriging

Categoria
Portal da matemática
Comuns
WikiProject

v ) e Aulas de Matrix
Entradas provavelmente restritas	Alternância Antidiagonal Anti-Hermitian Anti-simétrico Cabeça de seta Banda Bidiagonal Bissimétrico Bloco-diagonal bloco Bloco tridiagonal Boole. Cauda Centros Conferência Complexo Hadamard Copositivo Diagonais dominantes Diagonal Transformação de Fourier Discreto Elementário Equivalente Frobenius Permutação generalizada Hadamard. Hank. Hermitério Hessenberg O quê? Integer Lógica Unidade de matriz Metzler Moore. Nonnegative Pentadiagonal Permutação Persimétrico Polinomial Quantidade Assinatura Skew-Hermitian Skew-simétrico Skyline Sparse Sylvester Symmetric Toeplitz Triangular Tridiagonal Vandermonde Walsh. Z.
Constante	Troca Hilbert. Identidade Lehmer. De um Pascal Pauli Redheffer. Shift Zero.
Condições relativas aos valores ou eigenvectores	Companheiro Convergência Defeito Definir Diagonalizável Hurwitz. Positivo-definido Estabilizadores
Condições de satisfação em produtos ou inversos	Congruente. Idempotente ou Projeção Invertido Involuntário Nilpotência Normal Ortogonal Unimodular Unipotent Unidade Totalmente unimodular Pesagem
Com aplicações específicas	Adjudicação Sinal de alteração Aumentada Bézout Carleman Cartan Circulação Co-factor Comutação Confusão Coxeador Distância Duplicação e eliminação Distância euclidiana Fundamental (equação diferencial linear) Gerador de energia Grama Hessian Prestação de serviços Jacobian Momento Pagamento Escolha Random Rotação Seifert Shear Similaridade Síntese Totalmente positivo Transformação
Usado em estatísticas	Centro Correlação Covariância Design de interiores Duplamente estocástica InformaÃ§Ãμes de Fisher Chapéu Precisão Estocástica Transição
Usado na teoria dos grafos	Adjacência Biadjace Licenciatura Edmonds Incidência Laplacian Seidel adjace Tutte.
Usado em ciência e engenharia	Cabibbo–Kobayashi–Maskawa Densidade Fundamental (visão de computador) Associação Fuzzy Gamma Gigante Hamiltoniano Irregular Sobreposição S Transição do Estado Substância Z (química)
Termos relacionados	Jordânia forma normal Independência linear Matriz exponencial Representação matriz de seções cônicas Matriz perfeita Pseudoinverso Formulário de echelon de linha Wronskian
Portal da matemática Lista de matrizes Categoria:Matrices

Más resultados...