Complemento de Schur

format_list_bulleted Contenido keyboard_arrow_down

ImprimirCitar

Herramienta en álgebra lineal y análisis de matriz

En álgebra lineal y teoría de matrices, el complemento de Schur de una matriz de bloques se define de la siguiente manera.

Supongamos que p, q son números enteros no negativos y supongamos que A, B, C, D son respectivamente p × p, p × q, matrices q × p y q × q de números complejos. Dejar

{displaystyle M=left[{begin{matrix}A&B\C&Dend{matrix}}right]}

Mpqpq

Si D es invertible, entonces el complemento de Schur del bloque D de la matriz M es el Matriz p × p definida por

{displaystyle M/D:=A-BD^{-1}C.}

ASuplemento de SchurAMqq

{displaystyle M/A:=D-CA^{-1}B.}

ADM/AM/Dgeneralizado Suplemento de Schur

El complemento de Schur lleva el nombre de Issai Schur, quien lo utilizó para demostrar el lema de Schur, aunque ya se había utilizado anteriormente. Emilie Virginia Haynsworth fue la primera en llamarlo complemento Schur. El complemento Schur es una herramienta clave en los campos del análisis numérico, la estadística y el análisis matricial.

Fondo

El complemento de Schur surge al realizar una eliminación gaussiana en bloque sobre la matriz M. Para eliminar los elementos debajo de la diagonal del bloque, se multiplica la matriz M por una matriz triangular inferior del bloque a la derecha de la siguiente manera:

{displaystyle {begin{aligned}&M={begin{bmatrix}A&B\C&Dend{bmatrix}}quad to quad {begin{bmatrix}A&B\C&Dend{bmatrix}}{begin{bmatrix}I_{p}&0\-D^{-1}C&I_{q}end{bmatrix}}={begin{bmatrix}A-BD^{-1}C&B\0&Dend{bmatrix}},end{aligned}}}

I_ppp

{displaystyle M/D=A-BD^{-1}C}

Continuando el proceso de eliminación más allá de este punto (es decir, realizando una eliminación en bloque Gauss-Jordan),

{displaystyle {begin{aligned}&{begin{bmatrix}A-BD^{-1}C&B\0&Dend{bmatrix}}quad to quad {begin{bmatrix}I_{p}&-BD^{-1}\0&I_{q}end{bmatrix}}{begin{bmatrix}A-BD^{-1}C&B\0&Dend{bmatrix}}={begin{bmatrix}A-BD^{-1}C&0\0&Dend{bmatrix}},end{aligned}}}

{displaystyle {begin{aligned}M&={begin{bmatrix}A&B\C&Dend{bmatrix}}={begin{bmatrix}I_{p}&BD^{-1}\0&I_{q}end{bmatrix}}{begin{bmatrix}A-BD^{-1}C&0\0&Dend{bmatrix}}{begin{bmatrix}I_{p}&0\D^{-1}C&I_{q}end{bmatrix}}.end{aligned}}}

MD⁻¹

{displaystyle {begin{aligned}M^{-1}={begin{bmatrix}A&B\C&Dend{bmatrix}}^{-1}={}&left({begin{bmatrix}I_{p}&BD^{-1}\0&I_{q}end{bmatrix}}{begin{bmatrix}A-BD^{-1}C&0\0&Dend{bmatrix}}{begin{bmatrix}I_{p}&0\D^{-1}C&I_{q}end{bmatrix}}right)^{-1}\={}&{begin{bmatrix}I_{p}&0\-D^{-1}C&I_{q}end{bmatrix}}{begin{bmatrix}left(A-BD^{-1}Cright)^{-1}&0\0&D^{-1}end{bmatrix}}{begin{bmatrix}I_{p}&-BD^{-1}\0&I_{q}end{bmatrix}}\[4pt]={}&{begin{bmatrix}left(A-BD^{-1}Cright)^{-1}&-left(A-BD^{-1}Cright)^{-1}BD^{-1}\-D^{-1}Cleft(A-BD^{-1}Cright)^{-1}&D^{-1}+D^{-1}Cleft(A-BD^{-1}Cright)^{-1}BD^{-1}end{bmatrix}}\[4pt]={}&{begin{bmatrix}left(M/Dright)^{-1}&-left(M/Dright)^{-1}BD^{-1}\-D^{-1}Cleft(M/Dright)^{-1}&D^{-1}+D^{-1}Cleft(M/Dright)^{-1}BD^{-1}end{bmatrix}}.end{aligned}}}

D⁻¹M/DADM⁻¹MM/DM/A"Derivación de la descomposición de LDU"

Propiedades

Si p y q ambos son 1 (es decir, A, B, C y D todos los escalares), obtenemos la fórmula familiar para el inverso de una matriz de 2 por 2:

M^{{-1}}={frac {1}{AD-BC}}left[{begin{matrix}D&-B\-C&Aend{matrix}}right]

siempre que AD−BC no es cero.

En general, si A es invertible, entonces

{displaystyle {begin{aligned}M&={begin{bmatrix}A&B\C&Dend{bmatrix}}={begin{bmatrix}I_{p}&0\CA^{-1}&I_{q}end{bmatrix}}{begin{bmatrix}A&0\0&D-CA^{-1}Bend{bmatrix}}{begin{bmatrix}I_{p}&A^{-1}B\0&I_{q}end{bmatrix}},\[4pt]M^{-1}&={begin{bmatrix}A^{-1}+A^{-1}B(M/A)^{-1}CA^{-1}&-A^{-1}B(M/A)^{-1}\-(M/A)^{-1}CA^{-1}&(M/A)^{-1}end{bmatrix}}end{aligned}}}

cuando este inverso existe.

(La fórmula de Schur) Cuando A, respectivamente D, es invertible, el determinante M también se ve claramente que

{displaystyle det(M)=det(A)det left(D-CA^{-1}Bright)}

, respectivamente

{displaystyle det(M)=det(D)det left(A-BD^{-1}Cright)}

que generaliza la fórmula determinante para 2 × 2 matrices.

(Fórmula de aditividad de rango masculino) Si D es invertible, entonces el rango de M es dado por

{displaystyle operatorname {rank} (M)=operatorname {rank} (D)+operatorname {rank} left(A-BD^{-1}Cright)}

(Fórmula de aditividad inercia Haynsworth) Si A es invertible, entonces el inercia de la matriz del bloque M es igual a la inercia de A más la inercia de M/A.
(Identidad cualitativa) ${displaystyle A/B=((A/C)/(B/C))}$ .
El complemento de Schur de una matriz laplaciana es también una matriz laplaciana.

Aplicación a la resolución de ecuaciones lineales

El complemento de Schur surge naturalmente al resolver un sistema de ecuaciones lineales como

${displaystyle {begin{bmatrix}A&B\C&Dend{bmatrix}}{begin{bmatrix}x\yend{bmatrix}}={begin{bmatrix}u\vend{bmatrix}}}$ .

Suponiendo que la submatrix $A$ es invertible, podemos eliminar $x$ de las ecuaciones, como sigue.

${displaystyle x=A^{-1}(u-By)}$ .

Sustituyendo esta expresión en la segunda ecuación se obtiene

{displaystyle left(D-CA^{-1}Bright)y=v-CA^{-1}u}

Nos referimos a esto como el ecuación reducida obtenido mediante la eliminación $x$ de la ecuación original. La matriz que aparece en la ecuación reducida se llama el complemento Schur del primer bloque $A$ dentro $M$ :

{displaystyle S {overset {underset {mathrm {def} }{}}{=}} D-CA^{-1}B}

Resolviendo la ecuación reducida, obtenemos

{displaystyle y=S^{-1}left(v-CA^{-1}uright)}

Sustituyendo esto en la primera ecuación se obtiene

{displaystyle x=left(A^{-1}+A^{-1}BS^{-1}CA^{-1}right)u-A^{-1}BS^{-1}v}

Podemos expresar las dos ecuaciones anteriores como:

{displaystyle {begin{bmatrix}x\yend{bmatrix}}={begin{bmatrix}A^{-1}+A^{-1}BS^{-1}CA^{-1}&-A^{-1}BS^{-1}\-S^{-1}CA^{-1}&S^{-1}end{bmatrix}}{begin{bmatrix}u\vend{bmatrix}}}

Por lo tanto, una formulación para la inversa de una matriz de bloques es:

{displaystyle {begin{bmatrix}A&B\C&Dend{bmatrix}}^{-1}={begin{bmatrix}A^{-1}+A^{-1}BS^{-1}CA^{-1}&-A^{-1}BS^{-1}\-S^{-1}CA^{-1}&S^{-1}end{bmatrix}}={begin{bmatrix}I_{p}&-A^{-1}B\&I_{q}end{bmatrix}}{begin{bmatrix}A^{-1}&\&S^{-1}end{bmatrix}}{begin{bmatrix}I_{p}&\-CA^{-1}&I_{q}end{bmatrix}}}

En particular, vemos que el complemento de Schur es el inverso del ${displaystyle 2,2}$ entrada de bloque del inverso de $M$ .

En la práctica, una necesidad $A$ estar bien acondicionado para que este algoritmo sea numéricamente preciso.

En ingeniería eléctrica, esto a menudo se denomina eliminación de nodos o reducción de Kron.

Aplicaciones a la teoría de la probabilidad y la estadística

Supongamos que los vectores de columna aleatorios X, Y viven en Rⁿ y R^m respectivamente, y el vector (X, Y) en R^{n + m} tiene una distribución normal multivariada cuya covarianza es la matriz simétrica definida positiva

{displaystyle Sigma =left[{begin{matrix}A&B\B^{mathsf {T}}&Cend{matrix}}right],}

Donde ${textstyle Ain mathbb {R} ^{ntimes n}}$ es la matriz de covariancia X, ${textstyle Cin mathbb {R} ^{mtimes m}}$ es la matriz de covariancia Y y ${textstyle Bin mathbb {R} ^{ntimes m}}$ es la matriz de covariancia entre X y Y.

Entonces la covariancia condicional X dado Y es el complemento de Schur C dentro ${textstyle Sigma }$ :

{displaystyle {begin{aligned}operatorname {Cov} (Xmid Y)&=A-BC^{-1}B^{mathsf {T}}\operatorname {E} (Xmid Y)&=operatorname {E} (X)+BC^{-1}(Y-operatorname {E} (Y))end{aligned}}}

Si tomamos la matriz $Sigma$ arriba para ser, no una covariancia de un vector al azar, sino un muestra covariancia, entonces puede tener una distribución de Wishart. En ese caso, el complemento de Schur C dentro $Sigma$ también tiene una distribución de Wishart.

Condiciones para la certeza positiva y la semidefinición

Sea X una matriz simétrica de números reales dada por

{displaystyle X=left[{begin{matrix}A&B\B^{mathsf {T}}&Cend{matrix}}right].}

Si A es invertible, entonces X es positivo definido si y sólo si A y su complemento X/A ambos son positivos definidos:
- ${displaystyle Xsucc 0Leftrightarrow Asucc 0,X/A=C-B^{mathsf {T}}A^{-1}Bsucc 0.}$
Si C es invertible, entonces X es positivo definido si y sólo si C y su complemento X/C ambos son positivos definidos:
- ${displaystyle Xsucc 0Leftrightarrow Csucc 0,X/C=A-BC^{-1}B^{mathsf {T}}succ 0.}$
Si A es positivo definido, entonces X es positivo semi-definido si y sólo si el complemento X/A es positivo semi-definido:
- ${displaystyle {text{If }}Asucc 0,{text{ then }}Xsucceq 0Leftrightarrow X/A=C-B^{mathsf {T}}A^{-1}Bsucceq 0.}$
Si C es positivo definido, entonces X es positivo semi-definido si y sólo si el complemento X/C es positivo semi-definido:
- ${displaystyle {text{If }}Csucc 0,{text{ then }}Xsucceq 0Leftrightarrow X/C=A-BC^{-1}B^{mathsf {T}}succeq 0.}$

La primera y la tercera afirmación se pueden derivar considerando el minimizador de la cantidad

{displaystyle u^{mathsf {T}}Au+2v^{mathsf {T}}B^{mathsf {T}}u+v^{mathsf {T}}Cv,,}

Además, desde

{displaystyle left[{begin{matrix}A&B\B^{mathsf {T}}&Cend{matrix}}right]succ 0Longleftrightarrow left[{begin{matrix}C&B^{mathsf {T}}\B&Aend{matrix}}right]succ 0}

También existe una condición suficiente y necesaria para la semidefinición positiva de X en términos de un complemento de Schur generalizado. Precisamente,

${displaystyle Xsucceq 0Leftrightarrow Asucceq 0,C-B^{mathsf {T}}A^{g}Bsucceq 0,left(I-AA^{g}right)B=0,}$ y
${displaystyle Xsucceq 0Leftrightarrow Csucceq 0,A-BC^{g}B^{mathsf {T}}succeq 0,left(I-CC^{g}right)B^{mathsf {T}}=0,}$

Donde $A^{g}$ denota un inverso generalizado de $A$ .

Contenido relacionado

Más resultados...