Cociente de Rayleigh

format_list_bulleted Contenido keyboard_arrow_down

ImprimirCitar

Construct for Hermitian matrices

En matemáticas, la Rayleigh quotient () para una matriz hermitiana compleja dada $M$ and nonzero vector $x$ se define como:

{displaystyle R(M,x)={x^{*}Mx over x^{*}x}.}

x^{*}

x'

R(M, c x) = R(M,x)

$c$

lambda_min

$M$ $x$

v_min

R(M, x) leq lambda_max

R(M, v_max) = lambda_max

El cociente de Rayleigh se usa en el teorema min-max para obtener valores exactos de todos los valores propios. También se utiliza en algoritmos de valor propio (como la iteración del cociente de Rayleigh) para obtener una aproximación de valor propio a partir de una aproximación de vector propio.

El rango del cociente Rayleigh (para cualquier matriz, no necesariamente Hermitian) se llama un rango numérico y contiene su espectro. Cuando la matriz es Hermitian, el radio numérico es igual a la norma espectral. Todavía en el análisis funcional, $lambda_max$ es conocido como el radio espectral. En el contexto de ${displaystyle C^{star }}$ - álgebras o mecánica cuántica algebraica, la función que a $M$ asocia el cociente Rayleigh–Ritz $R(M, x)$ para un fijo $x$ y $M$ variando a través del álgebra se denominaría Estado vectorial del álgebra.

En la mecánica cuántica, el cociente Rayleigh da el valor de expectativa del observable correspondiente al operador $M$ para un sistema cuyo estado es dado por $x$ .

Si arreglamos la matriz compleja $M$ , entonces el mapa de referencia de Rayleigh resultante (considerado como una función $x$ ) determina completamente $M$ a través de la identidad de polarización; de hecho, esto sigue siendo cierto incluso si permitimos $M$ ser no-Hermitiano. (Sin embargo, si restringimos el campo de los escalares a los números reales, entonces el cociente Rayleigh sólo determina la parte simétrica de $M$ .)

Límites para Hermitian M

Como se indica en la introducción, para cualquier vector x, uno tiene $R(M,x)in left[lambda _{min },lambda _{max }right]$ , donde ${displaystyle lambda _{min },lambda _{max }}$ son respectivamente los eigenvalues más pequeños y mayores $M$ . Esto es inmediato después de observar que el cociente Rayleigh es un promedio ponderado de eigenvalues M:

{displaystyle R(M,x)={x^{*}Mx over x^{*}x}={frac {sum _{i=1}^{n}lambda _{i}y_{i}^{2}}{sum _{i=1}^{n}y_{i}^{2}}}}

(lambda _{i},v_{i})

i

y_{i}=v_{i}^{*}x

i

v_{min },v_{max }

El hecho de que el cociente sea un promedio ponderado de los eigenvalues se puede utilizar para identificar el segundo, el tercero,... mayores eigenvalues. Vamos ${displaystyle lambda _{max }=lambda _{1}geq lambda _{2}geq cdots geq lambda _{n}=lambda _{min }}$ ser los eigenvalues en orden decreciente. Si $n=2$ y $x$ se limita a ser ortogonal $v_{1}$ , en cuyo caso $y_{1}=v_{1}^{*}x=0$ , entonces $R(M,x)$ tiene valor máximo $lambda _{2}$ , que se logra cuando $x=v_{2}$ .

Caso especial de matrices de covarianza

Una matriz de covariancia empírica $M$ puede ser representado como el producto ${displaystyle A'A}$ de la matriz de datos $A$ pre-multiplicado por su transpose $A'$ . Ser una matriz semi-definida positiva, $M$ tiene eigenvalues no negativos, y eigenvectores ortogonales (o ortogonales) que se pueden demostrar de la siguiente manera.

Primero, que los eigenvalues $lambda _{i}$ no negativo:

{displaystyle {begin{aligned}&Mv_{i}=A'Av_{i}=lambda _{i}v_{i}\Rightarrow {}&v_{i}'A'Av_{i}=v_{i}'lambda _{i}v_{i}\Rightarrow {}&left|Av_{i}right|^{2}=lambda _{i}left|v_{i}right|^{2}\Rightarrow {}&lambda _{i}={frac {left|Av_{i}right|^{2}}{left|v_{i}right|^{2}}}geq 0.end{aligned}}}

Segundo, que los eigenvectores $v_{i}$ son ortogonales unos a otros:

{displaystyle {begin{aligned}&Mv_{i}=lambda _{i}v_{i}\Rightarrow {}&v_{j}'Mv_{i}=v_{j}'lambda _{i}v_{i}\Rightarrow {}&left(Mv_{j}right)'v_{i}=lambda _{i}v_{j}'v_{i}\Rightarrow {}&lambda _{j}v_{j}'v_{i}=lambda _{i}v_{j}'v_{i}\Rightarrow {}&left(lambda _{j}-lambda _{i}right)v_{j}'v_{i}=0\Rightarrow {}&v_{j}'v_{i}=0end{aligned}}}

Para establecer ahora que el cociente Rayleigh es maximizado por el eigenvector con el mayor eigenvalue, considerar la descomposición de un vector arbitrario $x$ sobre la base de los eigenvectores $v_{i}$ :

{displaystyle x=sum _{i=1}^{n}alpha _{i}v_{i},}

{displaystyle alpha _{i}={frac {x'v_{i}}{v_{i}'v_{i}}}={frac {langle x,v_{i}rangle }{left|v_{i}right|^{2}}}}

x

v_{i}

{displaystyle {begin{aligned}R(M,x)&={frac {x'A'Ax}{x'x}}\&={frac {{Bigl (}sum _{j=1}^{n}alpha _{j}v_{j}{Bigr)}'left(A'Aright){Bigl (}sum _{i=1}^{n}alpha _{i}v_{i}{Bigr)}}{{Bigl (}sum _{j=1}^{n}alpha _{j}v_{j}{Bigr)}'{Bigl (}sum _{i=1}^{n}alpha _{i}v_{i}{Bigr)}}}\&={frac {{Bigl (}sum _{j=1}^{n}alpha _{j}v_{j}{Bigr)}'{Bigl (}sum _{i=1}^{n}alpha _{i}(A'A)v_{i}{Bigr)}}{{Bigl (}sum _{i=1}^{n}alpha _{i}^{2}{v_{i}}'{v_{i}}{Bigr)}}}\&={frac {{Bigl (}sum _{j=1}^{n}alpha _{j}v_{j}{Bigr)}'{Bigl (}sum _{i=1}^{n}alpha _{i}lambda _{i}v_{i}{Bigr)}}{{Bigl (}sum _{i=1}^{n}alpha _{i}^{2}|{v_{i}}|^{2}{Bigr)}}}end{aligned}}}

{displaystyle {begin{aligned}R(M,x)&={frac {sum _{i=1}^{n}alpha _{i}^{2}lambda _{i}}{sum _{i=1}^{n}alpha _{i}^{2}}}\&=sum _{i=1}^{n}lambda _{i}{frac {(x'v_{i})^{2}}{(x'x)(v_{i}'v_{i})^{2}}}\&=sum _{i=1}^{n}lambda _{i}{frac {(x'v_{i})^{2}}{(x'x)}}end{aligned}}}

La última representación establece que el cociente Rayleigh es la suma de los cosines cuadrados de los ángulos formados por el vector $x$ y cada eigenvector $v_{i}$ , ponderado por eigenvalues correspondientes.

Si un vector $x$ maximizar $R(M,x)$ , entonces cualquier escalar no cero múltiple $kx$ también maximiza $R$ , por lo que el problema se puede reducir al problema Lagrange de maximizar ${textstyle sum _{i=1}^{n}alpha _{i}^{2}lambda _{i}}$ en virtud de la limitación ${textstyle sum _{i=1}^{n}alpha _{i}^{2}=1}$ .

Define: ${displaystyle beta _{i}=alpha _{i}^{2}}$ . Esto se convierte entonces en un programa lineal, que siempre alcanza su máximo en uno de los rincones del dominio. Un punto máximo tendrá $alpha_1 = pm 1$ y $alpha _i = 0$ para todos $1}" xmlns="http://www.w3.org/1998/Math/MathML">i■1{displaystyle i confía1} 1" aria-hidden="true" class="mwe-math-fallback-image-inline" src="https://wikimedia.org/api/rest_v1/media/math/render/svg/dea233301b9ca8fe5dde94824f918c0ceaf7fd5f" style="vertical-align: -0.338ex; width:5.063ex; height:2.176ex;"/>$ (cuando los eigenvalues se ordenan disminuyendo la magnitud).

Por lo tanto, el cociente de Rayleigh es maximizado por el vector propio con el valor propio más grande.

Formulación usando multiplicadores de Lagrange

Alternativamente, este resultado puede ser llegado por el método de multiplicadores Lagrange. La primera parte es demostrar que el cociente es constante bajo escala ${displaystyle xto cx}$ , donde $c$ es un cuero cabelludo

{displaystyle R(M,cx)={frac {(cx)^{*}Mcx}{(cx)^{*}cx}}={frac {c^{*}c}{c^{*}c}}{frac {x^{*}Mx}{x^{*}x}}=R(M,x).}

Debido a esta invariancia, es suficiente estudiar el caso especial ${displaystyle |x|^{2}=x^{T}x=1}$ . El problema es entonces encontrar los puntos críticos de la función

{displaystyle R(M,x)=x^{mathsf {T}}Mx,}

|x|^2 = x^Tx = 1.

{displaystyle {mathcal {L}}(x)=x^{mathsf {T}}Mx-lambda left(x^{mathsf {T}}x-1right),}

lambda

mathcal{L}(x)

{displaystyle {begin{aligned}&{frac {d{mathcal {L}}(x)}{dx}}=0\Rightarrow {}&2x^{mathsf {T}}M-2lambda x^{mathsf {T}}=0\Rightarrow {}&2Mx-2lambda x=0{text{ (taking the transpose of both sides and noting that M is Hermitian)}}\Rightarrow {}&Mx=lambda xend{aligned}}}

{displaystyle therefore R(M,x)={frac {x^{mathsf {T}}Mx}{x^{mathsf {T}}x}}=lambda {frac {x^{mathsf {T}}x}{x^{mathsf {T}}x}}=lambda.}

Por lo tanto, los eigenvectores $x_{1},ldotsx_{n}$ de $M$ son los puntos críticos del cociente Rayleigh y sus eigenvalues correspondientes $lambda _{1},ldotslambda _{n}$ son los valores estacionarios de ${mathcal {L}}$ . Esta propiedad es la base para el análisis de componentes principales y correlación canónica.

Uso en la teoría de Sturm-Liouville

La teoría de Sturm-Liouville se refiere a la acción del operador lineal

{displaystyle L(y)={frac {1}{w(x)}}left(-{frac {d}{dx}}left[p(x){frac {dy}{dx}}right]+q(x)yright)}

{displaystyle langle {y_{1},y_{2}}rangle =int _{a}^{b}w(x)y_{1}(x)y_{2}(x),dx}

{displaystyle {frac {langle {y,Ly}rangle }{langle {y,y}rangle }}={frac {int _{a}^{b}y(x)left(-{frac {d}{dx}}left[p(x){frac {dy}{dx}}right]+q(x)y(x)right)dx}{int _{a}^{b}{w(x)y(x)^{2}}dx}}.}

Esto a veces se presenta en una forma equivalente, obtenida al separar la integral en el numerador y usar la integración por partes:

{displaystyle {begin{aligned}{frac {langle {y,Ly}rangle }{langle {y,y}rangle }}&={frac {left{int _{a}^{b}y(x)left(-{frac {d}{dx}}left[p(x)y'(x)right]right)dxright}+left{int _{a}^{b}{q(x)y(x)^{2}},dxright}}{int _{a}^{b}{w(x)y(x)^{2}},dx}}\&={frac {left{left.-y(x)left[p(x)y'(x)right]right|_{a}^{b}right}+left{int _{a}^{b}y'(x)left[p(x)y'(x)right],dxright}+left{int _{a}^{b}{q(x)y(x)^{2}},dxright}}{int _{a}^{b}w(x)y(x)^{2},dx}}\&={frac {left{left.-p(x)y(x)y'(x)right|_{a}^{b}right}+left{int _{a}^{b}left[p(x)y'(x)^{2}+q(x)y(x)^{2}right],dxright}}{int _{a}^{b}{w(x)y(x)^{2}},dx}}.end{aligned}}}

Generalizaciones

Para un par dado (A, B) de matrices, y un vector no cero dado x, el cociente generalizado de Rayleigh se define como: ${displaystyle R(A,B;x):={frac {x^{*}Ax}{x^{*}Bx}}.}$ El coeficiente de Rayleigh generalizado se puede reducir al coeficiente de Rayleigh $R(D, C^*x)$ a través de la transformación $D = C^{-1} A {C^*}^{-1}$ Donde $CC^*$ es la descomposición de Cholesky de la matriz Hermitian positivo-definido B.
Para un par dado (x, Sí.) de vectores no cero, y una matriz hermitiana dada H, el cociente generalizado de Rayleigh puede definirse como: ${displaystyle R(H;x,y):={frac {y^{*}Hx}{sqrt {y^{*}ycdot x^{*}x}}}}$ que coincide con R()H,xCuando x=Sí.. En la mecánica cuántica, esta cantidad se llama un "elemento de matrix" o a veces una "amplia de transición".

Contenido relacionado

Más resultados...