Cociente de Rayleigh

format_list_bulleted Contenido keyboard_arrow_down
ImprimirCitar
Construct for Hermitian matrices

En matemáticas, la Rayleigh quotient () para una matriz hermitiana compleja dada M{displaystyle M} and nonzero vector x{displaystyle x} se define como:

R()M,x)=xAlternativa Alternativa MxxAlternativa Alternativa x.{displaystyle R(M,x)={x^{*} Mx over x^{*}x}
xAlternativa Alternativa {displaystyle x^{*}x.{displaystyle x'}R()M,cx)=R()M,x){displaystyle R(M,cx)=R(M,x)}c{displaystyle c}λ λ min{displaystyle lambda _{min }M{displaystyle M}x{displaystyle x}vmin{displaystyle v_{min}R()M,x)≤ ≤ λ λ max{displaystyle R(M,x)leq lambda _{max }R()M,vmax)=λ λ max{displaystyle R(M,v_{max })=lambda _{max }

El cociente de Rayleigh se usa en el teorema min-max para obtener valores exactos de todos los valores propios. También se utiliza en algoritmos de valor propio (como la iteración del cociente de Rayleigh) para obtener una aproximación de valor propio a partir de una aproximación de vector propio.

El rango del cociente Rayleigh (para cualquier matriz, no necesariamente Hermitian) se llama un rango numérico y contiene su espectro. Cuando la matriz es Hermitian, el radio numérico es igual a la norma espectral. Todavía en el análisis funcional, λ λ max{displaystyle lambda _{max } es conocido como el radio espectral. En el contexto de C⋆ ⋆ {displaystyle C^{star }- álgebras o mecánica cuántica algebraica, la función que a M{displaystyle M} asocia el cociente Rayleigh–Ritz R()M,x){displaystyle R(M,x)} para un fijo x{displaystyle x} y M{displaystyle M} variando a través del álgebra se denominaría Estado vectorial del álgebra.

En la mecánica cuántica, el cociente Rayleigh da el valor de expectativa del observable correspondiente al operador M{displaystyle M} para un sistema cuyo estado es dado por x{displaystyle x}.

Si arreglamos la matriz compleja M{displaystyle M}, entonces el mapa de referencia de Rayleigh resultante (considerado como una función x{displaystyle x}) determina completamente M{displaystyle M} a través de la identidad de polarización; de hecho, esto sigue siendo cierto incluso si permitimos M{displaystyle M} ser no-Hermitiano. (Sin embargo, si restringimos el campo de los escalares a los números reales, entonces el cociente Rayleigh sólo determina la parte simétrica de M{displaystyle M}.)

Límites para Hermitian M

Como se indica en la introducción, para cualquier vector x, uno tiene R()M,x)▪ ▪ [λ λ min,λ λ max]{displaystyle R(M,x)in left[lambda _{min },lambda _{max }right]}, donde λ λ min,λ λ max{displaystyle lambda _{min },lambda _{max } son respectivamente los eigenvalues más pequeños y mayores M{displaystyle M}. Esto es inmediato después de observar que el cociente Rayleigh es un promedio ponderado de eigenvalues M:

R()M,x)=xAlternativa Alternativa MxxAlternativa Alternativa x=.. i=1nλ λ iSí.i2.. i=1nSí.i2{displaystyle R(M,x)={x^{*} Mx over x^{*}x}={frac {sum ################################################################################################################################################################################################################################################################ - Sí. ¿Qué?
()λ λ i,vi){displaystyle (lambda _{i},v_{i})}i{displaystyle i}Sí.i=viAlternativa Alternativa x{displaystyle Y...i{displaystyle i}xvmin,vmax{displaystyle v_{min},v_{max }

El hecho de que el cociente sea un promedio ponderado de los eigenvalues se puede utilizar para identificar el segundo, el tercero,... mayores eigenvalues. Vamos λ λ max=λ λ 1≥ ≥ λ λ 2≥ ≥ ⋯ ⋯ ≥ ≥ λ λ n=λ λ min{displaystyle lambda _{max }=lambda _{1}geq lambda _{2}geq cdots geq lambda ################################################################################################################################################################################################################################################################ ¿Qué? ser los eigenvalues en orden decreciente. Si n=2{displaystyle n=2} y x{displaystyle x} se limita a ser ortogonal v1{displaystyle v_{1}, en cuyo caso Sí.1=v1Alternativa Alternativa x=0{displaystyle Y..., entonces R()M,x){displaystyle R(M,x)} tiene valor máximo λ λ 2{displaystyle lambda _{2}, que se logra cuando x=v2{displaystyle x=v_{2}.

Caso especial de matrices de covarianza

Una matriz de covariancia empírica M{displaystyle M} puede ser representado como el producto A.A{displaystyle A'A} de la matriz de datos A{displaystyle A} pre-multiplicado por su transpose A.{displaystyle A'. Ser una matriz semi-definida positiva, M{displaystyle M} tiene eigenvalues no negativos, y eigenvectores ortogonales (o ortogonales) que se pueden demostrar de la siguiente manera.

Primero, que los eigenvalues λ λ i{displaystyle lambda _{i} no negativo:

Mvi=A.Avi=λ λ ivi⇒ ⇒ vi.A.Avi=vi.λ λ ivi⇒ ⇒ .Avi.2=λ λ i.vi.2⇒ ⇒ λ λ i=.Avi.2.vi.2≥ ≥ 0.{displaystyle {begin{aligned} {i}=A'Av_{i}=lambda ¿Qué? "Rightarrow" {fnK}=cHFF}=cH00} ¿Por qué? _{i}={frac {leftav_{i}right}{2}{i}{leftav_{i}rightav_{2}}geq 0.

Segundo, que los eigenvectores vi{displaystyle V_{i} son ortogonales unos a otros:

Mvi=λ λ ivi⇒ ⇒ vj.Mvi=vj.λ λ ivi⇒ ⇒ ()Mvj).vi=λ λ ivj.vi⇒ ⇒ λ λ jvj.vi=λ λ ivj.vi⇒ ⇒ ()λ λ j− − λ λ i)vj.vi=0⇒ ⇒ vj.vi=0{displaystyle {begin{aligned} ¿Por qué? ¿Por qué? ¿Por qué? ¿Por qué? _{j}-lambda ¿Por qué?

Para establecer ahora que el cociente Rayleigh es maximizado por el eigenvector con el mayor eigenvalue, considerar la descomposición de un vector arbitrario x{displaystyle x} sobre la base de los eigenvectores vi{displaystyle V_{i}:

x=.. i=1nα α ivi,{displaystyle x=sum ##{i=1} {n}alpha ¿Qué?
α α i=x.vivi.vi=.. x,vi.. .vi.2{displaystyle alpha ¿Qué? {langle x,v_{i}rangle } {leftfnv_{i}righth00}}}}}}}
x{displaystyle x}vi{displaystyle V_{i}
R()M,x)=x.A.Axx.x=().. j=1nα α jvj).()A.A)().. i=1nα α ivi)().. j=1nα α jvj).().. i=1nα α ivi)=().. j=1nα α jvj).().. i=1nα α i()A.A)vi)().. i=1nα α i2vi.vi)=().. j=1nα α jvj).().. i=1nα α iλ λ ivi)().. i=1nα α i2.. vi.. 2){displaystyle {begin{aligned}R(M,x) limitada={frac {x'A'Ax}{x'x}}\\\\fnMicroc {fn} {fn} {fn} {fn} {fn} {fn} {fn} {fn} {fn}} {fn}} {fn} {fn}} {fn}}} {fn} {fn}}}} {b}} {b} {b}}}}}}}}}}}} {b} {b}} {b}}}}}}}}}}}}} {b} {b} {b} {b}}}} {b}}}}b}}}}}}}}}}}}}}}}}}} {b} {b} {b} {b} {b}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}} ¿Por qué? {Bigl (}sum _{j=1}{n}Alpha ¿Por qué? ##{i=1} {n}alpha - ¿Qué? {Bigl (}sum _{j=1}{n}Alpha ¿Por qué? ¿Qué? {fnMicrosoft Sans Serif} {fnMicrosoft Sans Ser _{i=1} {fn} {fn} {fn} _{i}{2}fncipado {v_{i}fn} {2} {\fnK} ¡Más grande!
R()M,x)=.. i=1nα α i2λ λ i.. i=1nα α i2=.. i=1nλ λ i()x.vi)2()x.x)()vi.vi)2=.. i=1nλ λ i()x.vi)2()x.x){displaystyle {begin{aligned}R(M,x) ##{i=1} {n}alpha ¿Qué? ¿Qué? ##{i=1} {n}alpha - ¿Qué? ################################################################################################################################################################################################################################################################ - ¿Por qué? ################################################################################################################################################################################################################################################################ ¿Por qué?

La última representación establece que el cociente Rayleigh es la suma de los cosines cuadrados de los ángulos formados por el vector x{displaystyle x} y cada eigenvector vi{displaystyle V_{i}, ponderado por eigenvalues correspondientes.

Si un vector x{displaystyle x} maximizar R()M,x){displaystyle R(M,x)}, entonces cualquier escalar no cero múltiple kx{displaystyle kx} también maximiza R{displaystyle R., por lo que el problema se puede reducir al problema Lagrange de maximizar .. i=1nα α i2λ λ i{textstyle sum ##{i=1} {n}alpha ¿Qué? ¿Qué? en virtud de la limitación .. i=1nα α i2=1{textstyle sum ##{i=1} {n}alpha ¿Qué?.

Define: β β i=α α i2{displaystyle beta # {i}=alpha ¿Qué?. Esto se convierte entonces en un programa lineal, que siempre alcanza su máximo en uno de los rincones del dominio. Un punto máximo tendrá α α 1=± ± 1{displaystyle alpha ¿Qué? 1} y α α i=0{displaystyle alpha _{i}=0} para todos 1}" xmlns="http://www.w3.org/1998/Math/MathML">i■1{displaystyle i confía1} 1" aria-hidden="true" class="mwe-math-fallback-image-inline" src="https://wikimedia.org/api/rest_v1/media/math/render/svg/dea233301b9ca8fe5dde94824f918c0ceaf7fd5f" style="vertical-align: -0.338ex; width:5.063ex; height:2.176ex;"/> (cuando los eigenvalues se ordenan disminuyendo la magnitud).

Por lo tanto, el cociente de Rayleigh es maximizado por el vector propio con el valor propio más grande.

Formulación usando multiplicadores de Lagrange

Alternativamente, este resultado puede ser llegado por el método de multiplicadores Lagrange. La primera parte es demostrar que el cociente es constante bajo escala x→ → cx{displaystyle xto cx}, donde c{displaystyle c} es un cuero cabelludo

R()M,cx)=()cx)Alternativa Alternativa Mcx()cx)Alternativa Alternativa cx=cAlternativa Alternativa ccAlternativa Alternativa cxAlternativa Alternativa MxxAlternativa Alternativa x=R()M,x).{displaystyle R(M,cx)={fracx}{*}Mcx}{*}{*}cx}={fracx}}={fracx} {fnMicroc} {fnMicroc}} {fnMicroc}} {fnMicroc} {f}} {f}}}} {f}}}} {fn}} {fnK} {f}}} {f} {f}}}} {fnKf} {f}}}}}}} {f}}}}}}}}}}}} {f}}}}} {f} {f}}} {f} {f} {f} {f} {f}}}}}}}}}}}}}}}}}}}}}}}}}}}} {f} {f} {f} {f} {f} {f}f}f}f} {f} {f} {f}}}f}}}}}}}}}}}}}}}}}}}}}}}}}}} {x^{*}Mx}{*}x}=R(M,x). }

Debido a esta invariancia, es suficiente estudiar el caso especial .. x.. 2=xTx=1{displaystylefnxfnK}=x^{T}x=1}. El problema es entonces encontrar los puntos críticos de la función

R()M,x)=xTMx,{displaystyle R(M,x)=x^{mathsf {T}Mx,}
.. x.. 2=xTx=1.{displaystyle Toddxflido}=x^{T}x=1.}
L()x)=xTMx− − λ λ ()xTx− − 1),{displaystyle {mathcal {L}(x)=x^{mathsf {T}Mx-lambda left(x^{mathsf {T}x-1right),}
λ λ {displaystyle lambda }L()x){displaystyle {mathcal}(x)}
dL()x)dx=0⇒ ⇒ 2xTM− − 2λ λ xT=0⇒ ⇒ 2Mx− − 2λ λ x=0(tomar la transposición de ambos lados y señalar que M es Hermitian)⇒ ⇒ Mx=λ λ x{displaystyle {begin{aligned} {\fnMitcal {fnK} {fnMitcal} {fnMitcal} {fnMitcal} {fnMitcal} {f} {fnMitcal}} {fnMitcal} {f}} {f}} {f}}}}} {f}}}}}}} {f}}}} {f}}}}}}}}}}}}}} {f}}}}}}}}}}}}}}}}}} {\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\ Rightarrow {} {T}M-2lambda x^{mathsf {T}=0\\\\\\\\\\\fnMicrosoft Sans Serif}\\\\\\\\fnMicrosoft Sans Serif}\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\ Rightarrow {} âTMa âTMa âTMa âTMa {aligned}}
▪ ▪ R()M,x)=xTMxxTx=λ λ xTxxTx=λ λ .{displaystyletherefore R(M,x)={frac {x^{mathsf {}Mx}{mathsf {T}x}=lambda {frac {x^{mathsf {}x}{mathsf}x}{mathsf {T}}x}=lambda.

Por lo tanto, los eigenvectores x1,...... ,xn{displaystyle x_{1},ldotsx_{n} de M{displaystyle M} son los puntos críticos del cociente Rayleigh y sus eigenvalues correspondientes λ λ 1,...... ,λ λ n{displaystyle lambda _{1},ldotslambda ¿Qué? son los valores estacionarios de L{displaystyle {fnMithcal}}. Esta propiedad es la base para el análisis de componentes principales y correlación canónica.

Uso en la teoría de Sturm-Liouville

La teoría de Sturm-Liouville se refiere a la acción del operador lineal

L()Sí.)=1w()x)()− − ddx[p()x)dSí.dx]+q()x)Sí.){displaystyle L(y)={frac {1}{w(x)}left(-{frac {d}{dx}left[p(x){frac {dx}right]+q(x)yright)}}
.. Sí.1,Sí.2.. =∫ ∫ abw()x)Sí.1()x)Sí.2()x)dx{displaystyle langle {y_{1},y_{2}rangle =int _{a}{b}w(x)y_{1}(x)y_{2}(x),dx}
ab
.. Sí.,LSí... .. Sí.,Sí... =∫ ∫ abSí.()x)()− − ddx[p()x)dSí.dx]+q()x)Sí.()x))dx∫ ∫ abw()x)Sí.()x)2dx.{displaystyle {frac {langle {y,Ly}rangle # {langle {y,y}rangle ¿Qué? {d}{dx}left[p(x){frac {y}{dx}right]+q(x)y(x)right)dx}{int _{a}{b}{w(x)y(x)}dx}}}}}} {} {} {dx}} {dx}}}} {} {dx}}}}}}}} {}}}}}}}}}}}}}} {} {} {} {dx}} {} {} {} {} {} {} {} {} {} {}{}{}{}{}{}{}{dx} {dx}{}{}{}{}{dx} {dx} {} {} {} {dx} {} {} {}{}{} {} {}{}{}{}{}{}{}{}{} {}{}{}{}{}{}{}{}{}}}}{}{}}}}}}{}{

Esto a veces se presenta en una forma equivalente, obtenida al separar la integral en el numerador y usar la integración por partes:

.. Sí.,LSí... .. Sí.,Sí... ={}∫ ∫ abSí.()x)()− − ddx[p()x)Sí..()x)])dx}+{}∫ ∫ abq()x)Sí.()x)2dx}∫ ∫ abw()x)Sí.()x)2dx={}− − Sí.()x)[p()x)Sí..()x)]Silencioab}+{}∫ ∫ abSí..()x)[p()x)Sí..()x)]dx}+{}∫ ∫ abq()x)Sí.()x)2dx}∫ ∫ abw()x)Sí.()x)2dx={}− − p()x)Sí.()x)Sí..()x)Silencioab}+{}∫ ∫ ab[p()x)Sí..()x)2+q()x)Sí.()x)2]dx}∫ ∫ abw()x)Sí.()x)2dx.{displaystyle {begin{aligned}{frac} {langle {y,Ly}rangle ¿Qué?

Generalizaciones

  1. Para un par dado (A, B) de matrices, y un vector no cero dado x, el cociente generalizado de Rayleigh se define como:
    R()A,B;x):=xAlternativa Alternativa AxxAlternativa Alternativa Bx.{displaystyle R(A,B;x):={frac {x^{*}{x^{*}Bx}}}
    El coeficiente de Rayleigh generalizado se puede reducir al coeficiente de Rayleigh R()D,CAlternativa Alternativa x){displaystyle R(D,C^{*}x)} a través de la transformación D=C− − 1ACAlternativa Alternativa − − 1{displaystyle ¿Qué? Donde CCAlternativa Alternativa {displaystyle CC^{*} es la descomposición de Cholesky de la matriz Hermitian positivo-definido B.
  2. Para un par dado (x, Sí.) de vectores no cero, y una matriz hermitiana dada H, el cociente generalizado de Rayleigh puede definirse como:
    R()H;x,Sí.):=Sí.Alternativa Alternativa HxSí.Alternativa Alternativa Sí.⋅ ⋅ xAlternativa Alternativa x{displaystyle R(H;x,y):={ frac {y^{*} ¿Qué? #
    que coincide con R()H,xCuando x=Sí.. En la mecánica cuántica, esta cantidad se llama un "elemento de matrix" o a veces una "amplia de transición".

Contenido relacionado

Derivado de material

En mecánica continua, la derivada material describe la tasa de cambio temporal de alguna cantidad física de un elemento material que está sujeto a una...

Teoría del elemento pala

Teoría del elemento Blade es un proceso matemático diseñado originalmente por William Froude David W. Taylor y Stefan Drzewiecki para Determinar el...

Cierre (matemáticas)

En matemáticas, un subconjunto de un conjunto dado es cerrado bajo una operación del conjunto más grande si al realizar esa operación en los miembros del...
Más resultados...
Tamaño del texto:
undoredo
format_boldformat_italicformat_underlinedstrikethrough_ssuperscriptsubscriptlink
save