Cociente de Rayleigh
En matemáticas, la Rayleigh quotient () para una matriz hermitiana compleja dada M{displaystyle M} and nonzero vector x{displaystyle x} se define como:
El cociente de Rayleigh se usa en el teorema min-max para obtener valores exactos de todos los valores propios. También se utiliza en algoritmos de valor propio (como la iteración del cociente de Rayleigh) para obtener una aproximación de valor propio a partir de una aproximación de vector propio.
El rango del cociente Rayleigh (para cualquier matriz, no necesariamente Hermitian) se llama un rango numérico y contiene su espectro. Cuando la matriz es Hermitian, el radio numérico es igual a la norma espectral. Todavía en el análisis funcional, λ λ max{displaystyle lambda _{max } es conocido como el radio espectral. En el contexto de C⋆ ⋆ {displaystyle C^{star }- álgebras o mecánica cuántica algebraica, la función que a M{displaystyle M} asocia el cociente Rayleigh–Ritz R()M,x){displaystyle R(M,x)} para un fijo x{displaystyle x} y M{displaystyle M} variando a través del álgebra se denominaría Estado vectorial del álgebra.
En la mecánica cuántica, el cociente Rayleigh da el valor de expectativa del observable correspondiente al operador M{displaystyle M} para un sistema cuyo estado es dado por x{displaystyle x}.
Si arreglamos la matriz compleja M{displaystyle M}, entonces el mapa de referencia de Rayleigh resultante (considerado como una función x{displaystyle x}) determina completamente M{displaystyle M} a través de la identidad de polarización; de hecho, esto sigue siendo cierto incluso si permitimos M{displaystyle M} ser no-Hermitiano. (Sin embargo, si restringimos el campo de los escalares a los números reales, entonces el cociente Rayleigh sólo determina la parte simétrica de M{displaystyle M}.)
Límites para Hermitian M
Como se indica en la introducción, para cualquier vector x, uno tiene R()M,x)▪ ▪ [λ λ min,λ λ max]{displaystyle R(M,x)in left[lambda _{min },lambda _{max }right]}, donde λ λ min,λ λ max{displaystyle lambda _{min },lambda _{max } son respectivamente los eigenvalues más pequeños y mayores M{displaystyle M}. Esto es inmediato después de observar que el cociente Rayleigh es un promedio ponderado de eigenvalues M:
El hecho de que el cociente sea un promedio ponderado de los eigenvalues se puede utilizar para identificar el segundo, el tercero,... mayores eigenvalues. Vamos λ λ max=λ λ 1≥ ≥ λ λ 2≥ ≥ ⋯ ⋯ ≥ ≥ λ λ n=λ λ min{displaystyle lambda _{max }=lambda _{1}geq lambda _{2}geq cdots geq lambda ################################################################################################################################################################################################################################################################ ¿Qué? ser los eigenvalues en orden decreciente. Si n=2{displaystyle n=2} y x{displaystyle x} se limita a ser ortogonal v1{displaystyle v_{1}, en cuyo caso Sí.1=v1Alternativa Alternativa x=0{displaystyle Y..., entonces R()M,x){displaystyle R(M,x)} tiene valor máximo λ λ 2{displaystyle lambda _{2}, que se logra cuando x=v2{displaystyle x=v_{2}.
Caso especial de matrices de covarianza
Una matriz de covariancia empírica M{displaystyle M} puede ser representado como el producto A.A{displaystyle A'A} de la matriz de datos A{displaystyle A} pre-multiplicado por su transpose A.{displaystyle A'. Ser una matriz semi-definida positiva, M{displaystyle M} tiene eigenvalues no negativos, y eigenvectores ortogonales (o ortogonales) que se pueden demostrar de la siguiente manera.
Primero, que los eigenvalues λ λ i{displaystyle lambda _{i} no negativo:
Segundo, que los eigenvectores vi{displaystyle V_{i} son ortogonales unos a otros:
Para establecer ahora que el cociente Rayleigh es maximizado por el eigenvector con el mayor eigenvalue, considerar la descomposición de un vector arbitrario x{displaystyle x} sobre la base de los eigenvectores vi{displaystyle V_{i}:
La última representación establece que el cociente Rayleigh es la suma de los cosines cuadrados de los ángulos formados por el vector x{displaystyle x} y cada eigenvector vi{displaystyle V_{i}, ponderado por eigenvalues correspondientes.
Si un vector x{displaystyle x} maximizar R()M,x){displaystyle R(M,x)}, entonces cualquier escalar no cero múltiple kx{displaystyle kx} también maximiza R{displaystyle R., por lo que el problema se puede reducir al problema Lagrange de maximizar .. i=1nα α i2λ λ i{textstyle sum ##{i=1} {n}alpha ¿Qué? ¿Qué? en virtud de la limitación .. i=1nα α i2=1{textstyle sum ##{i=1} {n}alpha ¿Qué?.
Define: β β i=α α i2{displaystyle beta # {i}=alpha ¿Qué?. Esto se convierte entonces en un programa lineal, que siempre alcanza su máximo en uno de los rincones del dominio. Un punto máximo tendrá α α 1=± ± 1{displaystyle alpha ¿Qué? 1} y α α i=0{displaystyle alpha _{i}=0} para todos 1}" xmlns="http://www.w3.org/1998/Math/MathML">i■1{displaystyle i confía1} 1" aria-hidden="true" class="mwe-math-fallback-image-inline" src="https://wikimedia.org/api/rest_v1/media/math/render/svg/dea233301b9ca8fe5dde94824f918c0ceaf7fd5f" style="vertical-align: -0.338ex; width:5.063ex; height:2.176ex;"/> (cuando los eigenvalues se ordenan disminuyendo la magnitud).
Por lo tanto, el cociente de Rayleigh es maximizado por el vector propio con el valor propio más grande.
Formulación usando multiplicadores de Lagrange
Alternativamente, este resultado puede ser llegado por el método de multiplicadores Lagrange. La primera parte es demostrar que el cociente es constante bajo escala x→ → cx{displaystyle xto cx}, donde c{displaystyle c} es un cuero cabelludo
Debido a esta invariancia, es suficiente estudiar el caso especial .. x.. 2=xTx=1{displaystylefnxfnK}=x^{T}x=1}. El problema es entonces encontrar los puntos críticos de la función
Por lo tanto, los eigenvectores x1,...... ,xn{displaystyle x_{1},ldotsx_{n} de M{displaystyle M} son los puntos críticos del cociente Rayleigh y sus eigenvalues correspondientes λ λ 1,...... ,λ λ n{displaystyle lambda _{1},ldotslambda ¿Qué? son los valores estacionarios de L{displaystyle {fnMithcal}}. Esta propiedad es la base para el análisis de componentes principales y correlación canónica.
Uso en la teoría de Sturm-Liouville
La teoría de Sturm-Liouville se refiere a la acción del operador lineal
Esto a veces se presenta en una forma equivalente, obtenida al separar la integral en el numerador y usar la integración por partes:
Generalizaciones
- Para un par dado (A, B) de matrices, y un vector no cero dado x, el cociente generalizado de Rayleigh se define como: El coeficiente de Rayleigh generalizado se puede reducir al coeficiente de Rayleigh R()D,CAlternativa Alternativa x){displaystyle R(D,C^{*}x)} a través de la transformación D=C− − 1ACAlternativa Alternativa − − 1{displaystyle ¿Qué? Donde CCAlternativa Alternativa {displaystyle CC^{*} es la descomposición de Cholesky de la matriz Hermitian positivo-definido B.R()A,B;x):=xAlternativa Alternativa AxxAlternativa Alternativa Bx.{displaystyle R(A,B;x):={frac {x^{*}{x^{*}Bx}}}
- Para un par dado (x, Sí.) de vectores no cero, y una matriz hermitiana dada H, el cociente generalizado de Rayleigh puede definirse como: que coincide con R()H,xCuando x=Sí.. En la mecánica cuántica, esta cantidad se llama un "elemento de matrix" o a veces una "amplia de transición".R()H;x,Sí.):=Sí.Alternativa Alternativa HxSí.Alternativa Alternativa Sí.⋅ ⋅ xAlternativa Alternativa x{displaystyle R(H;x,y):={ frac {y^{*} ¿Qué? #
Contenido relacionado
Derivado de material
Teoría del elemento pala
Cierre (matemáticas)