Mecánica lagrangiana
En física, la mecánica lagrangiana es una formulación de la mecánica clásica basada en el principio de acción estacionaria (también conocido como principio de mínima acción). Fue introducido por el matemático y astrónomo italo-francés Joseph-Louis Lagrange en su obra de 1788, Mécanique analytique.
La mecánica lagrangiana describe un sistema mecánico con un par , que consta de un espacio de configuración y una función suave llamada lagrangiana. Por convención, donde y son las energías cinética y potencial del sistema, respectivamente.
El principio de acción estacionaria requiere que la función de acción del sistema derivada deba permanecer en un punto estacionario (máximo, mínimo o silla) a lo largo de la evolución temporal del sistema. Esta restricción permite el cálculo de las ecuaciones de movimiento del sistema utilizando las ecuaciones de Lagrange.
Introducción
Supongamos que existe una cuenta que se desliza por un alambre, o un péndulo simple que se balancea, etc. Si uno rastrea cada uno de los objetos masivos (cuenta, lenteja del péndulo, etc.) como una partícula, el cálculo del movimiento de la partícula usando la mecánica newtoniana requeriría resolver la fuerza de restricción variable en el tiempo requerida para mantener la partícula en movimiento restringido (fuerza de reacción ejercida por el alambre en la cuenta, o tensión en la barra del péndulo). Para el mismo problema que usa la mecánica de Lagrangian, uno observa el camino que puede tomar la partícula y elige un conjunto conveniente de independientescoordenadas generalizadas que caracterizan completamente el posible movimiento de la partícula. Esta elección elimina la necesidad de que la fuerza de restricción entre en el sistema de ecuaciones resultante. Hay menos ecuaciones ya que no se está calculando directamente la influencia de la restricción sobre la partícula en un momento dado.
Para una amplia variedad de sistemas físicos, si el tamaño y la forma de un objeto masivo son insignificantes, es una simplificación útil tratarlo como una partícula puntual. Para un sistema de N partículas puntuales con masas m 1, m 2,..., m N, cada partícula tiene un vector de posición, denotado r 1, r 2,..., r N. Las coordenadas cartesianas suelen ser suficientes, por lo que r 1 = (x 1, y 1, z 1), r 2 = (x 2, y 2, z 2) y así sucesivamente. En el espacio tridimensional, cada vector de posición requiere tres coordenadas para definir de forma única la ubicación de un punto, por lo que hay 3 N coordenadas para definir de forma única la configuración del sistema. Todos estos son puntos específicos en el espacio para ubicar las partículas; un punto general en el espacio se escribe r = (x, y, z). La velocidad de cada partícula es qué tan rápido se mueve la partícula a lo largo de su trayectoria de movimiento, y es la derivada del tiempo de su posición, por lo tanto
En la mecánica newtoniana, las ecuaciones de movimiento están dadas por las leyes de Newton. La segunda ley "la fuerza neta es igual a la masa por la aceleración",
se aplica a cada partícula. Para un sistema de N partículas en 3 dimensiones, hay 3 N ecuaciones diferenciales ordinarias de segundo orden en las posiciones de las partículas para resolver.
El lagrangiano
En lugar de fuerzas, la mecánica lagrangiana utiliza las energías del sistema. La cantidad central de la mecánica lagrangiana es el lagrangiano, una función que resume la dinámica de todo el sistema. En general, el Lagrangiano tiene unidades de energía, pero no una expresión única para todos los sistemas físicos. Cualquier función que genere las ecuaciones de movimiento correctas, de acuerdo con las leyes físicas, puede tomarse como lagrangiana. Sin embargo, es posible construir expresiones generales para grandes clases de aplicaciones. El Lagrangiano no relativista para un sistema de partículas se puede definir por
dónde
es la energía cinética total del sistema, igual a la suma Σ de las energías cinéticas de las partículas, y V es la energía potencial del sistema.
La energía cinética es la energía del movimiento del sistema, y v k = v k · v k es la magnitud al cuadrado de la velocidad, equivalente al producto escalar de la velocidad consigo misma. La energía cinética es función únicamente de las velocidades v k, no de las posiciones rk ni del tiempo t, por lo que T = T (v 1, v 2,...).
La energía potencial del sistema refleja la energía de interacción entre las partículas, es decir, cuánta energía tendrá una partícula debido a todas las demás ya otras influencias externas. Para fuerzas conservativas (p. ej., la gravedad newtoniana), es una función de los vectores de posición de las partículas únicamente, por lo que V = V (r 1, r 2,...). Para aquellas fuerzas no conservativas que pueden derivarse de un potencial apropiado (por ejemplo, potencial electromagnético), también aparecerán las velocidades, V = V (r 1, r 2,..., v 1, v 2,...). Si hay algún campo externo o fuerza impulsora externa que cambia con el tiempo, el potencial cambiará con el tiempo, por lo que generalmente V = V (r 1, r 2,..., v 1, v 2,..., t).
La forma anterior de L no se cumple en la mecánica lagrangiana relativista y debe ser reemplazada por una función consistente con la relatividad especial o general. Además, para las fuerzas disipativas se debe introducir otra función junto a L.
Una o más de las partículas pueden estar sujetas cada una a una o más restricciones holonómicas; dicha restricción se describe mediante una ecuación de la forma f (r, t) = 0. Si el número de restricciones en el sistema es C, entonces cada restricción tiene una ecuación, f 1 (r, t) = 0, f 2 (r, t) = 0,..., f C (r, t) = 0, cada uno de los cuales podría aplicarse a cualquiera de las partículas. Si la partícula k está sujeta a la restricción i, entonces f i(r k, t) = 0. En cualquier instante de tiempo, las coordenadas de una partícula restringida están vinculadas entre sí y no son independientes. Las ecuaciones de restricción determinan las rutas permitidas por las que se pueden mover las partículas, pero no dónde están o qué tan rápido van en cada instante de tiempo. Las restricciones no holonómicas dependen de las velocidades, aceleraciones o derivadas superiores de la posición de las partículas. La mecánica lagrangiana solo se puede aplicar a sistemas cuyas restricciones, si las hay, son todas holonómicas. Tres ejemplos de restricciones no holonómicas son:cuando las ecuaciones de restricción no son integrables, cuando las restricciones tienen desigualdades o con fuerzas complicadas no conservativas como la fricción. Las restricciones no holonómicas requieren un tratamiento especial y es posible que haya que volver a la mecánica newtoniana o utilizar otros métodos.
Si T o V o ambos dependen explícitamente del tiempo debido a restricciones variables en el tiempo o influencias externas, el Lagrangiano L (r 1, r 2,... v 1, v 2,... t) es explícitamente dependiente del tiempo. Si ni la energía potencial ni la cinética dependen del tiempo, entonces el Lagrangiano L (r 1, r 2,... v 1, v 2,...) es explícitamente independiente del tiempo. En cualquier caso, el Lagrangiano siempre tendrá una dependencia temporal implícita a través de las coordenadas generalizadas.
Con estas definiciones, las ecuaciones de Lagrange del primer tipo son
Ecuaciones de Lagrange (Primer tipo)
donde k = 1, 2,..., N etiqueta las partículas, hay un multiplicador de Lagrange λ i para cada ecuación de restricción f i, y
son abreviaturas de un vector de derivadas parciales ∂/∂ con respecto a las variables indicadas (no una derivada con respecto al vector completo). Cada sobrepunto es una forma abreviada de una derivada temporal. Este procedimiento aumenta el número de ecuaciones a resolver en comparación con las leyes de Newton, de 3 N a 3 N + C, porque hay 3 N ecuaciones diferenciales de segundo orden acopladas en las coordenadas de posición y multiplicadores, además de C ecuaciones de restricción. Sin embargo, cuando se resuelven junto con las coordenadas de posición de las partículas, los multiplicadores pueden brindar información sobre las fuerzas de restricción. No es necesario eliminar las coordenadas resolviendo las ecuaciones de restricción.
En el Lagrangiano, las coordenadas de posición y los componentes de velocidad son todas variables independientes, y las derivadas del Lagrangiano se toman con respecto a estas por separado de acuerdo con las reglas de diferenciación habituales (p. ej., la derivada parcial de L con respecto al componente de velocidad z de la partícula 2, definida por , es simplemente ; no es necesario usar reglas de cadena complicadas ni derivadas totales para relacionar el componente de velocidad con la coordenada correspondiente z 2).
En cada ecuación de restricción, una coordenada es redundante porque se determina a partir de las otras coordenadas. El número de coordenadas independientes es por lo tanto n = 3 N − C. Podemos transformar cada vector de posición en un conjunto común de n coordenadas generalizadas, escritas convenientemente como una n -tupla q = (q 1, q 2,... q n), expresando cada vector de posición y, por lo tanto, las coordenadas de posición, como funciones de las coordenadas generalizadas y el tiempo,
El vector q es un punto en el espacio de configuración del sistema. Las derivadas temporales de las coordenadas generalizadas se denominan velocidades generalizadas, y para cada partícula la transformación de su vector velocidad, la derivada total de su posición con respecto al tiempo, es
Dada esta v k, la energía cinética en coordenadas generalizadas depende de las velocidades generalizadas, las coordenadas generalizadas y el tiempo si los vectores de posición dependen explícitamente del tiempo debido a restricciones variables en el tiempo, entonces .
Con estas definiciones, las ecuaciones de Euler-Lagrange, o ecuaciones de Lagrange de segundo tipo
Ecuaciones de Lagrange (Segunda especie)
son resultados matemáticos del cálculo de variaciones, que también se pueden utilizar en mecánica. Sustituyendo en el Lagrangiano L (q, d q /d t, t), se obtienen las ecuaciones de movimiento del sistema. El número de ecuaciones ha disminuido en comparación con la mecánica newtoniana, de 3 N a n = 3 N − C ecuaciones diferenciales acopladas de segundo orden en las coordenadas generalizadas. Estas ecuaciones no incluyen fuerzas de restricción en absoluto, solo se deben tener en cuenta las fuerzas que no son de restricción.
Aunque las ecuaciones de movimiento incluyen derivadas parciales, los resultados de las derivadas parciales siguen siendo ecuaciones diferenciales ordinarias en las coordenadas de posición de las partículas. La derivada del tiempo total denotada d/ dt a menudo implica una diferenciación implícita. Ambas ecuaciones son lineales en el Lagrangiano, pero generalmente serán ecuaciones acopladas no lineales en las coordenadas.
De la mecánica newtoniana a la lagrangiana
Leyes de newton
Para simplificar, las leyes de Newton se pueden ilustrar para una partícula sin mucha pérdida de generalidad (para un sistema de N partículas, todas estas ecuaciones se aplican a cada partícula en el sistema). La ecuación de movimiento de una partícula de masa m es la segunda ley de Newton de 1687, en notación vectorial moderna
donde a es su aceleración y F la fuerza resultante que actúa sobre él. En tres dimensiones espaciales, este es un sistema de tres ecuaciones diferenciales ordinarias de segundo orden acopladas para resolver, ya que hay tres componentes en esta ecuación vectorial. La solución es el vector de posición r de la partícula en el tiempo t, sujeto a las condiciones iniciales de r y v cuando t = 0.
Las leyes de Newton son fáciles de usar en coordenadas cartesianas, pero las coordenadas cartesianas no siempre son convenientes y, para otros sistemas de coordenadas, las ecuaciones de movimiento pueden volverse complicadas. En un conjunto de coordenadas curvilíneas ξ = (ξ, ξ, ξ), la ley en notación de índice tensorial es la "forma Lagrangiana"
donde F es la a -ésima componente contravariante de la fuerza resultante que actúa sobre la partícula, Γ bc son los símbolos de Christoffel de segunda clase,
es la energía cinética de la partícula, y g bc las componentes covariantes del tensor métrico del sistema de coordenadas curvilíneas. Todos los índices a, b, c, toman cada uno los valores 1, 2, 3. Las coordenadas curvilíneas no son lo mismo que las coordenadas generalizadas.
Puede parecer una complicación excesiva formular la ley de Newton de esta forma, pero tiene sus ventajas. Los componentes de aceleración en términos de los símbolos de Christoffel se pueden evitar evaluando en su lugar las derivadas de la energía cinética. Si no hay una fuerza resultante que actúe sobre la partícula, F = 0, no acelera, sino que se mueve con velocidad constante en línea recta. Matemáticamente, las soluciones de la ecuación diferencial son geodésicas., las curvas de longitud extrema entre dos puntos en el espacio (estos pueden terminar siendo mínimos por lo que los caminos más cortos, pero eso no es necesario). En el espacio real 3D plano, las geodésicas son simplemente líneas rectas. Entonces, para una partícula libre, la segunda ley de Newton coincide con la ecuación geodésica y establece que las partículas libres siguen geodésicas, las trayectorias extremas a lo largo de las cuales se puede mover. Si la partícula está sujeta a fuerzas, F ≠ 0, la partícula se acelera debido a las fuerzas que actúan sobre ella y se desvía de las geodésicas que seguiría si estuviera libre. Con extensiones apropiadas de las cantidades dadas aquí en el espacio 3D plano al espacio-tiempo curvo 4D, la forma anterior de la ley de Newton también se traslada a la relatividad general de Einstein, en cuyo caso las partículas libres siguen geodésicas en el espacio-tiempo curvo que ya no son "líneas rectas" en el sentido ordinario.
Sin embargo, aún necesitamos conocer la fuerza resultante total F que actúa sobre la partícula, que a su vez requiere la fuerza resultante sin restricción N más la fuerza resultante de restricción C,
Las fuerzas de restricción pueden ser complicadas, ya que generalmente dependerán del tiempo. Además, si hay restricciones, las coordenadas curvilíneas no son independientes sino que están relacionadas por una o más ecuaciones de restricción.
Las fuerzas de restricción pueden eliminarse de las ecuaciones de movimiento para que solo queden las fuerzas que no son de restricción, o incluirse al incluir las ecuaciones de restricción en las ecuaciones de movimiento.
Principio de D'Alembert
Un resultado fundamental de la mecánica analítica es el principio de D'Alembert, introducido en 1708 por Jacques Bernoulli para comprender el equilibrio estático y desarrollado por D'Alembert en 1743 para resolver problemas dinámicos. El principio afirma que para N partículas el trabajo virtual, es decir, el trabajo a lo largo de un desplazamiento virtual, δ r k, es cero:
Los desplazamientos virtuales, δr k , son por definición cambios infinitesimales en la configuración del sistema consistentes con las fuerzas de restricción que actúan sobre el sistema en un instante de tiempo, es decir, de tal manera que las fuerzas de restricción mantienen el movimiento restringido. No son lo mismo que los desplazamientos reales en el sistema, que son causados por las fuerzas de restricción y de no restricción resultantes que actúan sobre la partícula para acelerarla y moverla. El trabajo virtual es el trabajo realizado a lo largo de un desplazamiento virtual para cualquier fuerza (restringida o no restringida).
Dado que las fuerzas de restricción actúan perpendicularmente al movimiento de cada partícula en el sistema para mantener las restricciones, el trabajo virtual total de las fuerzas de restricción que actúan sobre el sistema es cero:
de modo que
Por lo tanto, el principio de D'Alembert nos permite concentrarnos solo en las fuerzas aplicadas sin restricción y excluir las fuerzas de restricción en las ecuaciones de movimiento. La forma mostrada también es independiente de la elección de las coordenadas. Sin embargo, no se puede usar fácilmente para establecer las ecuaciones de movimiento en un sistema de coordenadas arbitrario, ya que los desplazamientos δ r k pueden conectarse mediante una ecuación de restricción, lo que nos impide establecer los N sumandos individuales en 0. Por lo tanto, buscaremos un sistema de coordenadas mutuamente independientes para el cual la suma total será 0 si y solo si los sumandos individuales son 0. Establecer cada uno de los sumandos en 0 eventualmente nos dará nuestras ecuaciones de movimiento separadas.
Ecuaciones de movimiento a partir del principio de D'Alembert
Si hay restricciones sobre la partícula k, entonces dado que las coordenadas de la posición r k = (x k, yk, z k) están unidas por una ecuación de restricción, también lo están las de los desplazamientos virtuales δ r k = ( δx k, δyk, δzk ). _ Dado que las coordenadas generalizadas son independientes, podemos evitar las complicaciones con el δ r k al convertir a desplazamientos virtuales en las coordenadas generalizadas. Estos están relacionados de la misma forma que un diferencial total,
No existe una derivada temporal parcial con respecto al tiempo multiplicado por un incremento de tiempo, ya que este es un desplazamiento virtual, uno a lo largo de las restricciones en un instante de tiempo.
El primer término en el principio de D'Alembert anterior es el trabajo virtual realizado por las fuerzas sin restricciones N k a lo largo de los desplazamientos virtuales δ r k, y puede convertirse sin pérdida de generalidad en los análogos generalizados mediante la definición de fuerzas generalizadas
de modo que
Esta es la mitad de la conversión a coordenadas generalizadas. Queda por convertir el término de aceleración en coordenadas generalizadas, lo que no es inmediatamente obvio. Recordando la forma de Lagrange de la segunda ley de Newton, las derivadas parciales de la energía cinética con respecto a las coordenadas y velocidades generalizadas se pueden encontrar para dar el resultado deseado:
Ahora el principio de D'Alembert está en las coordenadas generalizadas requeridas,
y dado que estos desplazamientos virtuales δq j son independientes y distintos de cero, los coeficientes se pueden igualar a cero, lo que da como resultado las ecuaciones de Lagrange o las ecuaciones de movimiento generalizadas,
Estas ecuaciones son equivalentes a las leyes de Newton para las fuerzas sin restricciones. Las fuerzas generalizadas en esta ecuación se derivan únicamente de las fuerzas sin restricción: las fuerzas de restricción se han excluido del principio de D'Alembert y no es necesario encontrarlas. Las fuerzas generalizadas pueden ser no conservativas, siempre que satisfagan el principio de D'Alembert.
Ecuaciones de Euler-Lagrange y principio de Hamilton
Para una fuerza no conservativa que depende de la velocidad, puede ser posible encontrar una función de energía potencial V que dependa de posiciones y velocidades. Si las fuerzas generalizadas Q i pueden derivarse de un potencial V tal que
igualando las ecuaciones de Lagrange y definiendo el lagrangiano como L = T − V se obtienen las ecuaciones de Lagrange de segundo tipo o las ecuaciones de movimiento de Euler-Lagrange
Sin embargo, las ecuaciones de Euler-Lagrange solo pueden tener en cuenta las fuerzas no conservativas si se puede encontrar un potencial como se muestra. Es posible que esto no siempre sea posible para fuerzas no conservativas, y las ecuaciones de Lagrange no involucran ningún potencial, solo fuerzas generalizadas; por lo tanto, son más generales que las ecuaciones de Euler-Lagrange.
Las ecuaciones de Euler-Lagrange también se derivan del cálculo de variaciones. La variación del Lagrangiano es
que tiene una forma similar a la diferencial total de L, pero los desplazamientos virtuales y sus derivadas en el tiempo reemplazan a las diferenciales, y no hay incremento de tiempo de acuerdo con la definición de los desplazamientos virtuales. Una integración por partes con respecto al tiempo puede transferir la derivada temporal de δq j a ∂ L /∂(d q j /d t), en el proceso intercambiando d(δq j)/d t por δq j, permitiendo la independencia desplazamientos virtuales a factorizar a partir de las derivadas del Lagrangiano,
Ahora, si la condición δq j (t 1) = δq j (t 2) = 0 se cumple para todo j, los términos no integrados son cero. Si además toda la integral de tiempo de δL es cero, entonces debido a que los δq j son independientes, y la única manera de que una integral definida sea cero es si el integrando es igual a cero, cada uno de los coeficientes de δq j también debe ser cero. Entonces obtenemos las ecuaciones de movimiento. Esto se puede resumir por el principio de Hamilton:
La integral de tiempo del Lagrangiano es otra cantidad llamada acción, definida como
que es un funcional; toma la función lagrangiana para todos los tiempos entre t 1 y t 2 y devuelve un valor escalar. Sus dimensiones son las mismas que [momento angular], [energía]·[tiempo] o [longitud]·[momento]. Con esta definición el principio de Hamilton es
Por lo tanto, en lugar de pensar en partículas que se aceleran en respuesta a las fuerzas aplicadas, uno podría pensar en ellas eligiendo el camino con una acción estacionaria, con los puntos finales del camino en el espacio de configuración fijos en los tiempos inicial y final. El principio de Hamilton a veces se conoce como el principio de acción mínima, sin embargo, la función de acción solo necesita ser estacionaria, no necesariamente un valor máximo o mínimo. Cualquier variación de la funcional da un incremento en la integral funcional de la acción.
Históricamente, la idea de encontrar el camino más corto que puede seguir una partícula sujeta a una fuerza motivó las primeras aplicaciones del cálculo de variaciones a problemas mecánicos, como el problema de la braquistocrona resuelto por Jean Bernoulli en 1696, así como por Leibniz, Daniel Bernoulli, L'Hôpital por la misma época y Newton al año siguiente. El propio Newton pensaba en la línea del cálculo variacional, pero no lo publicó. Estas ideas, a su vez, conducen a los principios variacionales de la mecánica, de Fermat, Maupertuis, Euler, Hamilton y otros.
El principio de Hamilton se puede aplicar a restricciones no holonómicas si las ecuaciones de restricción se pueden poner en una forma determinada, una combinación lineal de diferenciales de primer orden en las coordenadas. La ecuación de restricción resultante se puede reorganizar en una ecuación diferencial de primer orden. Esto no se dará aquí.
Multiplicadores y restricciones de Lagrange
El Lagrangiano L se puede variar en las coordenadas cartesianas rk, para N partículas,
El principio de Hamilton sigue siendo válido incluso si las coordenadas en las que se expresa L no son independientes, aquí r k, pero aún se supone que las restricciones son holonómicas. Como siempre, los puntos finales son fijos δ r k (t 1) = δ r k (t 2) = 0 para todos los k. Lo que no se puede hacer es simplemente igualar los coeficientes de δ r k a cero porque el δ r kno son independientes. En su lugar, se puede utilizar el método de los multiplicadores de Lagrange para incluir las restricciones. Multiplicando cada ecuación de restricción f i (r k, t) = 0 por un multiplicador de Lagrange λ i para i = 1, 2,..., C, y sumando los resultados al Lagrangiano original, se obtiene el nuevo Lagrangiano
Los multiplicadores de Lagrange son funciones arbitrarias del tiempo t, pero no funciones de las coordenadas r k, por lo que los multiplicadores están en pie de igualdad con las coordenadas de posición. Variando este nuevo Lagrangiano e integrando con respecto al tiempo da
Los multiplicadores introducidos se pueden encontrar para que los coeficientes de δ r k sean cero, aunque los rk no sean independientes. Las ecuaciones de movimiento siguen. Del análisis anterior, obtener la solución de esta integral es equivalente al enunciado
que son las ecuaciones de Lagrange de primera especie. Además, las ecuaciones de Euler-Lagrange λ i para el nuevo Lagrangiano devuelven las ecuaciones de restricción
Para el caso de una fuerza conservativa dada por el gradiente de alguna energía potencial V, una función de las coordenadas r k solamente, sustituyendo el Lagrangiano L = T − V da
e identificando las derivadas de la energía cinética como la (negativa de la) fuerza resultante, y las derivadas del potencial igualando la fuerza sin restricción, se deduce que las fuerzas de restricción son
dando así las fuerzas de restricción explícitamente en términos de las ecuaciones de restricción y los multiplicadores de Lagrange.
Propiedades del Lagrangiano
No unicidad
El Lagrangiano de un sistema dado no es único. Un Lagrangiano L puede ser multiplicado por una constante a distinta de cero y desplazado por una constante arbitraria b , y el nuevo Lagrangiano L' = aL + b describirá el mismo movimiento que L. Si uno se restringe como arriba a trayectorias sobre un intervalo de tiempo dado y puntos finales fijos y , entonces dos Lagrangianos que describen el mismo sistema pueden diferir por la "derivada de tiempo total" de una función :
donde significa
Ambos lagrangianos y producen las mismas ecuaciones de movimiento ya que las acciones correspondientes y están relacionadas a través de
con los dos últimos componentes e independiente de
Invariancia bajo transformaciones puntuales
Dado un conjunto de coordenadas generalizadas q, si cambiamos estas variables a un nuevo conjunto de coordenadas generalizadas s según una transformación puntual q = q (s, t), el nuevo Lagrangiano L ′ es una función de las nuevas coordenadas
y por la regla de la cadena para diferenciación parcial, las ecuaciones de Lagrange son invariantes bajo esta transformación;
Esto puede simplificar las ecuaciones de movimiento.
Coordenadas cíclicas y momentos conservados
Una propiedad importante del lagrangiano es que las cantidades conservadas se pueden leer fácilmente. El momento generalizado "canónicamente conjugado con" la coordenada q i se define por
Si el Lagrangiano L no depende de alguna coordenada q i, se sigue inmediatamente de las ecuaciones de Euler-Lagrange que
y la integración muestra que el impulso generalizado correspondiente es igual a una cantidad conservada constante. Este es un caso especial del teorema de Noether. Tales coordenadas se denominan "cíclicas" o "ignorables".
Por ejemplo, un sistema puede tener un Lagrangiano
donde r y z son longitudes a lo largo de líneas rectas, s es una longitud de arco a lo largo de alguna curva, y θ y φ son ángulos. Observe que z, s y φ están ausentes en el Lagrangiano aunque sus velocidades no lo estén. Entonces los momentos
son todas cantidades conservadas. Las unidades y naturaleza de cada impulso generalizado dependerán de la coordenada correspondiente; en este caso, p z es un momento de traslación en la dirección z, p s también es un momento de traslación a lo largo de la curva que se mide s, y p φ es un momento angular en el plano en el que se mide el ángulo φ. Por complicado que sea el movimiento de el sistema es, todas las coordenadas y velocidades variarán de tal manera que estos momentos se conservan.
Energía
Definición
Dado un Lagrangiano, la energía del sistema mecánico correspondiente es, por definición,
Invariancia bajo transformaciones de coordenadas
En cada instante de tiempo la energía es invariante bajo los cambios de coordenadas del espacio de configuración , es decir
Además de este resultado, la siguiente prueba muestra que, bajo tal cambio de coordenadas, las derivadas cambian como coeficientes de forma lineal.
mostrarPrueba |
Conservación
En la mecánica lagrangiana, el sistema es cerrado si y solo si su lagrangiano no depende explícitamente del tiempo. La ley de conservación de la energía establece que la energía de un sistema cerrado es una integral de movimiento.
Más precisamente, sea un extremal. (En otras palabras, satisface las ecuaciones de Euler-Lagrange). Tomando la derivada temporal total de a lo largo de este extremo y usando las ecuaciones EL conduce a
Si el lagrangiano no depende explícitamente del tiempo, entonces también lo es, de hecho, una integral de movimiento, lo que significa que
Por lo tanto, la energía se conserva.
Energías cinéticas y potenciales
También se sigue que la energía cinética es una función homogénea de grado 2 en las velocidades generalizadas. Si además el potencial V es sólo una función de coordenadas e independiente de las velocidades, se sigue por cálculo directo, o uso del teorema de Euler para funciones homogéneas, que
En todas estas circunstancias, la constante
es la energía total del sistema. Las energías cinética y potencial siguen cambiando a medida que evoluciona el sistema, pero el movimiento del sistema será tal que su suma, la energía total, será constante. Esta es una simplificación valiosa, ya que la energía E es una constante de integración que cuenta como una constante arbitraria para el problema, y puede ser posible integrar las velocidades de esta relación de energía para resolver las coordenadas. En el caso de que la velocidad, la energía cinética o ambas dependan del tiempo, entonces la energía no se conserva.
Similitud mecánica
Si la energía potencial es una función homogénea de las coordenadas e independiente del tiempo, y todos los vectores de posición están escalados por la misma constante distinta de cero α, r k ′ = α r k, de modo que
y el tiempo se escala por un factor β, t ′ = βt, entonces las velocidades v k se escalan por un factor de α / β y la energía cinética T por (α / β). Todo el Lagrangiano ha sido escalado por el mismo factor si
Dado que las longitudes y los tiempos se han escalado, las trayectorias de las partículas en el sistema siguen caminos geométricamente similares que difieren en tamaño. La longitud l recorrida en el tiempo t en la trayectoria original corresponde a una nueva longitud l' recorrida en el tiempo t' en la nueva trayectoria, dada por los cocientes
Partículas que interactúan
Para un sistema dado, si dos subsistemas A y B no interactúan, el Lagrangiano L del sistema general es la suma de los Lagrangianos L A y L B para los subsistemas:
Si interactúan, esto no es posible. En algunas situaciones, puede ser posible separar el Lagrangiano del sistema L en la suma de los Lagrangianos que no interactúan, más otro Lagrangiano L AB que contiene información sobre la interacción,
Esto puede estar motivado físicamente al considerar que los lagrangianos que no interactúan son solo energías cinéticas, mientras que el lagrangiano de interacción es la energía potencial total del sistema. Además, en el caso límite de interacción insignificante, L AB tiende a cero, lo que reduce al caso anterior de no interacción.
La extensión a más de dos subsistemas que no interactúan es sencilla: el lagrangiano general es la suma de los lagrangianos separados para cada subsistema. Si hay interacciones, entonces se pueden agregar lagrangianos de interacción.
Ejemplos
Los siguientes ejemplos aplican las ecuaciones de Lagrange del segundo tipo a problemas mecánicos.
Fuerza conservadora
Una partícula de masa m se mueve bajo la influencia de una fuerza conservativa derivada del gradiente ∇ de un potencial escalar,
Si hay más partículas, de acuerdo con los resultados anteriores, la energía cinética total es una suma de todas las energías cinéticas de las partículas, y el potencial es una función de todas las coordenadas.
Coordenadas cartesianas
El Lagrangiano de la partícula se puede escribir
Las ecuaciones de movimiento de la partícula se encuentran aplicando la ecuación de Euler-Lagrange, para la coordenada x
con derivados
por eso
y de manera similar para las coordenadas y y z. Recogiendo las ecuaciones en forma vectorial encontramos
que es la segunda ley de movimiento de Newton para una partícula sujeta a una fuerza conservativa.
Coordenadas polares en 2D y 3D
El Lagrangiano para el problema anterior en coordenadas esféricas (las coordenadas polares 2D se pueden recuperar ajustando ), con un potencial central, es
entonces las ecuaciones de Euler-Lagrange son
La coordenada φ es cíclica ya que no aparece en el Lagrangiano, por lo que el momento conservado en el sistema es el momento angular
en el que r, θ y dφ/dt pueden variar con el tiempo, pero solo de tal manera que p φ sea constante.
Péndulo sobre un soporte móvil
Considere un péndulo de masa m y longitud ℓ, que está sujeto a un soporte con masa M, que puede moverse a lo largo de una línea en la dirección -. Sea la coordenada a lo largo de la línea del soporte, y denotemos la posición del péndulo por el ángulo de la vertical. Las coordenadas y componentes de velocidad de la lenteja del péndulo son
Las coordenadas generalizadas pueden tomarse como y . Entonces la energía cinética del sistema es
y la energía potencial es
dando el lagrangiano
Dado que está ausente del Lagrangiano, es una coordenada cíclica. El impulso conservado es
y la ecuación de Lagrange para la coordenada de soporte es
La ecuación de Lagrange para el ángulo es
y simplificando
Estas ecuaciones pueden parecer bastante complicadas, pero encontrarlas con las leyes de Newton habría requerido identificar cuidadosamente todas las fuerzas, lo que habría sido mucho más laborioso y propenso a errores. Al considerar los casos límite, se puede verificar la corrección de este sistema: por ejemplo, se deben dar las ecuaciones de movimiento de un péndulo simple que está en reposo en algún marco inercial, mientras que se deben dar las ecuaciones de un péndulo en un sistema en aceleración constante, etc. Además, es trivial obtener los resultados numéricamente, dadas las condiciones de inicio adecuadas y un paso de tiempo elegido, recorriendo los resultados iterativamente.
Problema de fuerza central de dos cuerpos
Dos cuerpos de masas m 1 y m 2 con vectores de posición r 1 y r 2 están en órbita uno alrededor del otro debido a un atractivo potencial central V. Podemos escribir el Lagrangiano en términos de las coordenadas de posición tal como son, pero es un procedimiento establecido para convertir el problema de dos cuerpos en un problema de un solo cuerpo de la siguiente manera. Introducir las coordenadas de Jacobi; la separación de los cuerpos r = r 2 − r 1 y la ubicación del centro de masa R = (m 1 r 1 + m2 r 2)/(metro 1 + metro 2). El lagrangiano es entonces
donde M = m 1 + m 2 es la masa total, μ = m 1 m 2 /(m 1 + m 2) es la masa reducida, y V el potencial de la fuerza radial, que depende únicamente de la magnitud de la separación | r | = | r 2 - r 1 |. El lagrangiano se divide en un término de centro de masa L cm y un término de movimiento relativo L rel.
La ecuación de Euler-Lagrange para R es simplemente
que establece que el centro de masa se mueve en línea recta a velocidad constante.
Dado que el movimiento relativo solo depende de la magnitud de la separación, es ideal usar coordenadas polares (r, θ) y tomar r = | r |,
entonces θ es una coordenada cíclica con el correspondiente momento conservado (angular)
La coordenada radial r y la velocidad angular d θ /d t pueden variar con el tiempo, pero solo de tal manera que ℓ sea constante. La ecuación de Lagrange para r es
Esta ecuación es idéntica a la ecuación radial obtenida usando las leyes de Newton en un marco de referencia co-rotatorio, es decir, un marco que gira con la masa reducida para que parezca estacionario. Eliminando la velocidad angular d θ /d t de esta ecuación radial,
que es la ecuación de movimiento para un problema unidimensional en el que una partícula de masa μ está sujeta a la fuerza central hacia adentro − d V /d r y una segunda fuerza hacia afuera, llamada en este contexto fuerza centrífuga
Por supuesto, si uno permanece completamente dentro de la formulación unidimensional, ℓ entra solo como un parámetro impuesto de la fuerza externa hacia afuera, y su interpretación como momento angular depende del problema bidimensional más general del que se originó el problema unidimensional..
Si uno llega a esta ecuación utilizando la mecánica newtoniana en un marco co-rotatorio, la interpretación es evidente como la fuerza centrífuga en ese marco debido a la rotación del propio marco. Si uno llega a esta ecuación directamente usando las coordenadas generalizadas (r, θ) y simplemente siguiendo la formulación de Lagrange sin pensar en marcos en absoluto, la interpretación es que la fuerza centrífuga es una consecuencia del uso de coordenadas polares. Como dice Hildebrand:
"Dado que tales cantidades no son verdaderas fuerzas físicas, a menudo se les llama fuerzas de inercia. Su presencia o ausencia depende, no del problema particular en cuestión, sino del sistema de coordenadas elegido ". En particular, si se eligen las coordenadas cartesianas, la fuerza centrífuga desaparece y la formulación involucra solo la fuerza central en sí misma, que proporciona la fuerza centrípeta para un movimiento curvo.
Este punto de vista, que las fuerzas ficticias se originan en la elección de las coordenadas, a menudo lo expresan los usuarios del método Lagrangiano. Este punto de vista surge naturalmente en el enfoque lagrangiano, porque el marco de referencia es (posiblemente inconscientemente) seleccionado por la elección de las coordenadas. Por ejemplo, consulte una comparación de lagrangianos en un marco de referencia inercial y no inercial. Véase también la discusión de formulaciones lagrangianas "total" y "actualizada" en.Desafortunadamente, este uso de "fuerza de inercia" entra en conflicto con la idea newtoniana de una fuerza de inercia. En el punto de vista newtoniano, una fuerza de inercia se origina en la aceleración del marco de observación (el hecho de que no es un marco de referencia inercial), no en la elección del sistema de coordenadas. Para mantener las cosas claras, es más seguro referirse a las fuerzas de inercia lagrangianas como fuerzas de inercia generalizadas, para distinguirlas de las fuerzas de inercia vectoriales newtonianas. Es decir, uno debe evitar seguir a Hildebrand cuando dice (p. 155) "tratamos siempre con fuerzas generalizadas, aceleraciones de velocidades y momentos. Por brevedad, el adjetivo "generalizado" se omitirá con frecuencia".
Se sabe que el Lagrangiano de un sistema no es único. Dentro del formalismo lagrangiano las fuerzas ficticias newtonianas pueden identificarse por la existencia de lagrangianos alternativos en los que desaparecen las fuerzas ficticias, en ocasiones encontradas explotando la simetría del sistema.
Electromagnetismo
Una partícula de prueba es una partícula cuya masa y carga se supone que son tan pequeñas que su efecto sobre el sistema externo es insignificante. A menudo es una partícula puntual simplificada hipotética sin otras propiedades que la masa y la carga. Las partículas reales como los electrones y los quarks up son más complejas y tienen términos adicionales en sus lagrangianos.
El Lagrangiano para una partícula cargada con carga eléctrica q, interactuando con un campo electromagnético, es el ejemplo prototípico de un potencial dependiente de la velocidad. El potencial escalar eléctrico ϕ = ϕ (r, t) y el potencial vectorial magnético A = A (r, t) se definen a partir del campo eléctrico E = E (r, t) y el campo magnético B = B (r, t) como sigue:
El Lagrangiano de una partícula de prueba cargada masiva en un campo electromagnético
se llama acoplamiento mínimo. Combinado con la ecuación de Euler-Lagrange, produce la ley de fuerza de Lorentz
Transformación bajo calibre:
donde f (r,t) es cualquier función escalar de espacio y tiempo, la transformada lagrangiana antes mencionada es como:
que todavía produce la misma ley de fuerza de Lorentz.
Tenga en cuenta que el momento canónico (conjugado a la posición r) es el momento cinético más una contribución del campo A (conocido como momento potencial):
Esta relación también se utiliza en la prescripción de acoplamiento mínimo en la mecánica cuántica y la teoría cuántica de campos. A partir de esta expresión, podemos ver que el momento canónico p no es invariante de calibre y, por lo tanto, no es una cantidad física medible; Sin embargo, si r es cíclico (es decir, el lagrangiano es independiente de la posición r), lo que sucede si los campos ϕ y A son uniformes, entonces este momento canónico p dado aquí es el momento conservado, mientras que el momento cinético físico medible m v no lo es.
Extensiones para incluir fuerzas no conservativas
La disipación (es decir, los sistemas no conservativos) también se puede tratar con un Lagrangiano efectivo formulado por una cierta duplicación de los grados de libertad.
En una formulación más general, las fuerzas podrían ser tanto conservativas como viscosas. Si se puede encontrar una transformación adecuada a partir de F i, Rayleigh sugiere usar una función de disipación, D, de la siguiente forma:
donde C jk son constantes que están relacionadas con los coeficientes de amortiguamiento en el sistema físico, aunque no necesariamente iguales a ellos. Si D se define de esta manera, entonces
y
Otros contextos y formulaciones
Las ideas de la mecánica lagrangiana tienen numerosas aplicaciones en otras áreas de la física y pueden adoptar resultados generalizados del cálculo de variaciones.
Formulaciones alternativas de la mecánica clásica.
Una formulación estrechamente relacionada de la mecánica clásica es la mecánica hamiltoniana. El hamiltoniano se define por
y se puede obtener realizando una transformación de Legendre en el Lagrangiano, que introduce nuevas variables conjugadas canónicamente a las variables originales. Por ejemplo, dado un conjunto de coordenadas generalizadas, las variables canónicamente conjugadas son los momentos generalizados. Esto duplica el número de variables, pero hace que las ecuaciones diferenciales sean de primer orden. El hamiltoniano es una cantidad particularmente omnipresente en la mecánica cuántica (ver hamiltoniano (mecánica cuántica)).
La mecánica Routhiana es una formulación híbrida de la mecánica lagrangiana y hamiltoniana, que no se usa con frecuencia en la práctica, pero es una formulación eficiente para coordenadas cíclicas.
Formulación del espacio de momento
Las ecuaciones de Euler-Lagrange también se pueden formular en términos de momentos generalizados en lugar de coordenadas generalizadas. Realizando una transformación de Legendre sobre la coordenada generalizada Lagrangiana L (q, d q /d t, t) se obtiene la cantidad de movimiento generalizada Lagrangiana L ′(p, d p /d t, t) en términos del Lagrangiano original, así como las ecuaciones EL en términos de los momentos generalizados. Ambos Lagrangianos contienen la misma información, y cualquiera puede usarse para resolver el movimiento del sistema. En la práctica, las coordenadas generalizadas son más convenientes de usar e interpretar que los momentos generalizados.
Derivadas superiores de coordenadas generalizadas
No hay ninguna razón matemática para restringir las derivadas de coordenadas generalizadas solo a primer orden. Es posible derivar ecuaciones EL modificadas para un lagrangiano que contenga derivadas de orden superior; consulte la ecuación de Euler-Lagrange para obtener más información. Sin embargo, desde el punto de vista físico, existe un obstáculo para incluir derivadas temporales superiores al primer orden, lo que está implícito en la construcción de Ostrogradsky de un formalismo canónico para lagrangianos de derivadas superiores no degeneradas, ver Ostrogradsky_instability
Óptica
La mecánica lagrangiana se puede aplicar a la óptica geométrica, aplicando principios variacionales a los rayos de luz en un medio, y resolviendo las ecuaciones EL se obtienen las ecuaciones de los caminos que siguen los rayos de luz.
Formulación relativista
La mecánica lagrangiana se puede formular en relatividad especial y relatividad general. Algunas características de la mecánica lagrangiana se conservan en las teorías relativistas, pero rápidamente aparecen dificultades en otros aspectos. En particular, las ecuaciones EL toman la misma forma, y la conexión entre las coordenadas cíclicas y los momentos conservados aún se aplica; sin embargo, el Lagrangiano debe modificarse y no es simplemente la energía cinética menos la energía potencial de una partícula. Además, no es sencillo manejar sistemas multipartículas de una manera manifiestamente covariante, puede ser posible si se selecciona un marco de referencia particular.
Mecánica cuántica
En la mecánica cuántica, la acción y la fase de la mecánica cuántica se relacionan a través de la constante de Planck, y el principio de la acción estacionaria se puede entender en términos de interferencia constructiva de las funciones de onda.
En 1948, Feynman descubrió la formulación de la integral de trayectoria extendiendo el principio de acción mínima a la mecánica cuántica para electrones y fotones. En esta formulación, las partículas recorren todos los caminos posibles entre los estados inicial y final; la probabilidad de un estado final específico se obtiene sumando todas las trayectorias posibles que conducen a él. En el régimen clásico, la formulación de la integral de trayectoria reproduce limpiamente el principio de Hamilton y el principio de Fermat en óptica.
Teoría clásica de campos
En la mecánica lagrangiana, las coordenadas generalizadas forman un conjunto discreto de variables que definen la configuración de un sistema. En la teoría de campos clásica, el sistema físico no es un conjunto de partículas discretas, sino un campo continuo ϕ (r, t) definido sobre una región del espacio 3D. Asociado con el campo hay una densidad lagrangiana
definido en términos del campo y sus derivados de espacio y tiempo en una ubicación r y tiempo t. Análogamente al caso de las partículas, para aplicaciones no relativistas, la densidad lagrangiana es también la densidad de energía cinética del campo, menos su densidad de energía potencial (esto no es cierto en general, y la densidad lagrangiana tiene que ser "ingeniería inversa"). El lagrangiano es entonces la integral de volumen de la densidad lagrangiana sobre el espacio 3D
donde dr es un elemento de volumen diferencial 3D. El lagrangiano es una función del tiempo ya que la densidad lagrangiana tiene una dependencia espacial implícita a través de los campos, y puede tener una dependencia espacial explícita, pero estos se eliminan en la integral, dejando solo el tiempo como variable para el lagrangiano.
Teorema de noether
El principio de acción y el formalismo lagrangiano están estrechamente ligados al teorema de Noether, que conecta cantidades físicas conservadas con simetrías continuas de un sistema físico.
Si el lagrangiano es invariante bajo una simetría, entonces las ecuaciones de movimiento resultantes también son invariantes bajo esa simetría. Esta característica es muy útil para mostrar que las teorías son consistentes con la relatividad especial o la relatividad general.
Contenido relacionado
Número de peclet
Efecto Coriolis
Dinámica de cuerpos rígidos