Cadena de reglas
En cálculo, el Regla de cadena es una fórmula que expresa el derivado de la composición de dos funciones diferenciables f y g en términos de los derivados de f y g. Más precisamente, si h=f∘ ∘ g{displaystyle h=fcirc g} es la función tal que h()x)=f()g()x)){displaystyle h(x)=f(g(x)} para todos x, entonces la regla de la cadena es, en la notación de Lagrange,
- h.()x)=f.()g()x))g.()x).{displaystyle h'(x)=f'(g(x))g'(x). }
o, de manera equivalente,
- h.=()f∘ ∘ g).=()f.∘ ∘ g)⋅ ⋅ g..{displaystyle h'=(fcirc g)'=(f'circ g)cdot g'}
La regla de la cadena también se puede expresar en la notación de Leibniz. Si una variable z depende de la variable y, que a su vez depende de la variable x (es decir, y y z son variables dependientes), luego z depende de x también, a través de la variable intermedia y. En este caso, la regla de la cadena se expresa como
- dzdx=dzdSí.⋅ ⋅ dSí.dx,{displaystyle {frac {dz}{dx}={frac} {dz} {y}cdot {fnMicroc {} {fnK}}}
y
- dzdxSilenciox=dzdSí.SilencioSí.()x)⋅ ⋅ dSí.dxSilenciox,{displaystyle left. {frac {dx}justo en la vida_{x}=left.{frac} {dz} {y}}justo de la vida_{y(x)}cdot left.{frac {y}}justo de la vida_{x}}
para indicar en qué puntos deben evaluarse las derivadas.
En integración, la contraparte de la regla de la cadena es la regla de sustitución.
Explicación intuitiva
Intuitivamente, la regla de la cadena establece que conocer la tasa de cambio instantánea de z en relación con y y el de y relativo a x permite calcular la tasa de cambio instantánea de z en relación con x como el producto de las dos tasas de cambio.
Como dijo George F. Simmons: "si un automóvil viaja el doble de rápido que una bicicleta y la bicicleta es cuatro veces más rápida que un hombre que camina, entonces el automóvil viaja 2 × 4 = 8 veces más rápido como el hombre."
La relación entre este ejemplo y la regla de la cadena es la siguiente. Vamos z, Sí. y x sean las posiciones (variables) del coche, la bicicleta y el hombre caminante, respectivamente. La tasa de cambio de posiciones relativas del coche y la bicicleta es dzdSí.=2.{textstyle {frac {dz} {y}=2.} Análogamente, dSí.dx=4.{textstyle {frac {y} {dx}=4.} Así que la tasa de cambio de las posiciones relativas del coche y el hombre caminante es
- dzdx=dzdSí.⋅ ⋅ dSí.dx=2⋅ ⋅ 4=8.{displaystyle {frac {dz}{dx}={frac} {dz} {cdot {fnK}=2cdot 4=8.}
La tasa de cambio de posiciones es la relación de las velocidades, y la velocidad es la derivada de la posición con respecto al tiempo; es decir,
- dzdx=dzdtdxdt,{displaystyle {frac {dz}{dx}={frac} {fnMicroc {} {fnMicroc} {fnMicroc}} {fnMicroc}} {f}} {fnMicroc}} {f}}}} {fnMicroc} {fn}}}} {fnMicroc}}} {fnMicroc}} {f}} {f}}}}} {f}}}}}}}}}} {f} {f}}}}}}}}}}}}}}}}}}} {f} {f} {f}} {f}f}}}f}}}}}}}}}}}f} {fnMicroc} {f}} {f}f}}}}}fnfnf}f}f}}fn}fnMicrocf}}}}fnf}}}}}}}}}}}}}} {dx} {dt}}}}
o, de manera equivalente,
- dzdt=dzdx⋅ ⋅ dxdt,{displaystyle {frac {dz}{dt}={frac} ¿Qué?
que también es una aplicación de la regla de la cadena.
Historia
La regla de cadena parece haber sido usada por Gottfried Wilhelm Leibniz. Lo usó para calcular el derivado de a+bz+cz2{displaystyle {sqrt {a+bz+cz^{2}}} como el compuesto de la función de la raíz cuadrada y la función a+bz+cz2{displaystyle a+bz+cz^{2}. Lo mencionó por primera vez en una memoria de 1676 (con un error de signo en el cálculo). La notación común de la regla de cadena se debe a Leibniz. Guillaume de l'Hôpital usó la regla de cadena implícitamente en su Analyse des infiniment petits. La regla de la cadena no aparece en ninguno de los libros de análisis de Leonhard Euler, aunque fueron escritos durante cien años después del descubrimiento de Leibniz.
Declaración
La forma más simple de la regla de cadena es para funciones de valor real de una variable real. Dice que si g es una función diferente en un punto c (es decir, el derivado g.c) existe) y f es una función diferente en g()c), entonces la función compuesta f∘ ∘ g{displaystyle fcirc g} es diferente en c, y el derivado es
- ()f∘ ∘ g).()c)=f.()g()c))⋅ ⋅ g.()c).{displaystyle (fcirc g)'(c)=f'(g(c))cdot g'(c). }
La regla a veces se abrevia como
- ()f∘ ∘ g).=()f.∘ ∘ g)⋅ ⋅ g..{displaystyle (fcirc g)'=(f'circ g)cdot g'}
Si y = f(u) y u = g(x), entonces esta forma abreviada se escribe en notación de Leibniz como:
- dSí.dx=dSí.du⋅ ⋅ dudx.{displaystyle {frac {fnMicroc} {fnMicroc} {fnMicrosoft} {fnMicrosoft} {fn}}} {fnMicrosoft}}}}} {fnMicroc}}}} {fnMicroc} {y} {du}cdot {fnMic {} {fnK}}}
También se pueden indicar explícitamente los puntos donde se evalúan los derivados:
- dSí.dxSilenciox=c=dSí.duSilenciou=g()c)⋅ ⋅ dudxSilenciox=c.{displaystyle left.{frac Está bien. {y} {fnMicrosoft Sans Serif} {fnMicrosoft Sans Serif} {fnMicrosoft Sans Serif}justo para siempre_{x=c}
Llevar el mismo razonamiento, dado n funciones f1,...... ,fn{displaystyle f_{1},ldotsf_{n}} con la función compuesta f1∘ ∘ ()f2∘ ∘ ⋯ ⋯ ()fn− − 1∘ ∘ fn)){displaystyle f_{1}circ (f_{2}circ cdots (f_{n-1}circ f_{n})!}, si cada función fi{displaystyle f_{i}! es diferente en su entrada inmediata, entonces la función compuesta también es diferente por la aplicación repetida de la Regla de Cadena, donde el derivado es (en la notación de Leibniz):
- df1dx=df1df2df2df3⋯ ⋯ dfndx.{fnMicroc} {f} {f} {fnK}} {fnMicroc}} {f}}} {f}} {f}}} {fnf}}}} {f}} {f}} {fnf}}} {f}} {f}}}}}} {fnf}}}} {f}}} {f}}}}} {f}}}}}}} {f} {f}}}} {f}} {f} {f} {f} {f} {f} {f}}f}}}}}}}}} {f} {f} {f} {f}f}}}}}}}}}}f}}} {f} {f}f}f}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}} {f} {f} {f}} {f}} {f}} {f}} {f}} {f}}} {f}}}}} {f}}} {f} {f}} {f}}}}} {f}}} {f}}}} {f}} {f}}}}}}}}} {f} {f}}}}}} {f}}}} {f}}} {f}}}}} {f}}}}} {f} {f} {f}}}} {f}}}}} {f}}}}}}}}}} {f} {f} {f}}}}}}} {f}} {f}}}}}}}}} {f} {f}} {f}}}}}}}}}}}}}} {f}}}}}}}}}}}}}} {df_{2} {df_{3}}cdots {fnfn} {fnK}}}
Aplicaciones
Compuestos de más de dos funciones
La regla de la cadena se puede aplicar a compuestos de más de dos funciones. Para tomar la derivada de un compuesto de más de dos funciones, observe que el compuesto de f, g, y h (en ese orden) es la combinación de f con g ∘ h. La regla de la cadena establece que para calcular la derivada de f ∘ g ∘ h, es suficiente para calcular la derivada de f y la derivada de g ∘ h. La derivada de f se puede calcular directamente, y la derivada de g ∘ h se puede calcular aplicando de nuevo la regla de la cadena.
Para ser concreto, considere la función
- Sí.=epecado ()x2).{displaystyle y=e^{sin(x^{2}}
Esto se puede descomponer como el compuesto de tres funciones:
- Sí.=f()u)=eu,u=g()v)=pecado v=pecado ()x2),v=h()x)=x2.{displaystyle {begin{aligned}y simultáneamente=f(u)=e^{u},[6pt]u paciente=g(v)=sin v=sin(x^{2}),[6pt]v limit=h(x)=x^{2}.end{aligned}}}}}}}}}
Sus derivados son:
- dSí.du=f.()u)=eu=epecado ()x2),dudv=g.()v)=# v=# ()x2),dvdx=h.()x)=2x.{displaystyle {begin{aligned}{frac} {y}{du} {du} {u)=e^{u}=e^{sin(x^{2}}},[6pt]{frac {du}{dv} {dv} {=g'(v)=cos v=cos(x^{2}),[6pt]{dx}{dx} {} {}{dx} {}{} {} {} {} {}} {}}}{} {}} {}{} {}}} {} {} {} {} {} {}}} {}}}}}}{} {}{}}}}} {}}} {}}}}}} {} {} {}}{}}} {} {} {} {} {} {} {}} {} {}}}}}} {} {}}}}}}}}{}}}}}}}}}}}}}} {}}}}}}}}}}} {}}}}}}}}}}}}}}}
La regla de la cadena establece que la derivada de su compuesto en el punto x = a es:
- ()f∘ ∘ g∘ ∘ h).()a)=f.()()g∘ ∘ h)()a))⋅ ⋅ ()g∘ ∘ h).()a)=f.()()g∘ ∘ h)()a))⋅ ⋅ g.()h()a))⋅ ⋅ h.()a)=()f.∘ ∘ g∘ ∘ h)()a)⋅ ⋅ ()g.∘ ∘ h)()a)⋅ ⋅ h.()a).{fnMicrosoft Sans Serif}(fcirc gcirch)'(a)[10pt](gcirch)(a)cdot (gcirc h)'(a)[10pt] {cdotcdota]
En la notación de Leibniz, esto es:
- dSí.dx=dSí.duSilenciou=g()h()a))⋅ ⋅ dudvSilenciov=h()a)⋅ ⋅ dvdxSilenciox=a,{displaystyle {frac {fnMicroc}=left.{frac} {} {fnMicrosoft Sans Serif} {fnMicrosoft Sans Serif} {fnMicrosoft Sans Serif} {fnMicrosoft Sans Serif} {cdot left. {fnMicroc {dv} {dx}}}justo para siempre_{x=a}}}
o para abreviar,
- dSí.dx=dSí.du⋅ ⋅ dudv⋅ ⋅ dvdx.{displaystyle {frac {fnMicroc} {fnMicroc} {fnMicrosoft} {fnMicrosoft} {fn}}} {fnMicrosoft}}}}} {fnMicroc}}}} {fnMicroc} {y} {du}cdot {fnK}cdot {fnMicroc {dv} {fnMicroc}}}
La función derivada es por lo tanto:
- dSí.dx=epecado ()x2)⋅ ⋅ # ()x2)⋅ ⋅ 2x.{displaystyle {frac {}=e^{sin(x^{2}}cdot cos(x^{2})cdot 2x.}
Otra forma de calcular esta derivada es ver la función compuesta f ∘ g ∘ h como el compuesto de f ∘ g y h. Aplicando la regla de la cadena de esta manera se obtendría:
- ()f∘ ∘ g∘ ∘ h).()a)=()f∘ ∘ g).()h()a))⋅ ⋅ h.()a)=f.()g()h()a)))⋅ ⋅ g.()h()a))⋅ ⋅ h.()a).{displaystyle (fcirc gcirc h)'(a)=(fcirc g)'(h(a))cdot h'(a)=f'(g(h(a))))cdot g'(h(a)))cdot h'(a). }
Esto es lo mismo que lo que se calculó anteriormente. Esto debería esperarse porque (f ∘ g) ∘ h = f ∘ (g ∘ h).
A veces, es necesario diferenciar una composición arbitrariamente larga de la forma f1∘ ∘ f2∘ ∘ ⋯ ⋯ ∘ ∘ fn− − 1∘ ∘ fn{displaystyle f_{1}circ f_{2}circ cdots circ f_{n-1}circ F_{n}!. En este caso, definir
- fa..b=fa∘ ∘ fa+1∘ ∘ ⋯ ⋯ ∘ ∘ fb− − 1∘ ∘ fb{displaystyle - ¿Qué? F_{a+1}circo cdots circ f_{b-1}circ F_{b}
Donde fa..a=fa{displaystyle ¿Qué? y fa..b()x)=x{fnMicrosoft Sans Serif} cuando <math alttext="{displaystyle bb.a{displaystyle b madea}<img alt="b . Entonces la regla de la cadena toma la forma
- Df1..n=()Df1∘ ∘ f2..n)()Df2∘ ∘ f3..n)⋯ ⋯ ()Dfn− − 1∘ ∘ fn..n)Dfn=∏ ∏ k=1n[Dfk∘ ∘ f()k+1)..n]{displaystyle Df_{1, f_{2,.,.,n}(Df_{2}circ f_{3,.,.,n} (Df_{n-1)circ ¿Qué? ¿Por qué?
o, en la notación de Lagrange,
- f1..n.()x)=f1.()f2..n()x))f2.()f3..n()x))⋯ ⋯ fn− − 1.()fn..n()x))fn.()x)=∏ ∏ k=1nfk.()f()k+1..n)()x)){displaystyle f_{1,.,.,n}(x)=f_{1}'left(f_{2,.,n}(x)right);f_{2}'left(f_{3,.,n}(x)derecha)cdots f_{n-1}'n ¿Por qué?
Regla del cociente
La regla de la cadena se puede utilizar para derivar algunas reglas de diferenciación bien conocidas. Por ejemplo, la regla del cociente es una consecuencia de la regla de la cadena y la regla del producto. Para ver esto, escribe la función f(x)/g(x) como el producto f(x) · 1/g( x). Primero aplica la regla del producto:
- ddx()f()x)g()x))=ddx()f()x)⋅ ⋅ 1g()x))=f.()x)⋅ ⋅ 1g()x)+f()x)⋅ ⋅ ddx()1g()x)).{fnMicrosoft Sans Serif} {fnMicroc} {f} {f} {f} {f}} {g}} {f}}} {f}}f}c}cccccccccH00}}ccH0}cccH0cccccccccccccccccccH00cccccccccccccH00}cH0}ccccccccH00}ccccccccccccccH00}cccH00ccH00cccH00ccH00cccc {d}{dx}left({frac {1}{g(x)}right)end{aligned}}}
Para calcular el derivado de 1/g()x), note que es el compuesto de g con la función recíproca, es decir, la función que envía x a 1/x. El derivado de la función recíproca es − − 1/x2{displaystyle -1/x^{2}. Al aplicar la regla de cadena, la última expresión se convierte en:
- f.()x)⋅ ⋅ 1g()x)+f()x)⋅ ⋅ ()− − 1g()x)2⋅ ⋅ g.()x))=f.()x)g()x)− − f()x)g.()x)g()x)2,{fnMicrosoft Sans Serif}cdot {1}}cdotcdot left(-{frac {1}{g(x)}}cdot g'(x)right)={frac {x)g} {x} {g}{2} {g} {g}{2}{}}{g}}}} {g}}{c}}}}}}{g}}}}}}}{g}}}}}}{g}}}} {g}}}} {c]
que es la fórmula habitual para la regla del cociente.
Derivadas de funciones inversas
Suponga que y = g(x) tiene una función inversa. Llame a su función inversa f para que tengamos x = f(y). Existe una fórmula para la derivada de f en términos de la derivada de g. Para ver esto, tenga en cuenta que f y g satisface la fórmula
- f()g()x))=x.{displaystyle f(g(x)=x.}
Y porque las funciones f()g()x)){displaystyle f(g(x)} y x son iguales, sus derivados deben ser iguales. El derivado de x es la función constante con el valor 1, y el derivado de f()g()x)){displaystyle f(g(x)} está determinado por la regla de la cadena. Por lo tanto, tenemos que:
- f.()g()x))g.()x)=1.{displaystyle f'(g(x))g'(x)=1.}
Para expresar f ' como función de una variable independiente Sí., sustituimos f()Sí.){displaystyle f(y)} para x donde quiera que aparezca. Entonces podemos resolverlo. f '.
- f.()g()f()Sí.)))g.()f()Sí.))=1f.()Sí.)g.()f()Sí.))=1f.()Sí.)=1g.()f()Sí.)).{displaystyle {begin{aligned}f'(g(f(y)))g'(f(y)) conlleva=1\[5pt]f'(y)g'(f(y))) {\[5pt]f'(y)={frac {1}{g'(f(y)}}}}end{aligned}}}}}}}}}}}}}}}}}} {begin{begin{begin{aligned}}}}}}}}}}}}}}}}}}}} {begin{begin{begin{f}}}}}}}}}}}}}}}}}}}}}}}}}}}} {begin{begin{begin{begin{begin{f}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}
Por ejemplo, considere la función g(x) = e x. Tiene un inverso f(y) = ln y. Porque g′(x) = ex, la fórmula anterior dice que
- ddSí.In Sí.=1eIn Sí.=1Sí..{displaystyle {frac {} {fn}fn} Y... {1}{e^{ln} Sí. {1} {y}}
Esta fórmula es verdadera siempre que g sea diferenciable y su inversa f también es diferenciable. Esta fórmula puede fallar cuando una de estas condiciones no es cierta. Por ejemplo, considere g(x) = x3. Su inversa es f(y) = y1/3, que no es diferenciable en cero. Si intentamos usar la fórmula anterior para calcular la derivada de f en cero, entonces debemos evaluar 1/g′(f(0)). Dado que f(0) = 0 y g′(0) = 0, debemos evaluar 1/0, que no está definido. Por lo tanto, la fórmula falla en este caso. Esto no es sorprendente porque f no es diferenciable en cero.
Derivados superiores
La fórmula de Faà di Bruno generaliza la regla de la cadena a derivadas superiores. Suponiendo que y = f(u) y u = g(x), entonces las primeras derivadas son:
- dSí.dx=dSí.dududxd2Sí.dx2=d2Sí.du2()dudx)2+dSí.dud2udx2d3Sí.dx3=d3Sí.du3()dudx)3+3d2Sí.du2dudxd2udx2+dSí.dud3udx3d4Sí.dx4=d4Sí.du4()dudx)4+6d3Sí.du3()dudx)2d2udx2+d2Sí.du2()4dudxd3udx3+3()d2udx2)2)+dSí.dud4udx4.{displaystyle {begin{aligned}{frac} {y} {dx} {fnMicroc} {fnK} {fnMicroc} {fnMicroc {fnK}} {fnMicroc} {f}} {fnK}}} {fnMicroc} {fnK}}}}} {f} {fnK}} {f}}}} {fnMicroc}} {f}}}}} {f}}}}}}}}} {f}}}}}}}} {f}}}} {f} {f}}}}} {f}} {f}}}}}} {f}}} {f}}}}}}}}}}}} {f} {f} {f}}}}}} {f}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}} {fnK} {fnMicroc}}derechoso*}derechoso* {} {fn} {fnMicroc} {fnK}}} {fnMicroc}}} {f}}} {fnMicroc}}} {f}} {fn}}}} {fn}} {f}}} {f} {fnMicroc}}}} {f}}}} {f} {f}}}} {f}}}}}} {f}f}}}}}}}}}} {f} {f} {f} {f} {f} {f}f}f}f}f}f}f}f}f}f}}f}f}f}}f}f}f} {f}f}f}f}f}f}}f}f}f}f}}f}f}f}f}f}f}f {4pt}{3}y}{dx^{3}}}} {fnMic {fnMic} {fnK}}} {fn0}} {fn0}}}} {fnK} {fn0}} {fnK}}}}}}}}\fnKfnK}}}}}}}}}\\\\\\\\\fnK\fnK\fnKfnKfnKfnKfnKfnKfnKfnKfnKfnKfnK\\fnKfnKfnKfnKfnKfnKfnKfnKfnKfnKfnKfnKfnKfnKfnKfnKfnKfn2}}}}fn {fnMicroc {fnMicroc}derechoso}derecho)}=3,{fracfnMicroc {fnK} {f} {fnK}} {f}} {f}} {f}} {f}}} {f}}}} {f}}}} {f}}} {f}}} {f}}}} {f}}} {f}}}} {f}}}}}}} {f}}}}}}}}}}}} {f}}}}} {f}}}} {f}}}} {f}}}}}}}}} {f}} {f}}}}}}}}}}}}}}}}}} {f}}}}}} {f} {f}} {f}}}}}}}}}}}} {f}}}}}}f} {f} {f}} {f} {f}}}}}}}}}}}}}}}}}}}}}}}}}} {fnMicroc} {fnMicroc}} {} {fn} {fnMicroc} {fnK}}} {fnMicroc}}} {f}}} {fnMicroc}}} {f}} {fn}}}} {fn}} {f}}} {f} {fnMicroc}}}} {f}}}} {f} {f}}}} {f}}}}}} {f}f}}}}}}}}}} {f} {f} {f} {f} {f} {f}f}f}f}f}f}f}f}f}f}}f}f}f}}f}f}f} {f}f}f}f}f}f}}f}f}f}f}}f}f}f}f}f}f}f {4pt}{4pt} {4pt}{4pt}} {4pt}{4}} {4}}} {={4}}} {={frac} {f}}}}} {fn0} {fn0}}} {fn0} {fnK} {fnMicroc {fnMicroc}}derecha)}4}+6,{frac} {fnK} {fnMicroc} {fnMicroc}}}derecho)}{2}{frac} {fnMicroc} {fnMicroc} {fnMicroc}} {fnMicroc} {fnMicroc} {fnMicroc} {fnMicroc} {fnMicroc} {fnMicroc}} {fnMicroc}}}} {fnMicroc}}}} {fnMicroc}}}}} {fnMicroc} {d^{3}u} {dx^{3}}}+3,left({frac} ¿Qué? {} {fn} {fnMicroc} {fnK}}} {fnMicroc}}} {f}}} {fnMicroc}}} {f}} {fn}}}} {fn}} {f}}} {f} {fnMicroc}}}} {f}}}} {f} {f}}}} {f}}}}}} {f}f}}}}}}}}}} {f} {f} {f} {f} {f} {f}f}f}f}f}f}f}f}f}f}}f}f}f}}f}f}f} {f}f}f}f}f}f}}f}f}f}f}}f}f}f}f}f}f}f {d^{4}u} {dx^{4}}}end{aligned}}
Pruebas
Primera prueba
Una prueba de la regla de la cadena comienza definiendo la derivada de la función compuesta f ∘ g, donde tome el límite del cociente de diferencia para f ∘ g como x se aproxima a a:
- ()f∘ ∘ g).()a)=limx→ → af()g()x))− − f()g()a))x− − a.{displaystyle (fcirc g)'(a)=lim _{xto a}{frac {f(g(x))-f(g(a)}{x-a}}
Supongamos por el momento que g()x){displaystyle g(x)!} no es igual g()a){displaystyle g(a)} para cualquier x cerca a. Entonces la expresión anterior es igual al producto de dos factores:
- limx→ → af()g()x))− − f()g()a))g()x)− − g()a)⋅ ⋅ g()x)− − g()a)x− − a.{displaystyle lim _{xto a}{frac {f(g(x))-f(g(a)}{g(x)-g(a)}}cdot {frac {g(x)-g(a)}{x-a}}}}}
Si g{displaystyle g} oscila cerca a, entonces podría suceder que no importa lo cerca que uno llegue a, siempre hay un aún más cerca x tales que g()x) g()a). Por ejemplo, esto ocurre cerca a = 0 para la función continua g definidas por g()x) = 0 para x = 0 y g()x) x2 pecado(1/x) De lo contrario. Cuando esto sucede, la expresión anterior es indefinida porque implica división por cero. Para trabajar en torno a esto, introduzca una función Q{displaystyle Q} como sigue:
- Q()Sí.)={}f()Sí.)− − f()g()a))Sí.− − g()a),Sí.ل ل g()a),f.()g()a)),Sí.=g()a).{displaystyle Q(y)={begin{cases}displaystyle {frac {f(y)-f(g(a)}{y-g(a)}} {neq g(a),f'(g(a)), adyacentey=g(a).end{cases}}}
Mostraremos que el cociente de diferencia para f ∘ g siempre es igual a:
- Q()g()x))⋅ ⋅ g()x)− − g()a)x− − a.{displaystyle Q(g(x))cdot {frac {g(x)-g(a)}{x-a}}
Siempre que g(x) no sea igual a g (a), esto es claro porque los factores de g(x) − g(a) cancelar. Cuando g(x) es igual a g(a), entonces el cociente de diferencia para f ∘ g es cero porque f(g(x)) es igual a f(g(a)), y el producto anterior es cero porque es igual a f′(g(a)) veces cero. Entonces, el producto anterior siempre es igual al cociente de la diferencia, y para mostrar que la derivada de f ∘ g en a existe y para determinar su valor, solo necesitamos mostrar que el límite es x va a a del producto anterior existe y determina su valor.
Para ello, recuerda que el límite de un producto existe si existen los límites de sus factores. Cuando esto sucede, el límite del producto de estos dos factores será igual al producto de los límites de los factores. Los dos factores son Q(g(x)) y (g(x) − g(a)) / (x − a). Este último es el cociente de diferencia para g en a, y porque g es diferenciable en a por suposición, su límite como x tiende a a existe y es igual a g′(a).
En cuanto a Q(g(x)), observe que Q se define dondequiera que f es. Además, f es diferenciable en g(a) por suposición, entonces Q es continua en g(a), por definición de la derivada. La función g es continua en a porque es diferenciable en a, y por lo tanto Q ∘ g es continua en a. Entonces su límite como x va a a existe y es igual a Q(g( a)), que es f′(g(a)).
Esto muestra que los límites de ambos factores existen y que son iguales a f′(g(a)) y g′(a), respectivamente. Por lo tanto, la derivada de f ∘ g en a existe y es igual a f′(g(a))g′(a).
Segunda prueba
Otra forma de probar la regla de la cadena es medir el error en la aproximación lineal determinada por la derivada. Esta demostración tiene la ventaja de que generaliza a varias variables. Se basa en la siguiente definición equivalente de derivabilidad en un punto: una función g es diferenciable en a si existe un número real g′(a) y una función ε(h) que tiende a cero como h tiende a cero, y además
- g()a+h)− − g()a)=g.()a)h+ε ε ()h)h.{displaystyle g(a+h)-g(a)=g'(a)h+varepsilon (h)h.}
Aquí, el lado izquierdo representa la verdadera diferencia entre el valor de g en a y en a + h, mientras que el lado derecho representa la aproximación determinada por la derivada más un término de error.
En la situación de la regla de la cadena, tal función ε existe porque se supone que g es diferenciable en a. De nuevo por suposición, también existe una función similar para f en g(a). Llamando a esta función η, tenemos
- f()g()a)+k)− − f()g()a))=f.()g()a))k+.. ()k)k.{displaystyle f(g(a)+k)-f(g(a))=f'(g(a)))k+eta (k)k.}
La definición anterior no impone restricciones a η(0), aunque se supone que η(k) tiende a cero como k tiende a cero. Si establecemos η(0) = 0, entonces η es continuo en 0.
Demostrar el teorema requiere estudiar la diferencia f(g(a + h)) − f(g(a)) ya que h tiende a cero. El primer paso es sustituir g(a + h) usando la definición de diferenciabilidad de g en a:
- f()g()a+h))− − f()g()a))=f()g()a)+g.()a)h+ε ε ()h)h)− − f()g()a)).{displaystyle f(g(a+h)))-f(g(a))=f(g(a)+g'(a)h+varepsilon (h)h)-f(g(a)). }
El siguiente paso es usar la definición de diferenciabilidad de f en g(a). Esto requiere un término de la forma f(g(a) + k) por algo de k. En la ecuación anterior, la k correcta varía con h. Establecer kh = g′(a) h + ε(h) h y el lado derecho se convierte en f(g(a) + kh) − f(g(a)). Aplicando la definición de la derivada se obtiene:
- f()g()a)+kh)− − f()g()a))=f.()g()a))kh+.. ()kh)kh.{displaystyle f(g(a)+k_{h})-f(g(a)=f'(g(a))k_{h}+eta (k_{h})k_{h}
Para estudiar el comportamiento de esta expresión cuando h tiende a cero, expanda kh. Después de reagrupar los términos, el lado derecho se convierte en:
- f.()g()a))g.()a)h+[f.()g()a))ε ε ()h)+.. ()kh)g.()a)+.. ()kh)ε ε ()h)]h.{displaystyle f'(g(a))g'(a)h+[f'(g(a))varepsilon (h)+eta (k_{h})g'(a)+eta (k_{h})varepsilon (h)]h.}
Porque ε(h) y η(kh) tienden a cero cuando h tiende a cero, los dos primeros términos entre paréntesis tienden a cero cuando h tiende a cero. Aplicando el mismo teorema sobre productos de límites que en la primera prueba, el tercer término entre paréntesis también tiende a cero. Debido a que la expresión anterior es igual a la diferencia f(g(a + h)) − f(g(a)), por la definición de la derivada f ∘ g es diferenciable en a y su derivada es f ′(g(a)) g′(a).
El papel de Q en la primera demostración lo desempeña η en esta demostración. Están relacionados por la ecuación:
- Q()Sí.)=f.()g()a))+.. ()Sí.− − g()a)).{displaystyle Q(y)=f'(g(a)))+eta (y-g(a)}
La necesidad de definir Q en g(a) es análoga a la necesidad de definir η en cero.
Tercera prueba
La definición alternativa de la diferenciabilidad de una función de Constantin Carathéodory se puede utilizar para dar una prueba elegante de la regla de la cadena.
Bajo esta definición, una función f es derivable en un punto a si y solo si hay una función q, continua en a y tal que f(x) − f(a) = q(x)(x − a). Existe como máximo una función de este tipo, y si f es diferenciable en a luego f ′(a) = q(a).
Dados los supuestos de la regla de la cadena y el hecho de que las funciones diferenciables y las composiciones de funciones continuas son continuas, tenemos que existen funciones q , continuo en g(a), y r, continua en a, y tal que,
- f()g()x))− − f()g()a))=q()g()x))()g()x)− − g()a)){displaystyle f(g(x))-f(g(a))=q(g(x))(g(x)-g(a)}
y
- g()x)− − g()a)=r()x)()x− − a).{displaystyle g(x)-g(a)=r(x)(x-a). }
Por lo tanto,
- f()g()x))− − f()g()a))=q()g()x))r()x)()x− − a),{displaystyle f(g(x))-f(g(a))=q(g(x))r(x)(x-a),}
pero la función dada por h(x) = q(g(x))r(x) es continua en a, y obtenemos, para este a
- ()f()g()a))).=q()g()a))r()a)=f.()g()a))g.()a).{displaystyle (f(g(a))))'=q(g(a))r(a)=f'(g(a))g'(a).}
Un enfoque similar funciona para funciones (vectoriales) continuamente diferenciables de muchas variables. Este método de factorización también permite un enfoque unificado para formas más fuertes de diferenciabilidad, cuando se requiere que la derivada sea continua de Lipschitz, continua de Hölder, etc. La diferenciación en sí misma puede verse como el teorema del resto polinomial (el pequeño teorema de Bézout o el teorema del factor), generalizado a una clase apropiada de funciones.
Demostración mediante infinitesimales
Si Sí.=f()x){displaystyle y=f(x)} y x=g()t){displaystyle x=g(t)} entonces elegir infinitesimal Δ Δ tل0{displaystyle Delta tnot =0} computamos el correspondiente Δ Δ x=g()t+Δ Δ t)− − g()t){displaystyle Delta x=g(t+Delta t)-g(t)} y luego el correspondiente Δ Δ Sí.=f()x+Δ Δ x)− − f()x){displaystyle Delta y=f(x+Delta x)-f(x)}Así que
- Δ Δ Sí.Δ Δ t=Δ Δ Sí.Δ Δ xΔ Δ xΔ Δ t{displaystyle {frac {Delta y}{ Delta t}={frac {Delta y}{ Delta {Delta x}{Delta t}}
y aplicando la parte estándar obtenemos
- dSí.dt=dSí.dxdxdt{displaystyle {frac {fnK}={frac} {y}{dx}{frac} {dx} {dt}}
que es la regla de la cadena.
Caso multivariable
La generalización de la regla de la cadena a funciones de múltiples variables es bastante técnica. Sin embargo, es más sencillo escribir en el caso de funciones de la forma
- f()g1()x),...... ,gk()x)).{displaystyle f(g_{1}(x),dotsg_{k}(x)). }
Como este caso ocurre a menudo en el estudio de funciones de una sola variable, vale la pena describirlo por separado.
Caso de f(g1(x),... gk(x))
Para escribir la regla de la cadena para una función de la forma
- f()g1()x),... gk()x),
se necesitan las derivadas parciales de f con respecto a su k argumentos. Las notaciones usuales para derivadas parciales implican nombres para los argumentos de la función. Como estos argumentos no se nombran en la fórmula anterior, es más simple y claro denotar por
- Dif{displaystyle D_{i}f}
la derivada parcial de f con respecto a su iésimo argumento, y por
- Dif()z){displaystyle D_{i}f(z)}
el valor de esta derivada en z.
Con esta notación, la regla de la cadena es
- ddxf()g1()x),...... ,gk()x))=.. i=1k()ddxgi()x))Dif()g1()x),...... ,gk()x)).{displaystyle {frac {d}{dx}f(g_{1}(x),dotsg_{k}(x)=sum _{i=1}}{k}left({frac} {d}{dx} {g_{i}(x)right)D_{i}f(g_{1}(x),dotsg_{k}(x)). }
Ejemplo: operaciones aritméticas
Si la función f es suma, es decir, si
- f()u,v)=u+v,{displaystyle f(u,v)=u+v,}
entonces D1f=∂ ∂ f∂ ∂ u=1{textstyle D_{1}f={frac {partial f}{partial u}=1} y D2f=∂ ∂ f∂ ∂ v=1{textstyle D_{2}f={frac {partial f}{partial - Sí.. Así, la regla de cadena da
- ddx()g()x)+h()x))=()ddxg()x))D1f+()ddxh()x))D2f=ddxg()x)+ddxh()x).{fnMicrosoft Sans Serif} {fnMicrosoft Sans Serif} {fnMicroc {} {} {f}} {f}} {f}f} {f} {cH} {c}} {c} {c} {c} {c}c}c}} {c}cc}c}}}}c}} {c}cc}ccc}ccc}}c}c}c}ccccccccccccccccc}}ccccc}}}cc}}}ccccccccc}}}ccccc}ccc}ccH}}ccc}}c}c
Para la multiplicación
- f()u,v)=uv,{displaystyle f(u,v)=uv,}
los parciales son D1f=v{displaystyle D_{1}f=v} y D2f=u{displaystyle D_{2}f=u}. Así,
- ddx()g()x)h()x))=h()x)ddxg()x)+g()x)ddxh()x).{displaystyle {frac {d} {dx}(g(x)h(x)=h(x){frac {d}{dx}g(x)+g(x){frac {d}h(x).
El caso de la exponenciación
- f()u,v)=uv{displaystyle f(u,v)=u^{v}
es un poco más complicado, ya que
- D1f=vuv− − 1,{displaystyle D_{1}f=vu^{v-1},}
y, como uv=evIn u,{displaystyle u^{v}=e^{vln u}
- D2f=uvIn u.{displaystyle D_{2}f=u^{v}ln u.}
Se sigue que
- ddx()g()x)h()x))=h()x)g()x)h()x)− − 1ddxg()x)+g()x)h()x)In g()x)ddxh()x).{displaystyle {frac {d}left(g(x)^{h(x)}right)=h(x)g(x)^{h(x)-1}{frac {dx}g(x)+g(x)^{h(x)}ln g(x){frac {dx}{h}{h} {hx}}}} {dx}} {dx}}}}}{h} {dx} {dx}{h} {dx} {dx}}}} {dx}}}} {dx} {f} {f} {f} {f} {f} {f} {f} {f}} {f}}}}}}f} {f}f}f}f}}f}f}}}}}}f}f}f}f}f}f}f}f}f}fn
Regla general
La forma más sencilla de escribir la regla de la cadena en el caso general es usar la derivada total, que es una transformación lineal que captura todas las derivadas direccionales en una sola fórmula. Considere las funciones diferenciables f: Rm → Rk y g: R n → Rm, y un punto a en Rn. Sea Da g la derivada total de g en a y Dg(a) f denota la derivada total de f en g(a). Estas dos derivadas son transformaciones lineales Rn → Rm y Rm → Rk, respectivamente, para que puedan componerse. La regla de la cadena para las derivadas totales es que su compuesto es la derivada total de f ∘ g en a:
- Da()f∘ ∘ g)=Dg()a)f∘ ∘ Dag,{displaystyle D_{mathbf {a}(fcirc g)=D_{g(mathbf {a})}fcirc D_{mathbf {a}g,}
o para abreviar,
- D()f∘ ∘ g)=Df∘ ∘ Dg.{displaystyle D(fcirc g)=Dfcirc Dg.}
La regla de la cadena de dimensiones superiores se puede probar usando una técnica similar a la segunda prueba dada arriba.
Debido a que la derivada total es una transformación lineal, las funciones que aparecen en la fórmula se pueden reescribir como matrices. La matriz correspondiente a una derivada total se denomina matriz jacobiana, y la compuesta de dos derivadas corresponde al producto de sus matrices jacobianas. Desde esta perspectiva, la regla de la cadena dice:
- Jf∘ ∘ g()a)=Jf()g()a))Jg()a),{displaystyle J_{fcirc g}(mathbf {a})=J_{f}(g(mathbf {a})J_{g}(mathbf {a}),}
o para abreviar,
- Jf∘ ∘ g=()Jf∘ ∘ g)Jg.{displaystyle J_{fcirc g}=(J_{f}circ g)J_{g}
Es decir, el jacobiano de una función compuesta es el producto de los jacobianos de las funciones compuestas (evaluadas en los puntos apropiados).
La regla de la cadena de dimensiones superiores es una generalización de la regla de la cadena unidimensional. Si k, m y n son 1, entonces f: R → R y g: R → R, entonces las matrices jacobianas de f y g son 1 × 1. En concreto, son:
- Jg()a)=()g.()a)),Jf()g()a))=()f.()g()a))).{displaystyle {begin{aligned}J_{g}(a) limit={begin{pmatrix}g'(a)end{pmatrix}}},J_{f}(g(a) limit={begin{pmatrix}f'(g(a))}end{pmatrix}}end{aligned}}} {}}} {}}}} {}}}}}} {end} {begin}} {begin} {begin} {begin} {begin} {begin} {begin} {begin} {begin} {begin} {begin} {begin} {begin} {begin} {begin} {begin} {begin} {begin} {begin} {begin} {begin} {begin} {begin} {begin} {begin} {begin} {begin}
El jacobiano de f ∘ g es el producto de estas matrices 1 × 1, por lo que es f′(g(a))⋅g′(a ), como se esperaba de la regla de la cadena unidimensional. En el lenguaje de las transformaciones lineales, Da(g) es la función que escala un vector por un factor de g′(a) y Dg(a) (f) es la función que escala un vector por un factor de f′(g(a)). La regla de la cadena dice que la combinación de estas dos transformaciones lineales es la transformación lineal Da(f ∘ g), y por lo tanto es la función que escala un vector por f′(g (a))⋅g′(a).
Otra forma de escribir la regla de la cadena se usa cuando f y g se expresan en términos de sus componentes como y = f(u) = (f1(u), …, fk(u)) y u = g(x) = (g1( x), …, gm(x)). En este caso, la regla anterior para matrices jacobianas generalmente se escribe como:
- ∂ ∂ ()Sí.1,...... ,Sí.k)∂ ∂ ()x1,...... ,xn)=∂ ∂ ()Sí.1,...... ,Sí.k)∂ ∂ ()u1,...... ,um)∂ ∂ ()u1,...... ,um)∂ ∂ ()x1,...... ,xn).{fnMicrosoft Sans Serif} {fnMicrosoft Sans Serif} {fnMicrosoft Sans Serif}
La regla de la cadena para derivadas totales implica una regla de la cadena para derivadas parciales. Recuerde que cuando existe la derivada total, la derivada parcial en la dirección de coordenadas iésima se encuentra multiplicando la matriz jacobiana por el vector base iésimo. Al hacer esto con la fórmula anterior, encontramos:
- ∂ ∂ ()Sí.1,...... ,Sí.k)∂ ∂ xi=∂ ∂ ()Sí.1,...... ,Sí.k)∂ ∂ ()u1,...... ,um)∂ ∂ ()u1,...... ,um)∂ ∂ xi.{displaystyle {frac {partial (y_{1},ldotsy_{k}}{partial} { {fnK} {fnMicroc {fnMicrosoft} {fnMicrosoft_}}{partial (u_{1},ldotsu_{m}}}{frac {partial (u_{1},ldotsu_{m})}}{partial {m}}} {m}}}}{p}}}}}}}}}} {f}}}}}}} {m}}}}}{p}}}}}} {f}}}}} {f}}}} {f}}}}}}}}}}} {f}}} {f}}}}}}} {f}}}}}}}}}}}}}}}}}} {f}} {f} {f} {f}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}} #
Dado que las entradas de la matriz jacobiana son derivadas parciales, podemos simplificar la fórmula anterior para obtener:
- ∂ ∂ ()Sí.1,...... ,Sí.k)∂ ∂ xi=.. l l =1m∂ ∂ ()Sí.1,...... ,Sí.k)∂ ∂ ul l ∂ ∂ ul l ∂ ∂ xi.{displaystyle {frac {partial (y_{1},ldotsy_{k}}{partial} { {fnK}=sum _{ell =1}{m}{frac {partial (y_{1},ldotsy_{k}}}{partial {f} {fnK}} {fnK}}}} {f}}}} {f}}}}f}fnf}f}}}}f}}}f}f}f}f}f}fnKf}f}fnKf}f}f}f}fnKf}fnKb}fnKf}fnKf}f}fnKfnKfnKb}b}}b}fnKb}fnKfnKfnKfnKfnKfnKfnKb}fnKfnKfnKb}b}} {fnMicrosoft Sans Serif} {fnMicrosoft Sans Serif} U_{ell }{partial.
Más conceptualmente, esta regla expresa el hecho de que un cambio en la dirección xi puede cambiar todo g1 a gm, y cualquiera de estos cambios puede afectar a f.
En el caso especial donde k = 1, de modo que f sea una función de valor real, entonces esto fórmula simplifica aún más:
- ∂ ∂ Sí.∂ ∂ xi=.. l l =1m∂ ∂ Sí.∂ ∂ ul l ∂ ∂ ul l ∂ ∂ xi.{fnMicrosoft {fnMicrosoft {fnMicrosoft {fnMicrosoft {fnMicrosoft {\fnMicrosoft} Y... ¿Qué? {fnMicroc {fnMicrosoft Sans Serif}} {fnMicroc {fnMicrosoft}} {f}}} {fnMicroc {fnMicrosoft}}}}}} {fnMicroc {fnMicroc {c}}}}}}}}}} {fnMicroc {f}}}}}}}}}} {f}f}}}f}f}f}f}f}f}f}f}f} {f} {f}fnf}f}f}f}f}f}f}fnfnfnfnfnfnf}fnfnfnfnfnf}fnfnfnfnfnfnfnfnf}fnfnf}fn U_{ell }{partial.
Esto se puede reescribir como un producto escalar. Recordando que u = (g1, …, g m), la derivada parcial ∂u / ∂xi también es un vector, y la regla de la cadena dice que:
- ∂ ∂ Sí.∂ ∂ xi=Silencio Silencio Sí.⋅ ⋅ ∂ ∂ u∂ ∂ xi.{fnMicrosoft {fnMicrosoft {fnMicrosoft {fnMicrosoft {fnMicrosoft {\fnMicrosoft} Y... x_{i}}=nabla ycdot {frac {partial mathbf {u} }{partial.
Ejemplo
Dado u(x, y) = x2 + 2y donde x(r, t) = r sin(t) y y(r,t) = sin2(t), determine el valor de ∂u / ∂r y ∂u / ∂t utilizando la regla de la cadena.
- ∂ ∂ u∂ ∂ r=∂ ∂ u∂ ∂ x∂ ∂ x∂ ∂ r+∂ ∂ u∂ ∂ Sí.∂ ∂ Sí.∂ ∂ r=()2x)()pecado ()t))+()2)()0)=2rpecado2 ()t),{fnMicrosoft Sans Serif} {fnMicrosoft Sans Serif} {fnMicrosoft Sans Serif} {f} {fnMicros {partial x}{partial r}+{frac {partial u}{} {f}} {fnMicroc {fnMicrosoft}} {f}}}}}}}}} {f}f}}}}}}f}f}f}f}f}f}f}f} {cfnMicrocfnun}}}fnun}}}}}}}}}}}}}fnun}fnun}} {fnun}} {fnun}fnun}fnun} {fnun}}}fnun}fnun} {fnun} {fnun} {f}fnun}}}}}}}
y
- ∂ ∂ u∂ ∂ t=∂ ∂ u∂ ∂ x∂ ∂ x∂ ∂ t+∂ ∂ u∂ ∂ Sí.∂ ∂ Sí.∂ ∂ t=()2x)()r# ()t))+()2)()2pecado ()t)# ()t))=()2rpecado ()t))()r# ()t))+4pecado ()t)# ()t)=2()r2+2)pecado ()t)# ()t)=()r2+2)pecado ()2t).################################################################################################################################################################################################################################################################
Derivadas superiores de funciones multivariables
La fórmula de Faà di Bruno para derivadas de orden superior de funciones de una sola variable se generaliza al caso de múltiples variables. Si y = f(u) es una función de u = g(x) como arriba, luego la segunda derivada de f ∘ g es:
- ∂ ∂ 2Sí.∂ ∂ xi∂ ∂ xj=.. k()∂ ∂ Sí.∂ ∂ uk∂ ∂ 2uk∂ ∂ xi∂ ∂ xj)+.. k,l l ()∂ ∂ 2Sí.∂ ∂ uk∂ ∂ ul l ∂ ∂ uk∂ ∂ xi∂ ∂ ul l ∂ ∂ xj).{fnMicrosoft {fnMicrosoft {fnMicrosoft {fnMicrosoft {fnMicrosoft {\fnMicrosoft} ^{2}y}{partial x_{i}partial ¿Por qué? {fnK} {f} {fnK}} {fnK}}} {f}}} {f}}}} {fn}}}}}} {f}}}} {fn}}}}}}} {f}}} {f}}}}}}}}}} {f}f}f}f}}f}}f}}}}f}f}f}f}b}f}b}}f}f}f}f}f}f}f}b}f}f}f}f}f}f}f}f}f}b}f}f}f}\\f}\\f}f}f}f}f}f}f}fn}f}f}f}f}f}b}f}f}f} x_{j}}right)+sum _{k,ell }left({frac {partial ^{2}y}{partial ¿Qué? U_{ell {fnK} {fnMicroc {fnMicrosoft Sans Serif} {fnK}} {fnK}}} {fn}}} {fnMicroc {fnMicrosoft {fnK}}}} {fnMicroc {f} {fnMicroc}} {f}}}} {f}}}}}}} {f}f}f}f}fnf}f}f}f}f}f}f} {fnMicroc}fn}f}fn}f}f}f}f}f}fn}fnMicroc}f}fn}f}fn}f}fn}f}f}fn}fn}fn} {fnMicroc {fn}f}f}fn}f}fn {fnK} {fnMicroc} {fnMicrosoft {fnMicrosoft {fnMicrosoft {f}fnMicroc} {fnMicrosoft {fnMicrosoft {fnMicrosoft}}}} {fnMicroc} {fnMicrocfnMicroc {fnf}f}f}f}\\fn\\fnMicrocfnMicrocfnMicrocfn\\\fnMicroc\\\\fnfn\\\\fn\\\fnMicroc\\fnMicroc\\\\fn\\fn\\fn\\\\\\\\\\\\fnMicroc\\fn {fnMicrosoft Sans Serif}} {fnMicrosoft Sans Serif}} {fnMicrosoft Sans Serif}} {fnMicrosoft Sans Serif}}} {fnMicrosoft Sans Serif}}}}}}} {fnMicrosoft Sans Serif}}}}}}}}}}}}}}}} {dere}}}}}}}}}}} {dere}}}}} {dere}}}}}}} {dere}}}}} {dere} {dere}}}}}} {dere}}}}}}}}}}}}}}} {dere} {dere} {dere}}}}}}}}}}}}} {dere}}}}}}}}}}}}}} {dere}}}}}}}}}}}}}}}}}}}}}}}} {dere}}}
Otras generalizaciones
Todas las extensiones del cálculo tienen una regla de la cadena. En la mayoría de estos, la fórmula sigue siendo la misma, aunque el significado de esa fórmula puede ser muy diferente.
Una generalización es para variedades. En esta situación, la regla de la cadena representa el hecho de que la derivada de f ∘ g es el compuesto de la derivada de f y la derivada de g. Este teorema es una consecuencia inmediata de la regla de la cadena de dimensiones superiores dada anteriormente, y tiene exactamente la misma fórmula.
La regla de la cadena también es válida para derivados de Fréchet en espacios de Banach. Se mantiene la misma fórmula que antes. Este caso y el anterior admiten una generalización simultánea a las variedades de Banach.
En álgebra diferencial, la derivada se interpreta como un morfismo de módulos de diferenciales de Kähler. Un homomorfismo de anillos de anillos conmutativos f: R → S determina un morfismo de diferenciales de Kähler Df: ΩR → ΩS que envía un elemento dr a d(f(r)), el diferencial exterior de f(r). La fórmula D(f ∘ g) = Df ∘ Dg también se aplica en este contexto.
La característica común de estos ejemplos es que son expresiones de la idea de que la derivada es parte de un funtor. Un funtor es una operación sobre espacios y funciones entre ellos. Asocia a cada espacio un nuevo espacio ya cada función entre dos espacios una nueva función entre los correspondientes nuevos espacios. En cada uno de los casos anteriores, el funtor envía cada espacio a su paquete tangente y envía cada función a su derivada. Por ejemplo, en el caso de la variedad, la derivada envía una variedad Cr a una variedad C variedad r−1 (su paquete tangente) y una función Cr a su derivada total. Hay un requisito para que esto sea un funtor, a saber, que la derivada de un compuesto debe ser el compuesto de las derivadas. Esta es exactamente la fórmula D(f ∘ g) = Df ∘ DG.
También existen reglas de cadena en el cálculo estocástico. Uno de estos, el lema de Itō, expresa la combinación de un proceso de Itō (o más generalmente una semimartingala) dXt con un función dos veces diferenciable f. En el lema de Itō, la derivada de la función compuesta depende no solo de dXt y la derivada de f sino también en la segunda derivada de f. La dependencia de la segunda derivada es una consecuencia de la variación cuadrática distinta de cero del proceso estocástico, lo que en términos generales significa que el proceso puede moverse hacia arriba y hacia abajo de una manera muy aproximada. Esta variante de la regla de la cadena no es un ejemplo de un funtor porque las dos funciones que se componen son de diferentes tipos.
Contenido relacionado
Variable aleatoria multivariante
Variedad simpléctica
Matemáticas recreativas