Integración por sustitución
En cálculo, integración por sustitución, también conocida como u-sustitución, regla de la cadena inversa o cambio de variables, es un método para evaluar integrales y antiderivadas. Es la contraparte de la regla de la cadena para la diferenciación, y se puede pensar que se usa la regla de la cadena 'al revés'.
Sustitución de una sola variable
Introducción
Antes de establecer el resultado de manera rigurosa, considere un caso simple usando integrales indefinidas.
Computación ∫ ∫ ()2x3+1)7()x2)dx{displaystyle textstyle int (2x^{3}+1)^{7}(x^{2},dx}.
Set u=2x3+1{displaystyle u=2x^{3}+1}. Esto significa dudx=6x2{displaystyle textstyle {frac {dx}=6x^{2}, o en forma diferencial, du=6x2dx{displaystyle du=6x^{2},dx}. Ahora
- ∫ ∫ ()2x3+1)7()x2)dx=16∫ ∫ ()2x3+1)7⏟ ⏟ u7()6x2)dx⏟ ⏟ du=16∫ ∫ u7du=16()18u8)+C=148()2x3+1)8+C,{0} {0}} {0} {0} {0}} {0}} {0}} {c}} {c} {c} {c} {c} {c}}} {cc}} {ccc} {c} {ccc} {c}}ccccccccc}}}}}}}ccccccccccccccccccccccc}cccccccccccccccccccccccccccccc}ccc}cccccccccccccccc
Donde C{displaystyle C} es una constante arbitraria de integración.
Este procedimiento se usa con frecuencia, pero no todas las integrales tienen una forma que permita su uso. En cualquier caso, el resultado debe verificarse diferenciando y comparando con el integrando original.
- ddx[148()2x3+1)8+C]=16()2x3+1)7()6x2)=()2x3+1)7()x2).{displaystyle {frac {d}{dx}left[{frac {1}{48}(2x^{3}+1)}{8}+Cright]={frac {1}{6}}(2x^{3}+1)^{7}(6x^{2})=(2x^{3}+1)}{7}x} }
Para integrales definidas, los límites de integración también deben ajustarse, pero el procedimiento es básicamente el mismo.
Integrales definidas
Vamos g:[a,b]→ → I{displaystyle g:[a,b]rightarrow Yo... ser una función diferenciable con un derivado continuo, donde I⊂ ⊂ R{displaystyle Isubset mathbb {R} es un intervalo. Supongamos que f:I→ → R{displaystyle f:Irightarrow {R} es una función continua. Entonces...
- ∫ ∫ abf()g()x))⋅ ⋅ g.()x)dx=∫ ∫ g()a)g()b)f()u)du.{displaystyle int _{a}^{b}f(g(x))cdot g'(x),dx=int _{g(a)}^{g(b)}f(u) du.}
En la notación de Leibniz, la sustitución u=g()x){displaystyle u=g(x)} rendimientos
- dudx=g.()x).{displaystyle {frac {}=g'(x).}
Trabajando heurísticamente con infinitesimales se obtiene la ecuación
- du=g.()x)dx,{displaystyle du=g'(x),dx,}
lo que sugiere la fórmula de sustitución anterior. (Esta ecuación puede fundamentarse rigurosamente al interpretarla como un enunciado sobre formas diferenciales). Uno puede considerar el método de integración por sustitución como una justificación parcial de la notación de Leibniz para integrales y derivadas.
La fórmula se usa para transformar una integral en otra integral que es más fácil de calcular. Así, la fórmula se puede leer de izquierda a derecha o de derecha a izquierda para simplificar una integral dada. Cuando se usa de la manera anterior, a veces se conoce como u-sustitución o w-sustitución en la que un La nueva variable se define como una función de la variable original que se encuentra dentro de la función compuesta multiplicada por la derivada de la función interna. La última forma se usa comúnmente en la sustitución trigonométrica, reemplazando la variable original con una función trigonométrica de una nueva variable y el diferencial original con el diferencial de la función trigonométrica.
Prueba
La integración por sustitución puede derivarse del teorema fundamental del cálculo como sigue. Vamos f{displaystyle f} y g{displaystyle g} ser dos funciones que satisfagan la hipótesis anterior que f{displaystyle f} continuo I{displaystyle Yo... y g.{displaystyle g'} es integrado en el intervalo cerrado [a,b]{displaystyle [a,b]}. Luego la función f()g()x))⋅ ⋅ g.()x){displaystyle f(g(x)cdot g'(x)} es también integrado en [a,b]{displaystyle [a,b]}. De ahí las integrales
- ∫ ∫ abf()g()x))⋅ ⋅ g.()x)dx{displaystyle int _{a}^{b}f(g(x)cdot g'(x) dx}
y
- ∫ ∫ g()a)g()b)f()u)du{displaystyle int _{g(a)}{g(b)}f(u) du}
de hecho existen, y queda por demostrar que son iguales.
Desde f{displaystyle f} es continuo, tiene un antiderivativo F{displaystyle F}. La función compuesta F∘ ∘ g{displaystyle Fcirc g} se define entonces. Desde g{displaystyle g} es diferente, combinando la regla de la cadena y la definición de un da antiderivativo
- ()F∘ ∘ g).()x)=F.()g()x))⋅ ⋅ g.()x)=f()g()x))⋅ ⋅ g.()x).{displaystyle (Fcirc g)'(x)=F'(g(x))cdot g'(x)=f(g(x)))cdot g'(x). }
Aplicando el teorema fundamental del cálculo dos veces se obtiene
- ∫ ∫ abf()g()x))⋅ ⋅ g.()x)dx=∫ ∫ ab()F∘ ∘ g).()x)dx=()F∘ ∘ g)()b)− − ()F∘ ∘ g)()a)=F()g()b))− − F()g()a))=∫ ∫ g()a)g()b)f()u)du,{fnMicrosoft Sans Serif} {fnMicrosoft Sans Serif} {cnMicrosoft Sans Serif} {g}gnMicrosoft Sans Serif} {f} {g} {g} {g}g} {g}g} {g}g}g}g}g} {g}g}g}g}g}g}g}g}g}g}g}g}g}gnMinMinMinMinMinMinMinMinMinMinMinMinMinMinMinMinMinMinMinMinMinMinMinMinMinMinMinMinMinMinMinMinMinMinMinMinMinMinMinMinMinMinMinMinMinMinMinMinMinMinMinMinMinMinMinMinMinMinMinMin
que es la regla de sustitución.
Ejemplos
Ejemplo 1
Considere la integral
- ∫ ∫ 02x# ()x2+1)dx.{displaystyle int _{0}^{2}xcos(x^{2}+1) dx.}
Hacer la sustitución u=x2+1{displaystyle u=x^{2}+1} para obtener du=2xdx{displaystyle du=2x dx}, que significa xdx=12du{displaystyle x dx={frac {1}{2} du}. Por lo tanto,
- ∫ ∫ x=0x=2x# ()x2+1)dx=12∫ ∫ u=1u=5# ()u)du=12()pecado ()5)− − pecado ()1)).{displaystyle {begin{aligned}in ¿Por qué?
Desde el límite inferior x=0{displaystyle x=0} fue reemplazado por u=1{displaystyle u=1}, y el límite superior x=2{displaystyle x=2} con 22+1=5{displaystyle 2^{2}+1=5}, una transformación de nuevo en términos de x{displaystyle x} era innecesario.
Alternativamente, uno puede evaluar completamente la integral indefinida (ver más abajo) primero y luego aplicar las condiciones de contorno. Esto se vuelve especialmente útil cuando se usan sustituciones múltiples.
Ejemplo 2
Para la integral
- ∫ ∫ 011− − x2dx,{displaystyle int _{0}{1}{sqrt {1-x^{2},dx,}
se necesita una variación del procedimiento anterior. La sustitución x=pecado u{displaystyle x=sin u} implicación dx=# udu{displaystyle dx=cos u,du} es útil porque 1− − pecado2 u=# ()u){displaystyle {sqrt {1-sin }u}=cos(u)}. Así es.
- ∫ ∫ 011− − x2dx=∫ ∫ 0π π /21− − pecado2 u# ()u)du=∫ ∫ 0π π /2#2 udu=[u2+pecado ()2u)4]0π π /2=π π 4+0=π π 4.{displaystyle {begin{aligned}in ¿Qué? {1-x^{2}} ################################################################################################################################################################################################################################################################ ¿Por qué? {fnMicrosoft Sans Serif} {fnMicrosoft Sans Serif} {fnMicrosoft Sans Serif} {fnMicrosoft Sans Serif} {fnMicroc} {fnMicroc} {fnMicrosoft ]} {fnMicros} {fnMicroc} {fnMicrosoft} {f}}}f}}f}fnun}}}}fnun}fnun}f}fnKfnMinMinMinun}fnMinun}fnun}fnun}fnun}fnun}fnun}fnun}fnun}fnun}fnun}fnun}\fnun}fnun}fnun}fnun}fnun}fnun}\fnun}fnun}fnun}fnun} # {4}+0\\fnMicroc {pi} } {4}}.
La integral resultante puede ser calculada mediante la integración por partes o una fórmula de doble ángulo, 2#2 u=1+# ()2u){displaystyle 2cos ^{2}u=1+cos(2u)}, seguido de una sustitución más. También se puede observar que la función que se integra es el cuarto superior derecho de un círculo con un radio de uno, y por lo tanto integrar el cuarto superior derecho de cero a uno es el equivalente geométrico al área de un cuarto del círculo de unidad, o π π 4{fnMicroc {fnMicrosoft {fnMicrosoft {fnMicrosoft {\fnMicrosoft {\\fnMicrosoft {\\fnMicrosoft {fnMicrosoft {fnMicrosoft {\fnMicrosoft {\\\fnMicrosoft {\\\\\\\\\\\\\\\\\\\\\\\\\\\\fn\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\fnMin } {4}}.
Antiderivadas
La sustitución se puede utilizar para determinar los antiderivados. Uno elige una relación entre x{displaystyle x} y u{displaystyle u}, determina la relación correspondiente entre dx{displaystyle dx} y du{displaystyle du} diferenciando y realizando las sustituciones. Es de esperar que se determine un antiderivativo para la función sustituida; la sustitución original entre x{displaystyle x} y u{displaystyle u} entonces está deshecha.
Al igual que en el ejemplo 1 anterior, la siguiente antiderivada se puede obtener con este método:
- ∫ ∫ x# ()x2+1)dx=12∫ ∫ 2x# ()x2+1)dx=12∫ ∫ # udu=12pecado u+C=12pecado ()x2+1)+C,{fnMicrosoftware {fnMicrosoft Sans Serif} {fnMicroc {fnMicroc {1}{2}}int 2xcos(x^{2}+1),dx\[6pt]={2} {c}ccc}ccH00}cH00}ccH0}ccH0}cH0}cH0}ccH00}cccc}ccc}ccH00}cH00}cH00}cccH00}cH00}cccccH00}ccH00}cH00}ccH00}ccH00}ccH00}cH00}cH00}c}cH00}ccH00}ccH00}cccc {1}{2}sin(x^{2}+1)+C,end{aligned}}
Donde C{displaystyle C} es una constante arbitraria de integración.
No había límites integrales para transformar, pero en el último paso revertir la sustitución original u=x2+1{displaystyle u=x^{2}+1} era necesario. Al evaluar las integrales definidas por sustitución, se puede calcular el antiderivativo completamente primero, luego aplicar las condiciones de límite. En ese caso, no hay necesidad de transformar los términos límite.
La función tangente se puede integrar mediante sustitución expresándola en términos de seno y coseno:
- ∫ ∫ # xdx=∫ ∫ pecado x# xdx{displaystyle int tan x,dx=int {frac {sin x}{cos x},dx}
Utilizando la sustitución u=# x{displaystyle u=cos x} da du=− − pecado xdx{displaystyle du=-sin x,dx} y
- ∫ ∫ # xdx=∫ ∫ pecado x# xdx=∫ ∫ − − duu=− − In SilenciouSilencio+C=− − In Silencio# xSilencio+C=In Silenciosec xSilencio+C.{displaystyle {begin{aligned}int tan x,dx limit=int {frac {sin} ## {cos x},dx\\fnh00}fnMic {du}\\\\fn}\\fnccH00}\cH00}\\fn\cH00\cH00\cH00cH00cH00cH00cH00cH00cH00cH00cH00\cH00cH00cH00cH00cH00cH00\cH00cH00\\\\cH00cH00\\\cH00\\\\cH00\\cH00\\cH00\cH00cH00cH00\\cH00\cH00\cH00\\cH00\\cH00\\cH00\ Silencioso+C\cH0ln Silenciocos x Sobrevivir+C\\ln Silencios x sobrevivir+C.end{aligned}}
Sustitución de múltiples variables
También se puede usar la sustitución cuando se integran funciones de varias variables. Aquí la función de sustitución (v1,...,vn) = φ(u1,..., u n) debe ser inyectable y continuamente diferenciable, y los diferenciales se transforman como
- dv1⋯ ⋯ dvn=SilencioDet()Dφ φ )()u1,...... ,un)Silenciodu1⋯ ⋯ dun,{displaystyle dv_{1}cdots dv_{n}=left arrestdet(Dvarphi)(u_{1},ldotsu_{n})right eterna,du_{1}cdots Du_{n},}
donde det(Dφ)(u1,..., un) denota el determinante de la matriz jacobiana de derivadas parciales de φ en el punto (u1,..., un). Esta fórmula expresa el hecho de que el valor absoluto del determinante de una matriz es igual al volumen del paralelotopo recorrido por sus columnas o filas.
Más precisamente, la fórmula del cambio de variables se establece en el siguiente teorema:
Teorema. Sea U un conjunto abierto en Rn y φ: U → Rn una función diferenciable inyectiva con derivadas parciales continuas, cuyo jacobiano es distinto de cero para cada x en U. Luego, para cualquier función continua de valor real, compatible de forma compacta, f, con soporte contenido en φ(U),
- ∫ ∫ φ φ ()U)f()v)dv=∫ ∫ Uf()φ φ ()u))SilencioDet()Dφ φ )()u)Silenciodu.{displaystyle int _{varphi (U)}f(mathbf {v}),dmathbf {v} =int _{U}f(varphi (mathbf {u})left sometidadet(Dvarphi)(mathbf {u})derech}
Las condiciones del teorema se pueden debilitar de varias maneras. Primero, el requisito de que φ sea continuamente diferenciable puede ser reemplazado por la suposición más débil de que φ ser meramente diferenciable y tener un inverso continuo. Esto está garantizado si φ es continuamente diferenciable por el teorema de la función inversa. Alternativamente, el requisito de que det(Dφ) ≠ 0 puede eliminarse aplicando el teorema de Sard.
Para funciones medibles de Lebesgue, el teorema se puede establecer de la siguiente forma:
Teorema. Sea U un subconjunto medible de Rn y φ: U → Rn una función inyectiva, y suponga que para cada x en U existe φ′(x) en Rn,n tal que φ(y) = φ(x) + φ′(x)(y − x) + o(||y − x||) como y → x (aquí o es notación de o pequeña). Entonces φ(U) es medible, y para cualquier función de valor real f definido en φ(U),
- ∫ ∫ φ φ ()U)f()v)dv=∫ ∫ Uf()φ φ ()u))SilencioDetφ φ .()u)Silenciodu{displaystyle int _{varphi (U)}f(v),dv=int _{U}f(varphi (u))left durabledet varphi '(u)right sometida,du}
en el sentido de que si cualquiera de las integrales existe (incluyendo la posibilidad de ser propiamente infinita), también existe la otra, y tienen el mismo valor.
Otra versión muy general de la teoría de la medida es la siguiente:
Teorema. Sea X un espacio de Hausdorff localmente compacto equipado con una medida finita de radón μ, y sea Y sea un espacio de Hausdorff σ-compacto con una medida de radón σ-finita ρ. Sea φ: X → Y una función absolutamente continua (donde esto último significa que ρ(φ(E)) = 0 siempre que μ(E) = 0). Entonces existe una función medible de Borel de valor real w en X tal que para cada función integrable de Lebesgue f: Y → R, la función (f ∘ φ) ⋅ w es Lebesgue integrable en X, y
- ∫ ∫ Yf()Sí.)d*** *** ()Sí.)=∫ ∫ X()f∘ ∘ φ φ )()x)w()x)dμ μ ()x).{displaystyle int _{Y}f(y),drho (y)=int _{X}(fcirc varphi)(x),w(x),dmu (x). }
Además, es posible escribir
- w()x)=()g∘ ∘ φ φ )()x){displaystyle w(x)=(gcirc varphi)(x)}
para alguna función medible de Borel g en Y.
En la teoría de la medida geométrica, la integración por sustitución se usa con las funciones de Lipschitz. Una función bi-Lipschitz es una función Lipschitz φ: U → Rn que es inyectiva y cuya función inversa φ−1: φ( U) → U también es Lipschitz. Por el teorema de Rademacher, una aplicación bi-Lipschitz es diferenciable en casi todas partes. En particular, el determinante jacobiano de un mapeo bi-Lipschitz det Dφ está bien definido en casi todas partes. Entonces se cumple el siguiente resultado:
Teorema. Sea U un subconjunto abierto de R n y φ: U → Rn ser un mapeo bi-Lipschitz. Sea f: φ(U) → R mensurable. Entonces
- ∫ ∫ U()f∘ ∘ φ φ )()x)SilencioDetDφ φ ()x)Silenciodx=∫ ∫ φ φ ()U)f()x)dx{displaystyle int _{U}(fcirc varphi)(x)
en el sentido de que si cualquiera de las integrales existe (o es propiamente infinita), también existe la otra, y tienen el mismo valor.
El teorema anterior fue propuesto por primera vez por Euler cuando desarrolló la noción de integrales dobles en 1769. Aunque Lagrange lo generalizó a integrales triples en 1773, y lo usó Legendre, Laplace, Gauss y generalizó por primera vez a n variables por Mikhail Ostrogradski en 1836, resistió una prueba formal totalmente rigurosa durante un tiempo sorprendentemente largo, y fue resuelto satisfactoriamente por primera vez 125 años después, por Élie Cartan en una serie de documentos a partir de mediados de la década de 1890.
Aplicación en probabilidad
La sustitución se puede utilizar para responder a la siguiente pregunta importante en probabilidad: dada una variable aleatoria X{displaystyle X} con densidad de probabilidad pX{displaystyle P_{X} y otra variable aleatoria Y{displaystyle Sí. tales que Y=φ φ ()X){displaystyle Y=phi (X)} para inyección (uno a uno) φ φ {displaystyle phi }, cuál es la densidad de probabilidad para Y{displaystyle Sí.?
Es más fácil responder a esta pregunta respondiendo primero a una pregunta ligeramente diferente: ¿Cuál es la probabilidad de que Y{displaystyle Sí. toma un valor en algún subconjunto particular S{displaystyle S.? Denota esta probabilidad P()Y▪ ▪ S){displaystyle P(Yin S)}. Por supuesto, si Y{displaystyle Sí. tiene densidad de probabilidad pY{displaystyle P_{Y} entonces la respuesta es
- P()Y▪ ▪ S)=∫ ∫ SpY()Sí.)dSí.,{displaystyle P(Yin S)=int _{S}p_{Y}(y),dy,}
pero esto no es realmente útil porque no lo sabemos pY{displaystyle P_{Y}Es lo que intentamos encontrar. Podemos avanzar considerando el problema de la variable X{displaystyle X}. Y{displaystyle Sí. toma un valor S{displaystyle S. siempre X{displaystyle X} toma un valor φ φ − − 1()S){displaystyle phi ^{-1}(S)}Así que
- P()Y▪ ▪ S)=P()X▪ ▪ φ φ − − 1()S))=∫ ∫ φ φ − − 1()S)pX()x)dx.{displaystyle P(Yin S)=P(Xin phi ^{-1}(S)=int _{phi ^{-1}(S)}p_{X}(x),dx.}
Cambio de variable x{displaystyle x} a Sí.{displaystyle y} da
- P()Y▪ ▪ S)=∫ ∫ φ φ − − 1()S)pX()x)dx=∫ ∫ SpX()φ φ − − 1()Sí.))Silenciodφ φ − − 1dSí.SilenciodSí..{displaystyle P(Yin S)=int _{phi ^{-1}p_{X}(x),dx=int ¿Por qué? Hola.
Combinando esto con nuestra primera ecuación da
- ∫ ∫ SpY()Sí.)dSí.=∫ ∫ SpX()φ φ − − 1()Sí.))Silenciodφ φ − − 1dSí.SilenciodSí.,{displaystyle int - Sí. ¿Por qué? Hola.
entonces
- pY()Sí.)=pX()φ φ − − 1()Sí.))Silenciodφ φ − − 1dSí.Silencio.{displaystyle p_{Y}(y)=p_{X}(phi ^{-1}(y) {dfnK} Buenas tardes.
En el caso en que X{displaystyle X} y Y{displaystyle Sí. depende de varias variables no relacionadas, es decir. pX=pX()x1,...... ,xn){displaystyle p_{X}=p_{X}(x_{1},ldotsx_{n}} y Sí.=φ φ ()x){displaystyle y=phi (x)}, pY{displaystyle P_{Y} se puede encontrar por sustitución en varias variables discutidas anteriormente. El resultado es
- pY()Sí.)=pX()φ φ − − 1()Sí.))SilencioDetDφ φ − − 1()Sí.)Silencio.{displaystyle [P_{Y}(y)=p_{X}(phi ^{-1}(y)))left arrestdet Dphi ^{-1}(y)justo de la vida.}
Contenido relacionado
Matemático
Problema de marco
Dígito