Problema inverso

format_list_bulleted Contenido keyboard_arrow_down
ImprimirCitar
Proceso de cálculo de los factores causales que produjeron un conjunto de observaciones

Un problema inverso en ciencia es el proceso de calcular, a partir de un conjunto de observaciones, los factores causales que las produjeron: por ejemplo, calcular una imagen en tomografía computarizada de rayos X, reconstrucción de fuentes en acústica, o calcular la densidad de la Tierra a partir de mediciones de su campo de gravedad. Se llama problema inverso porque comienza con los efectos y luego calcula las causas. Es el inverso de un problema directo, que comienza con las causas y luego calcula los efectos.

Los problemas inversos son algunos de los problemas matemáticos más importantes en ciencias y matemáticas porque nos informan sobre parámetros que no podemos observar directamente. Tienen una amplia aplicación en identificación de sistemas, óptica, radar, acústica, teoría de la comunicación, procesamiento de señales, imágenes médicas, visión por computadora, geofísica, oceanografía, astronomía, detección remota, procesamiento de lenguaje natural, aprendizaje automático, pruebas no destructivas, análisis de estabilidad de taludes y muchos más. otros campos.

Historia

Comenzar con los efectos para descubrir las causas ha preocupado a los físicos durante siglos. Un ejemplo histórico son los cálculos de Adams y Le Verrier que llevaron al descubrimiento de Neptuno a partir de la trayectoria perturbada de Urano. Sin embargo, no se inició un estudio formal de los problemas inversos hasta el siglo XX.

Hermann Weyl descubrió uno de los primeros ejemplos de una solución a un problema inverso y lo publicó en 1911, describiendo el comportamiento asintótico de los valores propios del operador de Laplace-Beltrami. Hoy conocida como ley de Weyl, quizás se entienda más fácilmente como una respuesta a la pregunta de si es posible escuchar la forma de un tambor. Weyl conjeturó que las frecuencias propias de un tambor estarían relacionadas con el área y el perímetro del tambor mediante una ecuación particular, un resultado mejorado por matemáticos posteriores.

El campo de los problemas inversos fue abordado más tarde por el físico soviético-armenio Viktor Ambartsumian.

Cuando aún era estudiante, Ambartsumian estudió a fondo la teoría de la estructura atómica, la formación de los niveles de energía y la ecuación de Schrödinger y sus propiedades, y cuando dominó la teoría de los valores propios de las ecuaciones diferenciales, señaló la aparente analogía entre niveles discretos de energía y los valores propios de ecuaciones diferenciales. Luego preguntó: dada una familia de valores propios, ¿es posible encontrar la forma de las ecuaciones cuyos valores propios son? Esencialmente, Ambartsumian estaba examinando el problema inverso de Sturm-Liouville, que se ocupaba de determinar las ecuaciones de una cuerda vibrante. Este artículo se publicó en 1929 en la revista de física alemana Zeitschrift für Physik y permaneció en la oscuridad durante bastante tiempo. Al describir esta situación después de muchas décadas, Ambartsumian dijo: "Si un astrónomo publica un artículo con contenido matemático en una revista de física, lo más probable es que lo olvide".

Sin embargo, hacia el final de la Segunda Guerra Mundial, este artículo, escrito por Ambartsumian, de 20 años, fue encontrado por matemáticos suecos y constituyó el punto de partida para toda una área de investigación sobre problemas inversos, convirtiéndose en la base de toda una disciplina.

Luego se han dedicado importantes esfuerzos a una "solución directa" del problema de dispersión inversa especialmente por Gelfand y Levitan en la Unión Soviética. Propusieron un método analítico constructivo para determinar la solución. Cuando las computadoras estuvieron disponibles, algunos autores investigaron la posibilidad de aplicar su enfoque a problemas similares, como el problema inverso en la ecuación de onda 1D. Pero rápidamente resultó que la inversión es un proceso inestable: el ruido y los errores pueden amplificarse enormemente, lo que hace que una solución directa sea difícilmente practicable. Luego, alrededor de los años setenta, aparecieron los enfoques de mínimos cuadrados y probabilísticos, que resultaron ser muy útiles para la determinación de parámetros involucrados en varios sistemas físicos. Este enfoque tuvo mucho éxito. Hoy en día, los problemas inversos también se investigan en campos fuera de la física, como la química, la economía y la informática. Eventualmente, a medida que los modelos numéricos prevalecen en muchas partes de la sociedad, podemos esperar un problema inverso asociado con cada uno de estos modelos numéricos.

Comprensión conceptual

Desde Newton, los científicos han intentado mucho modelar el mundo. En particular, cuando se dispone de un modelo matemático (por ejemplo, la ley gravitatoria de Newton o la ecuación de Coulomb para la electrostática), podemos prever, dados algunos parámetros que describen un sistema físico (como una distribución de masa o una distribución de cargas eléctricas), el comportamiento del sistema. Este enfoque se conoce como modelado matemático y los parámetros físicos mencionados anteriormente se denominan parámetros del modelo o simplemente modelo. Para ser precisos, introducimos la noción de estado del sistema físico: es la solución de la ecuación del modelo matemático. En la teoría del control óptimo, estas ecuaciones se denominan ecuaciones de estado. En muchas situaciones, no estamos realmente interesados en conocer el estado físico, sino solo sus efectos en algunos objetos (por ejemplo, los efectos que tiene el campo gravitatorio en un planeta específico). De ahí que tengamos que introducir otro operador, llamado operador de observación, que convierte el estado del sistema físico (aquí el campo gravitatorio predicho) en lo que queremos observar (aquí los movimientos del planeta considerado). Ahora podemos introducir el llamado problema de avance, que consta de dos pasos:

  • determinación del estado del sistema desde los parámetros físicos que lo describen
  • aplicación del operador de observación al estado estimado del sistema para predecir el comportamiento de lo que queremos observar.

Esto conduce a introducir otro operador F{displaystyle F} ()F significa "para adelante") que mapas parámetros modelo p{displaystyle p} en F()p){displaystyle F(p)}, los datos que modelo p{displaystyle p} predice que es el resultado de este procedimiento de dos pasos. Operador F{displaystyle F} se llama operador o mapa del futuro. En este enfoque básicamente intentamos predecir los efectos sabiendo las causas.

La siguiente tabla muestra, considerando la Tierra como el sistema físico y para diferentes fenómenos físicos, los parámetros del modelo que describen el sistema, la cantidad física que describe el estado del sistema físico y las observaciones comúnmente realizadas sobre el estado del sistema.

Ecuaciones de gobiernoParámetros modelo (introducción del modelo)Estado del sistema físicoObservaciones comunes sobre el sistema
Ley de gravedad de NewtonDistribución de masaCampo gravitacionalMedición realizada por gravimetros en diferentes ubicaciones superficiales
Ecuaciones de MaxwellDistribución de la susceptibilidad magnéticaCampo magnéticoCampo magnético medido en diferentes ubicaciones superficiales por magnetómetros (caso de estado fijo)
Ecuación de ondaDistribución de velocidades de onda y densidadesCampo de onda causado por fuentes sísmicas artificiales o naturalesVelocidad de partículas medida por sismómetros colocados en diferentes lugares de superficie
Ecuación de difusiónDistribución del coeficiente de difusiónDifundir la concentración material como función del espacio y del tiempoVigilancia de esta concentración medida en diferentes lugares

En el enfoque del problema inverso, en términos generales, tratamos de conocer las causas dados los efectos.

Enunciado general del problema inverso

El problema inverso es el "inverso" del problema de avance: en lugar de determinar los datos producidos por parámetros de modelo particulares, queremos determinar los parámetros de modelo que producen los datos dobs{displaystyle d_{text{obs}} que es la observación que hemos grabado (el subscripto obs stands for observed). Nuestro objetivo, en otras palabras, es determinar los parámetros del modelo p{displaystyle p} tal que (al menos aproximadamente)

dobs=F()p){displaystyle d_{text{obs}=F(p)}
F{displaystyle F}M{displaystyle M}N{displaystyle N}

  • El espacio de modelos denotado por P{displaystyle P}: el espacio vectorial abarcado por parámetros modelo; tiene M{displaystyle M} dimensiones;
  • El espacio de datos denotado por D{displaystyle D}: D=RN{displaystyle D=Mathbb {R} si organizamos las muestras medidas en un vector con N{displaystyle N} componentes (si nuestras mediciones consisten en funciones, D{displaystyle D} es un espacio vectorial con dimensiones infinitas);
  • F()p){displaystyle F(p)}: respuesta del modelo p{displaystyle p}; consta de la datos predichos por modelo p{displaystyle p};
  • F()P){displaystyle F(P)}: la imagen de P{displaystyle P} por el mapa de adelante, es un subconjunto de D{displaystyle D} (pero no un subespacial a menos que F{displaystyle F} es lineal) de las respuestas de todos los modelos;
  • dobs− − F()p){displaystyle d_{text{obs}-F(p)}: datos inadaptados (o residuales) asociado con modelo p{displaystyle p}: se pueden organizar como vector, un elemento D{displaystyle D}.

El concepto de residuos es muy importante: en el ámbito de encontrar un modelo que coincida con los datos, su análisis revela si el modelo considerado puede considerarse realista o no. Las discrepancias sistemáticas poco realistas entre los datos y las respuestas del modelo también revelan que el mapa de avance es inadecuado y puede brindar información sobre un mapa de avance mejorado.

Cuando el operador F{displaystyle F} es lineal, el problema inverso es lineal. De lo contrario, eso es más a menudo, el problema inverso es no lineal. Además, los modelos no siempre pueden ser descritos por un número finito de parámetros. Es el caso cuando buscamos parámetros distribuidos (una distribución de velocidades de onda por ejemplo): en tales casos el objetivo del problema inverso es recuperar una o varias funciones. Tales problemas inversos son problemas inversos con dimensión infinita.

Problemas inversos lineales

En el caso de un mapa directo lineal y cuando tratamos con un número finito de parámetros del modelo, el mapa directo se puede escribir como un sistema lineal

d=Fp{displaystyle d=Fp}
F{displaystyle F}

Un ejemplo elemental: el campo gravitatorio de la Tierra

Solo unos pocos sistemas físicos son realmente lineales con respecto a los parámetros del modelo. Uno de esos sistemas de la geofísica es el del campo gravitatorio de la Tierra. El campo gravitatorio de la Tierra está determinado por la distribución de la densidad de la Tierra en el subsuelo. Debido a que la litología de la Tierra cambia significativamente, podemos observar diferencias mínimas en el campo gravitatorio de la Tierra en la superficie de la Tierra. A partir de nuestra comprensión de la gravedad (ley de gravitación de Newton), sabemos que la expresión matemática de la gravedad es:

d=Gpr2;{displaystyle d={f} {f}}} {f}}} {f}}} {f}} {f}}} {f}}} {f}}}}} {f}}} {f}}}}}} {f}}}}
d{displaystyle d}G{displaystyle G.p{displaystyle p}r{displaystyle r}

Al discretar la expresión anterior, podemos relacionar las observaciones de datos discretas sobre la superficie de la Tierra con los parámetros de modelo discretos (densidad) en la subsuperficie que deseamos conocer más. Por ejemplo, considere el caso en el que tenemos mediciones realizadas en 5 lugares en la superficie de la Tierra. En este caso, nuestro vector de datos, d{displaystyle d} es un vector de columna de dimensión (5×1): su i{displaystyle i}-to componente se asocia con el i{displaystyle i}-la ubicación de observación. También sabemos que sólo tenemos cinco masas desconocidas pj{displaystyle P_{j} en la subsuperficie (no realista pero utilizado para demostrar el concepto) con ubicación conocida: denotamos por rij{displaystyle r_{ij} la distancia entre i{displaystyle i}-la ubicación de observación y el j{displaystyle j}- la misa. Así, podemos construir el sistema lineal que relaciona las cinco masas desconocidas a los cinco puntos de datos como sigue:

d=Fp,{displaystyle d=Fp,}
d=[d1d2d3d4d5],p=[p1p2p3p4p5],{displaystyle ### {begin{bmatrix}d_{1}d_{2}d_{3}d_{4}d_{5}end{bmatrix},quad p={begin{bmatrix}p_{1}p_{2}p_{3}p_{4}p_{5}end{bmatrix}}
F=[Gr112Gr122Gr132Gr142Gr152Gr212Gr222Gr232Gr242Gr252Gr312Gr322Gr332Gr342Gr352Gr412Gr422Gr432Gr442Gr452Gr512Gr522Gr532Gr542Gr552]{displaystyle F={begin{bmatrix}{frac {fn} {fn}} {fn}} {fn}}} {fn}}}} {fn}}} {fn}}}}} {fn}}}}} {fn}}} {fn}}}}}} {f}}}}}}} {f}}}}}}}}}}}}}}}}}}}}} {\f}}}}} {f}}}}}}}}}}}}}}}} {f}}} {f}}}} {f}}}}}} {f}}}}}}}}}}}}}}}} {f}} {f}}}} {f}}}} {f}}} {f}}} {f}}}} {f}}}}}} {f}}}}}}}}}}}} {f}}}}}}}}}}}}}} {G}{12} {2}} {f}} {f}} {f}}} {f}}} {f}}} {f}}}} {f}}}} {f}}}} {f}}}}}}} {f}}}}} {f}}}}}} {f}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}} { {G}{13}} {f}} {f}}} {f}}} {f}}} {f}}} {f}} {f}}}} {f}}}}}} {f}}} {f}}}}}} {f}}}}}}} {f}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}} {f} {f}}} {f}}}}}}} {f}}} {f}}}}}} {f}}}}}}}}}}}}}}}} {f} {f}}}}} {f}}}}}}}}}}} {f}}}} {f}} {f}}}}}}}}}} {f}}} {f}}}}}}}} {f}}}}}}}} {G}{14}} {f}} {f}} {f}}} {f}}} {f}}}}} {f}} {f}}} {f}}}}} {f}}}} {f}}}}}}} {f}}}}}} {f}}}}}}}}}}}}}}}}}}}}}}}}} {f}}}} {f}}}}}} {f} {f} {f}}}}}} {f}}}} {f}}}}}}}}}}}}}}}}}}}}}}}}} {f} {f}}}}} {f}} {f}}}}}} {f}}} {f}}} {f}}}} {f}}}}}}}}}}}}}} {f}}}}}}}}}}}}} {G}{15} {f}\\fnMicroc} {} {fn}} {fn}} {fn}}}} {fn}}} {fn}}}} {fn}}}}}} {fn}}}}} {fn}} {fn}}}} {f}} {f}}}}}} {f}}}} {f}}}}}} {f}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}} { {} {fn}} {fn}} {fnK}}}} {fn}}} {fn}}}} {fn}}}}} {fn}}}} {fn}}} {fn}}}} {f}}} {f}}}}}} {f}}}}}}}}}}}}}}}}}}}}}}}}}}}}} {f}}}}}}}}}} {f} {f}}}} {f} {f} {f}}}}}}}}}}}}}}}}}}}}}}}}}} {f}} {f}}}}}}}}}}} {f}}} {f} {f}}} {f}}}}} {f}}}} {f}}}}}}} {f}}}}}}}}}}}}}}} {} {fn}} {fn}} {fn}}}} {fn}} {fn}}} {fn}}}}} {fn}}} {fn}}}}} {fn}}}}}} {f}}}} {f}}}}} {f}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}} {m}}}}}}}}}}} {f}}}}} {f}}}}} {f}}}} {f}}}}}}}}}}}}}}}}} {f} {f} {f}} {f}}} {f}}}} {f}}}}}}}}} {f}}}}}}}}}}}}}}}}}} {f} {f}}}}}}}}}}}}} {G}{24}} {f}} {f}} {f}}} {f}} {f}}} {f}} {f}}}}} {f}}}} {f}}}}} {f}}}}}} {f}}} {f}}}}}}}}}}}} {f}}}}}}}}}}}}}}}}}}}}}}} {f} {f}} {f}}}}} {f}}}}}} {f}} {f}}}}} {f}}}}}}}}}}}}}}}}}} {f}} {f}}}} {f}} {f}}}}} {f}}}}} {f} {f}}}}}}}}} {f}}}}}}}}}}}}}}}}}}}}}}}}}} {G}{25} {f}\\fnMicroc} {fn} {fn} {fn}} {fnK}}}}} {fn}}}} {fn}}} {fn}} {fn}}} {fn}}}}} {fn}}}}} {f}} {f}}}}}} {f}}}}}}}}}}}}}}}}}}}}}}}}}}}} {f}}}}}}}}}}} {f} {f}}} {f} {f}} {f}}}}} {f}}}}}}}}}}}}}}}} {f}}}}}}}} {f}}}} {f}}}}} {f}}}}} {f}} {f}} {f}}}}}}}}}}}}}} {f}}}}}}}}}}}}}}} {} {fn}} {fn}} {fnK}}}} {fn}}} {fn}}}} {fn}}}}} {fn}}}} {fn}}} {fn}}}} {f}}}} {f}}}}}} {f}}}}}}}}}}}}}}}}}}}}}}}}}}}}} {f}}}}}}}}}}}} {f}}}}}}}}}}}}}}} {f}}} {f}}}}}}}}}}}}}}}}} {f}} {f}} {f} {f}} {f}}}} {f}}} {f} {f} {f}}}}} {f}}}}}}}}} {f}}}}}}}}}}}}}}}} {G}{} {f}} {f}} {f}}} {f}} {f}}} {f}}} {f}}}}} {f}}} {f}}}} {f}}}}}}}} {f}}} {f}}}}}}} {f}}}}}}}}}}}}}}}}}}}}}}}}}}}}} {f}}}}}}}}}}}}} {f}}}}}} {f}}}}} {f}}} {f}}}}}}}}}}}}}}}}} {f} {f}}}} {f}}}}} {f}}} {f}}}}}}}} {f}}}}}}}}}}} {f}}}}}}}} {f} {f}}}}}}}}}}} {G}{34}} {f}} {f}}} {f}} {f}}} {f}} {f}} {f}}}}} {f}}}} {f}}}}} {f}}}}} {f}}}} {f}}}}}} {f}}}} {f}}}}}}}}}}}} {}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}} { {G}{35} {f}\\fnMicroc} {G}{4}} {f}} {f}}} {f}}} {f}}} {f}}} {f}} {f}}}} {f}}}}} {f}}} {f}}}}}}} {f}}}}}}}} {f}}}}}}}}}}}}}}}}}}}}}}} {f}}}}} {f}}}}}}}}}}}}}}} {f}}}} {f}}}}} {f}}}} {f}}}}}}}}}}}}}}}}} {f}} {f}}}} {f}}}} {f}}}} {f}}}}} {f}} {f}}}}}}} {f} {f}}}}} {f}}}}}}}}}}}}}}} {fn} {fn}} {fnK}}} {fn}}}} {fn}}} {fn}}} {fn}} {fn}}} {fn}}}}} {fn}}}}} {f}} {f}}}}}} {f}}}}}}}}}}}}}}}}}}}}}}}}}}}}} {f}}}}}}}}}}} {f} {f}}} {f}} {f}}}}}}} {f}}}}}}}}}}}}}}}}} {f}}}}}}}}} {f}}}} {f}}}} {f}} {f}}} {f}}}}}}} {f}}}}}}}}}}}}}}}}}}}}}}}}}}}}} {G}{} {f}} {f}}} {f}}}}} {f}} {f}}} {f}}} {f}}}}}}}}}} {f}} {f}}}}}}}} {f} {f}}}}}}} {f}}} {f}}}}}}} {}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}} { {G}{f}} {f}} {f}}} {f}}} {f}} {f}}} {f}}} {f}}} {f}}}}} {f}}}} {f}}}}} {f}}}} {f}} {f}}}}}}}} {f}}}}}} {f}}}}}}}}}}}}}}}} {f}}}}}}}}}}}}}}}}}}} {f}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}} {f}}}}} {f}} {f} {f} {f} {f}} {f}}}}}} {f}}}}}}} {f}}}}}}}}} {} {fn}}\fnMicroc} {G}{fn}} {fn}} {fn}}} {fn}}}} {fn}}}} {fn}}}} {fn}}}}}} {fn}}} {fn}}}}} {f}}}}}}}} {f}}}}}}} {f}} {f}}}}}}}}}}} {f}}}}}}}}}}}}}} {f}}}}}}}}}}} {f}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}} {f}}}}}}}}}} {f}}}} {f}} {f} {f} {f}} {f} {f}}}}}}}}}}}}}} {G}{2}} {f}} {f}}} {f}} {f}}} {f}}} {f}}} {fn}}}}}}}} {f} {f}}} {f}}}}}} {f}}}}} {f}}}}}}}} {f}} {f}}}}}}}}}} {f}}}}}}}}}}}}}}}}}}} {f}}}}}}}}} {f}}}}} {f}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}} {f}}}} {f}}}} {f}}}}} {f}}} {f}}} {f} {f}}}}}} {f}} {f}}}}}}}}}}}} {G}{} {f}} {f}}} {f}}}}}} {f} {f}}} {f}} {f}}}}}}}}}}} {f} {f}}} {f}}}}} {f}}}} {f}}}}}}}}}}}}}}}}}}} {f}}}}}}}}}}}}} {f} {f}} {f} {f} {f}}}}}} {f}}}}} {f}}}} {f}}}}}}}}}}}}}}}}} {f}} {f}}}}} {f}}}}}}}}} {f}}}}}}}}}} {f}}}}}}}} {f}}}}}}}}}}}}}}}}}}}}}}}}}} {} {fn} {fn}} {fnK}}}} {fn}}}} {fn}}} {fn}}}}} {fn}}}}} {fn}} {fn}}}}}} {fn}}}}}}}}}}}}}} {fn}}}}}}}}}}}}}}} {f}}}}} {f} {f}}}}}}} {f}}}}} {f}}}}} {f}} {f}}} {f}}}}}}}}}}}}}}}}}} {f}}}}}}}}} {f}}}}}}}}}} {f}}}}}}}}}}}}}}} {f}}}}}}}}}}}}}} {f}} {f}}}}}}}}}} {G} {r_{55}}end{bmatrix}}

Para resolver los parámetros modelo que se ajustan a nuestros datos, podemos invertir la matriz F{displaystyle F} para convertir directamente las mediciones en nuestros parámetros modelo. Por ejemplo:

p=F− − 1dobs{displaystyle ¿Qué?
F{displaystyle F}

Sin embargo, incluso una matriz cuadrada no puede tener inverso: matriz F{displaystyle F} puede ser deficiente de rango (es decir, tiene cero eigenvalues) y la solución del sistema p=F− − 1dobs{displaystyle ¿Qué? no es único. Entonces la solución del problema inverso será indeterminada. Esta es una primera dificultad. Los sistemas sobredeterminados (más ecuaciones que desconocidos) tienen otros problemas. También el ruido puede dañar nuestras observaciones haciendo d{displaystyle d} posiblemente fuera del espacio F()P){displaystyle F(P)} de posibles respuestas a parámetros modelo para que la solución del sistema p=F− − 1dobs{displaystyle ¿Qué? puede no existir. Esta es otra dificultad.

Herramientas para superar la primera dificultad

La primera dificultad refleja un problema crucial: nuestras observaciones no contienen suficiente información y se requieren datos adicionales. Los datos adicionales pueden provenir de información previa física sobre los valores de los parámetros, sobre su distribución espacial o, más generalmente, sobre su dependencia mutua. También puede provenir de otros experimentos: por ejemplo, podemos pensar en integrar datos registrados por gravímetros y sismógrafos para una mejor estimación de las densidades. La integración de esta información adicional es básicamente un problema de estadística. Esta disciplina es la que puede responder a la pregunta: ¿Cómo mezclar cantidades de distinta naturaleza? Seremos más precisos en la sección "Enfoque bayesiano" abajo.

En cuanto a los parámetros distribuidos, la información previa sobre su distribución espacial consiste a menudo en información sobre algunos derivados de estos parámetros distribuidos. Además, es práctica común, aunque algo artificial, buscar el modelo "simplest" que coincide razonablemente con los datos. Esto se logra generalmente penalizando L1{displaystyle L^{1} norma del gradiente (o la variación total) de los parámetros (este enfoque también se denomina la maximización de la entropía). También se puede hacer el modelo simple a través de una parametrización que introduce los grados de libertad sólo cuando sea necesario.

También puede integrarse información adicional a través de limitaciones de desigualdad en los parámetros modelo o algunas funciones de ellos. Estas limitaciones son importantes para evitar valores poco realistas para los parámetros (valores negativos, por ejemplo). En este caso, el espacio abarcado por parámetros modelo ya no será un espacio vectorial sino un espacio vectorial subconjunto de modelos admisibles denotado por Padm{displaystyle P_{text{adm}} en la secuela.

Herramientas para superar la segunda dificultad

Como se mencionó anteriormente, el ruido puede ser tal que nuestras mediciones no son la imagen de ningún modelo, de modo que no podemos buscar un modelo que produzca los datos sino buscar el mejor (o óptimo) modelo: es decir, el que mejor se ajuste a los datos. Esto nos lleva a minimizar una función objetiva, a saber, una funcional que cuantifica la magnitud de los residuos o hasta qué punto los datos predichos son de los datos observados. Por supuesto, cuando tenemos datos perfectos (es decir, sin ruido) entonces el modelo recuperado debe adaptarse perfectamente a los datos observados. Una función objetiva estándar, φ φ {displaystyle varphi }, es de la forma: φ φ ()p)=.. Fp− − dobs.. 2{displaystyle varphi (p)=fnciónFp-d_{text{obs}fnción^{2}}Donde .. ⋅ ⋅ .. {displaystylefncdotfn} es la norma Euclideana (será la L2{displaystyle L^{2} norma cuando las mediciones son funciones en lugar de muestras) de los residuos. Este enfoque equivale a hacer uso de los mínimos cuadrados ordinarios, un enfoque ampliamente utilizado en las estadísticas. Sin embargo, se sabe que la norma euclidiana es muy sensible a los outliers: para evitar esta dificultad podemos pensar en utilizar otras distancias, por ejemplo la L1{displaystyle L^{1} norma, en sustitución de la L2{displaystyle L^{2} norma.

Enfoque bayesiano

Muy similar al enfoque de mínimos cuadrados es el enfoque probabilístico: si conocemos las estadísticas del ruido que contamina los datos, podemos pensar en buscar el modelo más probable m, que es el modelo que coincide con el criterio de máxima verosimilitud.. Si el ruido es gaussiano, el criterio de máxima verosimilitud aparece como un criterio de mínimos cuadrados, siendo reemplazado el producto escalar euclidiano en el espacio de datos por un producto escalar que implica la covarianza del ruido. Además, si se dispusiera de información previa sobre los parámetros del modelo, podríamos pensar en utilizar la inferencia bayesiana para formular la solución del problema inverso. Este enfoque se describe en detalle en el libro de Tarantola.

Solución numérica de nuestro ejemplo elemental

Aquí hacemos uso de la norma Euclideana para cuantificar los inadaptados de datos. Mientras tratamos con un problema inverso lineal, la función objetiva es cuadrática. Para su minimización, es clásico calcular su gradiente utilizando la misma racionalidad (como vamos a minimizar una función de sólo una variable). En el modelo óptimo popt{displaystyle p_{text{opt}}, este gradiente desaparece que puede ser escrito como:

Silencio Silencio pφ φ =2()FTFpopt− − FTdobs)=0{displaystyle nabla _{p}varphi =2(F^{mathrm - ¿Qué? {T}d_{text{obs}}=0}
FTF
FTFpopt=FTdobs{displaystyle F^{mathrm {T}Fp_{text{opt}=F^{mathrm {T}d_{text{obs}}

Esta expresión se conoce como la ecuación normal y nos da una posible solución al problema inverso. En nuestra matriz de ejemplo FTF{displaystyle F^{mathrm {T}F} resulta ser generalmente de rango completo para que la ecuación anterior tenga sentido y determine singularmente los parámetros modelo: no necesitamos integrar información adicional para terminar con una solución única.

Aspectos matemáticos y computacionales

Los problemas inversos suelen estar mal planteados, a diferencia de los problemas bien planteados que normalmente se encuentran en los modelos matemáticos. De las tres condiciones sugeridas por Jacques Hadamard para un problema bien planteado (existencia, singularidad y estabilidad de la solución o soluciones), la condición de estabilidad es la que más se viola. En el sentido del análisis funcional, el problema inverso se representa mediante un mapeo entre espacios métricos. Si bien los problemas inversos a menudo se formulan en espacios dimensionales infinitos, las limitaciones a un número finito de mediciones y la consideración práctica de recuperar solo un número finito de parámetros desconocidos pueden llevar a que los problemas se reformulen en forma discreta. En este caso, el problema inverso normalmente será mal condicionado. En estos casos, la regularización se puede utilizar para introducir supuestos leves sobre la solución y evitar el sobreajuste. Muchos casos de problemas inversos regularizados pueden interpretarse como casos especiales de inferencia bayesiana.

Solución numérica del problema de optimización

Algunos problemas inversos tienen una solución muy simple, por ejemplo, cuando uno tiene un conjunto de funciones unisolvent, que significa un conjunto de n{displaystyle n} funciones tales que las evalúan n{displaystyle n} distintos puntos producen un conjunto de vectores linealmente independientes. Esto significa que dada una combinación lineal de estas funciones, los coeficientes se pueden computar mediante la organización de los vectores como columnas de una matriz y luego la inversión de esta matriz. El ejemplo más simple de las funciones unisolvent es polinomios construidos, utilizando el teorema de unisolvence, para ser unisolvent. Concretamente, esto se hace invirtiendo la matriz de Vandermonde. Pero esto es una situación muy específica.

En general, la solución de un problema inverso requiere sofisticados algoritmos de optimización. Cuando el modelo es descrito por un gran número de parámetros (el número de desconocidos involucrados en algunas aplicaciones de tomografía de difracción puede alcanzar mil millones), resolver el sistema lineal asociado con las ecuaciones normales puede ser engorroso. El método numérico que se utiliza para resolver el problema de optimización depende en particular del costo necesario para calcular la solución Fp{displaystyle Fp. del problema del futuro. Una vez elegido el algoritmo apropiado para resolver el problema de avance (una multiplicación simple de la matriz-vector puede no ser adecuado cuando la matriz F{displaystyle F} es enorme), el algoritmo apropiado para realizar la minimización se puede encontrar en libros de texto que tratan con métodos numéricos para la solución de sistemas lineales y para la minimización de funciones cuadráticas (véase por ejemplo Ciarlet o Nocedal).

Además, es posible que el usuario desee agregar restricciones físicas a los modelos: en este caso, debe estar familiarizado con los métodos de optimización restringidos, un tema en sí mismo. En todos los casos, calcular el gradiente de la función objetivo suele ser un elemento clave para la solución del problema de optimización. Como se mencionó anteriormente, la información sobre la distribución espacial de un parámetro distribuido se puede introducir a través de la parametrización. También se puede pensar en adaptar esta parametrización durante la optimización.

Si la función objetiva se basa en una norma que no sea la norma euclidiana, tenemos que dejar el área de optimización cuadrática. Como resultado, el problema de optimización se hace más difícil. En particular, cuando el L1{displaystyle L^{1} la norma se utiliza para cuantificar los datos mal adaptados la función objetiva ya no es diferenciable: su gradiente ya no tiene sentido. Los métodos dedicados (véase por ejemplo Lemaréchal) de optimización no diferenciable entran.

Una vez que se computa el modelo óptimo tenemos que abordar la pregunta: "¿Podemos confiar en este modelo?" La cuestión puede formularse de la siguiente manera: ¿Cuán grande es el conjunto de modelos que coinciden con los datos "casi también" como este modelo? En el caso de funciones objetivas cuadráticas, este conjunto está contenido en un hiper-ellipsoide, un subconjunto de RM{displaystyle R^{M} ()M{displaystyle M} es el número de desconocidos), cuyo tamaño depende de lo que queremos decir con "cercamente también", que está en el nivel de ruido. La dirección del eje más grande de este ellipsoide (eigenvector asociado con el menor valor de la matriz FTF{displaystyle F^{T}F}) es la dirección de componentes mal determinados: si seguimos esta dirección, podemos traer una fuerte perturbación al modelo sin cambiar significativamente el valor de la función objetiva y así terminar con un modelo cuasi-optimal significativamente diferente. Vemos claramente que la respuesta a la pregunta "podemos confiar en este modelo" se rige por el nivel de ruido y por los eigenvalues del Hesiano de la función objetiva o equivalentemente, en el caso en que no se haya integrado la regularización, por los valores singulares de la matriz F{displaystyle F}. Por supuesto, el uso de regularización (o de otro tipo de información anterior) reduce el tamaño del conjunto de soluciones casi óptimas y, a su vez, aumenta la confianza que podemos poner en la solución computada.

Estabilidad, regularización y discretización de modelos en dimensión infinita

Nos centramos aquí en la recuperación de un parámetro distribuido. Cuando buscamos parámetros distribuidos tenemos que discretizar estas funciones desconocidas. Al hacerlo, reducimos la dimensión del problema a algo finito. Pero ahora, la pregunta es: ¿existe algún vínculo entre la solución que calculamos y la del problema inicial? Luego otra pregunta: ¿a qué nos referimos con la solución del problema inicial? Dado que un número finito de datos no permite la determinación de una infinidad de incógnitas, el funcional de desajuste de datos original debe regularizarse para garantizar la unicidad de la solución. Muchas veces, reducir las incógnitas a un espacio de dimensión finita proporcionará una regularización adecuada: la solución calculada se verá como una versión discreta de la solución que buscábamos. Por ejemplo, una discretización ingenua a menudo funcionará para resolver el problema de desconvolución: funcionará siempre que no permitamos que las frecuencias faltantes aparezcan en la solución numérica. Pero muchas veces, la regularización tiene que estar integrada explícitamente en la función objetivo.

Para entender lo que puede suceder, debemos tener en cuenta que resolver un problema lineal inverso de este tipo equivale a resolver una ecuación integral de Fredholm del primer tipo:

d()x)=∫ ∫ Ω Ω K()x,Sí.)p()Sí.)dSí.{displaystyle d(x)=int _{Omega }K(x,y)p(y)dy}

Donde K{displaystyle K} es el núcleo, x{displaystyle x} y Sí.{displaystyle y} son vectores de R2{displaystyle R^{2}, y Ω Ω {displaystyle Omega } es un dominio en R2{displaystyle R^{2}. Esto tiene para una aplicación 2D. Para una aplicación 3D, consideramos x,Sí.▪ ▪ R3{displaystyle x,yin R^{3}. Tenga en cuenta que aquí los parámetros del modelo p{displaystyle p} consiste en una función y que la respuesta de un modelo también consiste en una función denotada d()x){displaystyle d(x)}. Esta ecuación es una extensión a la dimensión infinita de la ecuación matriz d=Fp{displaystyle d=Fp} dado en el caso de problemas discretos.

Para lo suficientemente suave K{displaystyle K} el operador definido anteriormente es compacto en espacios razonables de Banach, como el L2{displaystyle L^{2}. F. La teoría de Riesz establece que el conjunto de valores singulares de tal operador contiene cero (de ahí la existencia de un espacio nulo), es finito o lo más contable, y, en este último caso, constituyen una secuencia que va a cero. En el caso de un núcleo simétrico, tenemos una infinidad de eigenvalues y los eigenvectores asociados constituyen una base hilbertiana de L2{displaystyle L^{2}. Así, cualquier solución de esta ecuación se determina hasta una función aditiva en el espacio nulo y, en el caso de la infinidad de valores singulares, la solución (que implica la reciproca de pequeños eigenvalues arbitrarios) es inestable: dos ingredientes que hacen de la solución de esta ecuación integral un problema típico malpuesto! Sin embargo, podemos definir una solución a través del pseudo-inverso del mapa adelante (de nuevo a una función aditiva arbitraria). Cuando el mapa de avance es compacto, la regularización clásica de Tikhonov funcionará si lo utilizamos para integrar información previa indicando que L2{displaystyle L^{2} la norma de la solución debe ser lo más pequeña posible: esto hará que el problema inverso sea bien planteado. Sin embargo, como en el caso de dimensión finita, tenemos que cuestionar la confianza que podemos poner en la solución computada. De nuevo, básicamente, la información reside en los valores eigenvalues del operador hesiano. Si se exploran subespacios que contienen eigenvectores asociados con pequeños eigenvalues para calcular la solución, entonces la solución difícilmente se puede confiar: algunos de sus componentes serán mal determinados. El valor más pequeño es igual al peso introducido en la regularización de Tikhonov.

Los núcleos irregulares pueden producir un mapa adelante que no es compacto e incluso sin límites si equipamos ingenuamente el espacio de los modelos con el L2{displaystyle L^{2} norma. En tales casos, el Hessian no es un operador vinculado y la noción de eigenvalue ya no tiene sentido. Se requiere un análisis matemático para convertirlo en un operador vinculado y diseñar un problema bien planteado: una ilustración se puede encontrar en. De nuevo, tenemos que cuestionar la confianza que podemos poner en la solución computada y tenemos que generalizar la noción de eigenvalue para obtener la respuesta.

El análisis del espectro del operador hessiano es, por tanto, un elemento clave para determinar la fiabilidad de la solución calculada. Sin embargo, dicho análisis suele ser una tarea muy pesada. Esto ha llevado a varios autores a investigar enfoques alternativos en el caso de que no estemos interesados en todos los componentes de la función desconocida sino solo en sub-desconocidos que son las imágenes de la función desconocida por un operador lineal. Estos enfoques se denominan " El método de Backus y Gilbert, el enfoque de los centinelas de Lions y el método SOLA: estos enfoques resultaron estar fuertemente relacionados entre sí, como se explica en Chavent. Finalmente, el concepto de resolución limitada, a menudo invocado por los físicos, es nada más que una visión específica del hecho de que algunos componentes mal determinados pueden corromper la solución. Pero, en términos generales, estos componentes del modelo mal determinados no están necesariamente asociados con frecuencias altas.

Algunos problemas lineales inversos clásicos para la recuperación de parámetros distribuidos

Los problemas mencionados a continuación corresponden a diferentes versiones de la integral Fredholm: cada uno de ellos está asociado con un núcleo específico K{displaystyle K}.

Desconvolución

El objetivo de la deconvolución es reconstruir la imagen original o la señal p()x){displaystyle p(x)} que aparece como ruidoso y borroso en los datos d()x){displaystyle d(x)}. Desde un punto de vista matemático, el núcleo K()x,Sí.){displaystyle K(x,y)} aquí sólo depende de la diferencia entre x{displaystyle x} y Sí.{displaystyle y}.

Métodos tomográficos

En estos métodos intentamos recuperar un parámetro distribuido, la observación consistente en la medición de las integrales de este parámetro realizada a lo largo de una familia de líneas. Denotamos .. x{displaystyle "Gamma" la línea en esta familia asociada al punto de medición x{displaystyle x}. La observación en x{displaystyle x} puede ser escrito como:

d()x)=∫ ∫ .. xw()x,Sí.)p()Sí.)dSí.{displaystyle d(x)=int _{Gamma _{x}w(x,y)p(y),dy}
s{displaystyle s}.. x{displaystyle {fnMicrosoft Sans Serif}w()x,Sí.){displaystyle w(x,y)}K()x,Sí.){displaystyle K(x,y)}.. x{displaystyle {fnMicrosoft Sans Serif}

Tomografía computarizada

En la tomografía computarizada de rayos X, las líneas en las que se integra el parámetro son líneas rectas: la reconstrucción tomográfica de la distribución del parámetro se basa en la inversión de la transformada de Radon. Aunque desde un punto de vista teórico se entienden bien muchos problemas lineales inversos, los problemas relacionados con la transformada de Radon y sus generalizaciones aún presentan muchos desafíos teóricos con preguntas sobre la suficiencia de los datos aún sin resolver. Dichos problemas incluyen datos incompletos para la transformada de rayos X en tres dimensiones y problemas que involucran la generalización de la transformada de rayos X a campos tensoriales. Las soluciones exploradas incluyen la técnica de reconstrucción algebraica, la retroproyección filtrada y, a medida que aumenta la potencia informática, los métodos de reconstrucción iterativos, como la varianza mínima asintótica dispersa iterativa.

Tomografía de difracción

La tomografía de difracción es un problema lineal inverso clásico en la sismología de exploración: la amplitud registrada en un momento dado para un par fuente-receptor determinado es la suma de las contribuciones que surgen de puntos tales que la suma de las distancias, medidas en tiempos de viaje, desde el fuente y el receptor, respectivamente, es igual al tiempo de grabación correspondiente. En 3D el parámetro no se integra a lo largo de líneas sino sobre superficies. Si la velocidad de propagación es constante, dichos puntos se distribuyen en un elipsoide. El problema inverso consiste en recuperar la distribución de puntos de difracción a partir de los sismogramas registrados a lo largo del levantamiento, siendo conocida la distribución de velocidades. Beylkin y Lambaré et al. propusieron originalmente una solución directa: estos trabajos fueron los puntos de partida de enfoques conocidos como migración preservada de amplitud (ver Beylkin y Bleistein). Si se utilizan técnicas de óptica geométrica (es decir, rayos) para resolver la ecuación de onda, estos métodos resultan estar estrechamente relacionados con los llamados métodos de migración de mínimos cuadrados derivados del enfoque de mínimos cuadrados (ver Lailly, Tarantola).

Tomografía Doppler (astrofísica)

Si consideramos un objeto estelar en rotación, las líneas espectrales que podemos observar en un perfil espectral se desplazarán debido al efecto Doppler. La tomografía Doppler tiene como objetivo convertir la información contenida en el seguimiento espectral del objeto en una imagen 2D de la emisión (en función de la velocidad radial y de la fase en el movimiento periódico de rotación) de la atmósfera estelar. Como explica Tom Marsh, este problema lineal inverso es como la tomografía: tenemos que recuperar un parámetro distribuido que se ha integrado a lo largo de las líneas para producir sus efectos en las grabaciones.

Conducción de calor inversa

Las primeras publicaciones sobre la conducción inversa del calor surgieron a partir de la determinación del flujo de calor superficial durante el reingreso a la atmósfera desde sensores de temperatura enterrados. Otras aplicaciones donde se necesita el flujo de calor superficial pero los sensores de superficie no son prácticos incluyen: dentro de motores alternativos, dentro de motores de cohetes; y prueba de componentes de reactores nucleares. Se ha desarrollado una variedad de técnicas numéricas para abordar el mal posicionamiento y la sensibilidad al error de medición causado por la amortiguación y el retraso en la señal de temperatura.

Problemas inversos no lineales

Los problemas inversos no lineales constituyen una familia inherentemente más difícil de problemas inversos. Aquí el mapa de adelante F{displaystyle F} es un operador no lineal. La modelación de fenómenos físicos suele depender de la solución de una ecuación diferencial parcial (véase la tabla anterior excepto la ley de gravedad): aunque estas ecuaciones diferenciales parciales son a menudo lineales, los parámetros físicos que aparecen en estas ecuaciones dependen de una manera no lineal del estado del sistema y, por lo tanto, de las observaciones que hacemos al respecto.

Algunos problemas inversos no lineales clásicos

Problemas de dispersión inversa

Mientras que los problemas inversos lineales se resolvieron por completo desde el punto de vista teórico a finales del siglo XIX, solo una clase de problemas inversos no lineales lo era antes de 1970, los problemas de dispersión inversa espectral e inversa (una dimensión espacial), después del trabajo seminal de la escuela matemática rusa (Krein, Gelfand, Levitan, Marchenko). Chadan y Sabatier han realizado una amplia revisión de los resultados en su libro "Problemas inversos de la teoría de la dispersión cuántica" (dos ediciones en inglés, una en ruso).

En este tipo de problema, los datos son propiedades del espectro de un operador lineal que describen la dispersión. El espectro está formado por valores propios y funciones propias, formando juntos el "espectro discreto" y generalizaciones, llamado espectro continuo. El punto físico muy notable es que los experimentos de dispersión dan información solo sobre el espectro continuo, y que conocer su espectro completo es necesario y suficiente para recuperar el operador de dispersión. Por lo tanto tenemos parámetros invisibles, mucho más interesantes que el espacio nulo que tiene una propiedad similar en problemas lineales inversos. Además, hay movimientos físicos en los que el espectro de dicho operador se conserva como consecuencia de dicho movimiento. Este fenómeno se rige por ecuaciones de evolución diferenciales parciales no lineales especiales, por ejemplo, la ecuación de Korteweg-de Vries. Si el espectro del operador se reduce a un solo valor propio, su movimiento correspondiente es el de un solo golpe que se propaga a velocidad constante y sin deformación, una onda solitaria llamada 'solitón'.

Una señal perfecta y sus generalizaciones para la ecuación de Korteweg-de Vries u otras ecuaciones diferenciales parciales no lineales integrables son de gran interés, con muchas aplicaciones posibles. Esta área se ha estudiado como una rama de la física matemática desde la década de 1970. Los problemas inversos no lineales también se estudian actualmente en muchos campos de la ciencia aplicada (acústica, mecánica, mecánica cuántica, dispersión electromagnética, en particular sondeos de radar, sondeos sísmicos y casi todas las modalidades de imágenes).

Wu y Sprung dieron un último ejemplo relacionado con la hipótesis de Riemann, la idea es que en la antigua teoría cuántica semiclásica, el inverso del potencial dentro del hamiltoniano es proporcional a la semiderivada de los valores propios (energías) contando función n(x).

Equilibrio de permeabilidad en yacimientos de petróleo y gas

El objetivo es recuperar el coeficiente de difusión en la ecuación diferencial parcial parabólica que modela flujos de fluidos monofásicos en medios porosos. Este problema ha sido objeto de numerosos estudios desde un trabajo pionero realizado a principios de los años setenta. Con respecto a los flujos de dos fases, un problema importante es estimar las permeabilidades relativas y las presiones capilares.

Problemas inversos en las ecuaciones de onda

El objetivo es recuperar las velocidades de onda (ondas P y S) y las distribuciones de densidad de los sismogramas. Tales problemas inversos son de gran interés en sismología y geofísica de exploración. Podemos considerar básicamente dos modelos matemáticos:

  • La ecuación de onda acústica (en la que se ignoran las ondas S cuando las dimensiones del espacio son 2 o 3)
  • La ecuación elastodinámica en la que las velocidades de onda P y S pueden derivarse de los parámetros de Lamé y de la densidad.

Estas ecuaciones hiperbólicas básicas se pueden mejorar incorporando atenuación, anisotropía,...

La solución del problema inverso en la ecuación de onda 1D ha sido objeto de numerosos estudios. Es uno de los pocos problemas inversos no lineales para los que podemos probar la unicidad de la solución. El análisis de la estabilidad de la solución fue otro desafío. Se desarrollaron aplicaciones prácticas utilizando el método de mínimos cuadrados. La extensión a problemas 2D o 3D y a las ecuaciones de elastodinámica se intentó desde los años 80, ¡pero resultó ser muy difícil! Este problema, a menudo denominado inversión de forma de onda completa (FWI), aún no está completamente resuelto: entre las principales dificultades se encuentran la existencia de ruido no gaussiano en los sismogramas, problemas de salto de ciclo (también conocido como ambigüedad de fase) y la caótica Comportamiento de la función de inadaptación de datos. Algunos autores han investigado la posibilidad de reformular el problema inverso para que la función objetivo sea menos caótica que la función de desajuste de datos.

Tomografía de tiempo de viaje

Al darse cuenta de lo difícil que es el problema inverso en la ecuación de onda, los sismólogos investigaron un enfoque simplificado haciendo uso de la óptica geométrica. En particular, se propusieron invertir la distribución de la velocidad de propagación, conociendo los tiempos de llegada de los frentes de onda observados en los sismogramas. Estos frentes de onda pueden estar asociados a llegadas directas oa reflexiones asociadas a reflectores cuya geometría se desea determinar, junto con la distribución de velocidades.

Distribución del tiempo de llegada τ τ ()x){displaystyle {tau }(x)} ()x{displaystyle x} es un punto en el espacio físico) de un frente de onda emitido desde una fuente de punto, satisface la ecuación Eikonal:

.. Silencio Silencio τ τ ()x).. =s()x),{displaystyle muertenabla tau (x) eterna=s(x),}
s()x){displaystyle s(x)}.. ⋅ ⋅ .. {displaystylefncdotfn}

Este problema es similar a la tomografía: los tiempos de llegada medidos son la integral a lo largo de la trayectoria del rayo de la lentitud. Pero este problema similar a la tomografía no es lineal, principalmente porque la geometría desconocida de la trayectoria del rayo depende de la distribución de la velocidad (o lentitud). A pesar de su carácter no lineal, la tomografía de tiempo de viaje resultó ser muy eficaz para determinar la velocidad de propagación en la Tierra o en el subsuelo, siendo este último aspecto un elemento clave para la obtención de imágenes sísmicas, en particular utilizando los métodos mencionados en la Sección &# 34;Tomografía de difracción".

Aspectos matemáticos: las preguntas de Hadamard

The questions concern well-posedness: ¿Tiene el problema menos cuadrado una solución única que depende continuamente de los datos (problema de estabilidad)? Es la primera pregunta, pero también es difícil debido a la no linearidad de F{displaystyle F}. Para ver de dónde surgen las dificultades, Chavent propuso dividir conceptualmente la minimización de la función de inadaptación de datos en dos pasos consecutivos (Padm{displaystyle P_{text{adm}} es el subconjunto de modelos admisibles:

  • paso de proyección: dado dobs{displaystyle d_{text{obs}} encontrar una proyección en F()Padm){displaystyle F(P_{text{adm}) } (punto de paro F()Padm){displaystyle F(P_{text{adm}) } según la distancia implicada en la definición de la función objetiva)
  • dada esta proyección encontrar un pre-imagen que es un modelo cuya imagen por operador F{displaystyle F} es esta proyección.

Pueden surgir dificultades, y generalmente surgirán, en ambos pasos:

  1. operador F{displaystyle F} no es probable que sea uno a uno, por lo tanto puede haber más de un pre-image,
  2. incluso cuando F{displaystyle F} es uno a uno, su inverso puede no ser continuo F()P){displaystyle F(P)},
  3. la proyección en F()Padm){displaystyle F(P_{text{adm}) } puede no existir, si este conjunto no está cerrado,
  4. la proyección en F()Padm){displaystyle F(P_{text{adm}) } puede ser no-unique y no continuo ya que esto puede ser no-convex debido a la no-linearidad de F{displaystyle F}.

Nos referimos a Chavent para un análisis matemático de estos puntos.

Aspectos computacionales

Una función de inadaptación de datos no convexa

Como el mapa directo no es lineal, es probable que la función de inadaptación de datos no sea convexa, lo que hace que las técnicas de minimización local sean ineficientes. Se han investigado varios enfoques para superar esta dificultad:

  • uso de técnicas de optimización global tales como muestreo de la función de densidad posterior y algoritmo de metrópolis en el marco probabilístico problema inverso, algoritmos genéticos (solo o en combinación con algoritmo de metrópolis: ver para una aplicación a la determinación de las permeabilidades que coinciden con los datos de permeabilidad existentes), redes neuronales, técnicas de regularización incluyendo análisis de escala múltiple;
  • reformulación de la función objetiva menos cuadrada para que sea más suave (ver el problema inverso en las ecuaciones de onda).

Cálculo del gradiente de la función objetivo

Los problemas inversos, especialmente en dimensión infinita, pueden ser de gran tamaño, por lo que requieren un tiempo de cálculo importante. Cuando el mapa directo es no lineal, las dificultades computacionales aumentan y puede ser difícil minimizar la función objetivo. Contrariamente a la situación lineal, aquí no tiene sentido un uso explícito de la matriz hessiana para resolver las ecuaciones normales: la matriz hessiana varía con los modelos. Mucho más efectiva es la evaluación del gradiente de la función objetivo para algunos modelos. Se puede ahorrar un esfuerzo computacional importante cuando podemos evitar el cómputo muy pesado del jacobiano (a menudo llamado "derivados de Fréchet"): el método de estado adjunto, propuesto por Chavent y Lions, tiene como objetivo evitar este cómputo tan pesado. Ahora es muy utilizado.

Aplicaciones

La teoría del problema inverso se utiliza ampliamente en las predicciones meteorológicas, la oceanografía, la hidrología y la ingeniería petrolera.

Los problemas inversos también se encuentran en el campo de la transferencia de calor, donde se estima un flujo de calor superficial a partir de los datos de temperatura medidos dentro de un cuerpo rígido; y, en la comprensión de los controles sobre la descomposición de la materia vegetal. El problema lineal inverso también es fundamental en la estimación espectral y la estimación de la dirección de llegada (DOA) en el procesamiento de señales.

La litografía inversa se utiliza en el diseño de fotomáscaras para la fabricación de dispositivos semiconductores.

Referencias

  • Chadan, Khosrow & Sabatier, Pierre Célestin (1977). Problemas inversos en la trampa cuántica Teoría. Springer-Verlag. ISBN 0-387-08092-9
  • Aster, Richard; Borchers, Brian y Thurber, Clifford (2018). Estimación del parámetro y problemas inversos, Tercera Edición, Elsevier. ISBN 9780128134238, ISBN 9780128134238
  • Press, WH; Teukolsky, SA; Vetterling, WT; Flannery, BP (2007). "Sección 19.4. Problemas inversos y el uso de una información prioritaria". Recetas numéricas: El arte de la computación científica (3a edición). Nueva York: Cambridge University Press. ISBN 978-0-521-88068-8.

Contenido relacionado

Emilio Julio Gumbel

Emil Julius Gumbel fue un matemático y escritor político...

Academia Nacional de Ciencias

La Academia Nacional de Ciencias es una organización no gubernamental sin fines de lucro de los Estados Unidos. NAS es parte de las Academias Nacionales de...

Entero

An entero es el número cero un número natural positivo o un entero negativo con un signo menos (1, −2, −3, etc.). Los números negativos son los...
Más resultados...
Tamaño del texto:
undoredo
format_boldformat_italicformat_underlinedstrikethrough_ssuperscriptsubscriptlink
save