Geoestadística
Geoestadística es una rama de las estadísticas que se centra en conjuntos de datos espaciales o espaciotemporales. Desarrollado originalmente para predecir distribuciones de probabilidad de leyes de minerales para operaciones mineras, actualmente se aplica en diversas disciplinas que incluyen geología del petróleo, hidrogeología, hidrología, meteorología, oceanografía, geoquímica, geometalurgia, geografía, silvicultura, control ambiental, ecología del paisaje, ciencia del suelo y agricultura (especialmente en agricultura de precisión). La geoestadística se aplica en diversas ramas de la geografía, en particular las que involucran la propagación de enfermedades (epidemiología), la práctica del comercio y la planificación militar (logística) y el desarrollo de redes espaciales eficientes. Los algoritmos geoestadísticos se incorporan en muchos lugares, incluidos los sistemas de información geográfica (SIG).
Antecedentes
La geoestadística está íntimamente relacionada con los métodos de interpolación, pero se extiende mucho más allá de los simples problemas de interpolación. Las técnicas geoestadísticas se basan en modelos estadísticos que se basan en la teoría de funciones aleatorias (o variables aleatorias) para modelar la incertidumbre asociada con la estimación y simulación espacial.
Una serie de métodos/algoritmos de interpolación más simples, como la ponderación de la distancia inversa, la interpolación bilineal y la interpolación del vecino más cercano, ya eran bien conocidos antes de la geoestadística. La geoestadística va más allá del problema de la interpolación al considerar el fenómeno estudiado en lugares desconocidos como un conjunto de variables aleatorias correlacionadas.
Sea Z(x) el valor de la variable de interés en una determinada ubicación x. Este valor es desconocido (por ejemplo, temperatura, lluvia, nivel piezométrico, facies geológicas, etc.). Aunque existe un valor en la ubicación x que podría medirse, la geoestadística considera que este valor es aleatorio ya que no se midió o aún no se ha medido.. Sin embargo, la aleatoriedad de Z(x) no es completa, sino definida por una función de distribución acumulativa (CDF) que depende de cierta información que se conoce sobre el valor Z(x):
- F()z,x)=Prob {}Z()x)⩽ ⩽ z▪ ▪ información}.{displaystyle F({mathit {z},mathbf {x}=operatorname {Prob} lbrace Z(mathbf {x})leqslant {mathit {z}mid {text{information}rbrace.}
Normalmente, si el valor de Z se conoce en ubicaciones cercanas a x (o en la vecindad de x) se puede restringir la CDF de Z (x) por este vecindario: si se asume una alta continuidad espacial, Z( x) solo puede tener valores similares a los que se encuentran en el vecindario. Por el contrario, en ausencia de continuidad espacial Z(x) puede tomar cualquier valor. La continuidad espacial de las variables aleatorias se describe mediante un modelo de continuidad espacial que puede ser una función paramétrica en el caso de las geoestadísticas basadas en variogramas, o tener una forma no paramétrica cuando se utilizan otros métodos como la simulación de puntos múltiples o pseudo -Técnicas genéticas.
Al aplicar un único modelo espacial en un dominio completo, se asume que Z es un proceso estacionario. Significa que las mismas propiedades estadísticas son aplicables en todo el dominio. Varios métodos geoestadísticos proporcionan formas de relajar este supuesto de estacionariedad.
En este marco, se pueden distinguir dos objetivos de modelado:
- Estimación del valor Z()x), típicamente por la expectativa, la mediana o el modo del CDF f()z,x). Esto generalmente se denota como un problema de estimación.
- Muestra de toda la función de densidad de probabilidad f()z,x) considerando cada posible resultado en cada ubicación. Esto se hace generalmente creando varios mapas alternativos de Z, llamadas realizaciones. Considerar un dominio discretizado en N nodos de rejilla (o píxeles). Cada realización es una muestra de lo completo N- función de distribución conjunta dimensionada
- F()z,x)=Prob {}Z()x1)⩽ ⩽ z1,Z()x2)⩽ ⩽ z2,...,Z()xN)⩽ ⩽ zN}.{displaystyle F(mathbf {z}mathbf {x}=operatorname {Prob} lbrace Z(mathbf {x} _{1})leqslant z_{1},Z(mathbf {x} _{2})leqslant z_{2},Z(mathbf {x} _{N})leqslant ¿Qué?
- En este enfoque se reconoce la presencia de múltiples soluciones al problema de la interpolación. Cada realización se considera un escenario posible de lo que podría ser la variable real. Todos los flujos de trabajo asociados están considerando entonces conjunto de realizaciones, y en consecuencia conjunto de predicciones que permiten la previsión probabilística. Por lo tanto, la geoestadística se utiliza a menudo para generar o actualizar modelos espaciales al resolver problemas inversos.
Existe una serie de métodos tanto para la estimación geoestadística como para los enfoques de realización múltiple. Varios libros de referencia proporcionan una visión general completa de la disciplina.
Métodos
Estimación
Kriging
Kriging es un grupo de técnicas de estadísticas geográficas para interpolar el valor de un campo aleatorio (por ejemplo, la elevación, z, del paisaje en función de la ubicación geográfica) en una ubicación no observada a partir de observaciones de su valor en ubicaciones cercanas.
Estimación bayesiana
La inferencia bayesiana es un método de inferencia estadística en el que Bayes' El teorema se utiliza para actualizar un modelo de probabilidad a medida que se dispone de más pruebas o información. La inferencia bayesiana está jugando un papel cada vez más importante en Geoestadística. La estimación bayesiana implementa el kriging a través de un proceso espacial, más comúnmente un proceso gaussiano, y actualiza el proceso mediante el uso de Bayes' Teorema para calcular su posterior. Geoestadística bayesiana de alta dimensión
Método de diferencias finitas
Teniendo en cuenta el principio de conservación de la probabilidad, se utilizaron ecuaciones en diferencias recurrentes (ecuaciones en diferencias finitas) junto con redes para calcular las probabilidades que cuantifican la incertidumbre sobre las estructuras geológicas. Este procedimiento es un método numérico alternativo a las cadenas de Markov y los modelos bayesianos.
Simulación
- Aggregation
- Desagregación
- Bandas giratorias
- Descomposición de Cholesky
- Gaussiano truncado
- Plurigaussian
- Annealing
- simulación espectral
- Indicador secuencial
- Gaussio secuencial
- Dead Leave
- Transition probabilities
- Geoestadística de la cadena Markov
- Markov mesh modelos
- Soporte de máquina vectorial
- Simulación booleana
- Modelos genéticos
- Modelos Pseudo-genéticos
- Automata celular
- Geoestadística de múltiples puntos
Definiciones y herramientas
- Teoría variable regionalizada
- Función de covariancia
- Semi-variance
- Variogram
- Kriging
- Rango (geoestadística)
- Sill (geoestadística)
- Efecto nugget
- Imagen de entrenamiento
- Método de diferencia finita
Revistas académicas relacionadas
- Water Resources Research
- Avances en recursos hídricos
- Water Archived 2011-06-07 en la máquina Wayback
- Geociencias matemáticas
- Computadoras " Geociencias "
- Geociencias computacionales
- J. Soil Science Society of America Archived 2015-03-19 at the Wayback Machine
- Environmetrics
- Teleobservación del Medio Ambiente
- Stochastic Environmental Research and Risk Assessment
Organizaciones científicas relacionadas con la geoestadística
- European Forum for Geography and Statistics (EFGS; formerly the European Forum for Geostatistics)
- GeoEnvia promueve el uso de métodos geoestadísticos en aplicaciones ambientales
- International Association for Mathematical Geosciences
Contenido relacionado
Nudo Sellado
Williamsport
Condado de Blount