Cópula (probabilidades)

Ajustar Compartir Imprimir Citar

En teoría de probabilidad y estadística, una cópula es una función de distribución acumulativa multivariante para la cual la distribución de probabilidad marginal de cada variable es uniforme en el intervalo [0, 1]. Las cópulas se utilizan para describir/modelar la dependencia (intercorrelación) entre variables aleatorias. Su nombre, introducido por el matemático aplicado Abe Sklar en 1959, proviene del latín para "enlace" o "lazo", similar pero no relacionado con las cópulas gramaticales en lingüística. Las cópulas se han utilizado ampliamente en finanzas cuantitativas para modelar y minimizar el riesgo de cola y aplicaciones de optimización de cartera.

El teorema de Sklar establece que cualquier distribución conjunta multivariante se puede escribir en términos de funciones de distribución marginal univariante y una cópula que describe la estructura de dependencia entre las variables.

Las cópulas son populares en aplicaciones estadísticas de alta dimensión, ya que permiten modelar y estimar fácilmente la distribución de vectores aleatorios al estimar marginales y cópulas por separado. Hay muchas familias de cópulas paramétricas disponibles, que normalmente tienen parámetros que controlan la fuerza de la dependencia. A continuación se describen algunos modelos de cópula paramétrica populares.

Las cópulas bidimensionales se conocen en otras áreas de las matemáticas con el nombre de permutones y medidas doblemente estocásticas.

Definición matemática

Considere un vector aleatorio (X_{1},X_{2},puntos,X_{d}). Supongamos que sus marginales son continuas, es decir, las CDF marginales {displaystyle F_{i}(x)=Pr[X_{i}leq x]}son funciones continuas. Al aplicar la transformada integral de probabilidad a cada componente, el vector aleatorio(U_{1},U_{2},puntos,U_{d})=izquierda(F_{1}(X_{1}),F_{2}(X_{2}),puntos,F_{ d}(X_{d})derecha)

tiene marginales que se distribuyen uniformemente en el intervalo [0, 1].

La cópula de (X_{1},X_{2},puntos,X_{d})se define como la función de distribución acumulada conjunta de (U_{1},U_{2},puntos,U_{d}):{displaystyle C(u_{1},u_{2},dots,u_{d})=Pr[U_{1}leq u_{1},U_{2}leq u_{2}, puntos,U_{d}leq u_{d}].}

La cópula C contiene toda la información sobre la estructura de dependencia entre los componentes de (X_{1},X_{2},puntos,X_{d})mientras que las funciones de distribución acumulativa marginal F_{yo}contienen toda la información sobre las distribuciones marginales de X_{yo}.

El reverso de estos pasos se puede utilizar para generar muestras pseudoaleatorias a partir de clases generales de distribuciones de probabilidad multivariadas. Es decir, dado un procedimiento para generar una muestra (U_{1},U_{2},puntos,U_{d})a partir de la función de cópula, la muestra requerida se puede construir como(X_{1},X_{2},puntos,X_{d})=left(F_{1}^{-1}(U_{1}),F_{2}^{-1}(U_ {2}),puntos,F_{d}^{-1}(U_{d})derecha).

Los inversos F_{i}^{-1}no son problemáticos casi con seguridad, ya F_{yo}que se supuso que eran continuos. Además, la fórmula anterior para la función de cópula se puede reescribir como:{displaystyle C(u_{1},u_{2},dots,u_{d})=Pr[X_{1}leq F_{1}^{-1}(u_{1}),X_ {2}leq F_{2}^{-1}(u_{2}),dots,X_{d}leq F_{d}^{-1}(u_{d})].}

Definición

En términos probabilísticos, C:[0,1]^{d}flecha derecha [0,1]es una cópula d -dimensional si C es una función de distribución acumulada conjunta de un vector aleatorio d -dimensional en el cubo unitario con marginales uniformes.[0,1]^{d}

En términos analíticos, C:[0,1]^{d}flecha derecha [0,1]es una cópula d -dimensional si

donde el N(mathbf{z})=#{k:z_{k}=x_{k}}.

Por ejemplo, en el caso bivariado, {displaystyle C:[0,1]times [0,1]rightarrow [0,1]}es una cópula bivariada si C(0,u)=C(u,0)=0, C(1,u)=C(u,1)=uy C(u_{2},v_{2})-C(u_{2},v_{1})-C(u_{1},v_{2})+C(u_{1},v_{1})geq 0para todos 0leq u_{1}leq u_{2}leq 1y 0leq v_{1}leq v_{2}leq 1.

Teorema de sklar

El teorema de Sklar, llamado así por Abe Sklar, proporciona la base teórica para la aplicación de cópulas. El teorema de Sklar establece que toda función de distribución acumulativa multivariante{displaystyle H(x_{1},puntos,x_{d})=Pr[X_{1}leq x_{1},puntos,X_{d}leq x_{d}]}

de un vector aleatorio (X_{1},X_{2},puntos,X_{d})se puede expresar en términos de sus marginales {displaystyle F_{i}(x_{i})=Pr[X_{i}leq x_{i}]}y una cópula C. En efecto:{displaystyle H(x_{1},dots,x_{d})=Cleft(F_{1}(x_{1}),dots,F_{d}(x_{d})right).}

En caso de que la distribución multivariante tenga una densidad h, y si esta está disponible, se cumple además que{displaystyle h(x_{1},puntos,x_{d})=c(F_{1}(x_{1}),puntos,F_{d}(x_{d}))cdot f_{ 1}(x_{1})cdot dots cdot f_{d}(x_{d}),}

donde Ces la densidad de la cópula.

El teorema también establece que, dada H, la cópula es única en operatorname {Ran} (F_{1})times cdots times operatorname {Ran} (F_{d}), que es el producto cartesiano de los rangos de las CDF marginales. Esto implica que la cópula es única si los marginales F_{yo}son continuos.

Lo contrario también es cierto: dada una cópula C:[0,1]^{d}flecha derecha [0,1]y marginales Arreglar), entonces Cizquierda(F_{1}(x_{1}),puntos,F_{d}(x_{d})derecha)define una función de distribución acumulativa dArreglar) -dimensional con distribuciones marginales.

Condición de estacionariedad

Las cópulas funcionan principalmente cuando las series temporales son estacionarias y continuas. Por lo tanto, un paso de preprocesamiento muy importante es verificar la autocorrelación, la tendencia y la estacionalidad dentro de la serie temporal.

Cuando las series de tiempo se autocorrelacionan, pueden generar una dependencia de no existencia entre conjuntos de variables y dar como resultado una estructura de dependencia de Copula incorrecta.

Límites de la cópula de Fréchet-Hoeffding

El teorema de Fréchet-Hoeffding (después de Maurice René Fréchet y Wassily Hoeffding) establece que para cualquier cópula C:[0,1]^{d}flecha derecha [0,1]y cualquiera se cumplen (u_{1},puntos,u_{d})en [0,1]^{d}los siguientes límites:W(u_{1},puntos,u_{d})leq C(u_{1},puntos,u_{d})leq M(u_{1},puntos,u_{d}).

La función W se denomina límite inferior de Fréchet-Hoeffding y se define como{displaystyle W(u_{1},ldots,u_{d})=max left{1-d+sum limits _{i=1}^{d}{u_{i}},,0derecho}.}

La función M se llama límite superior de Fréchet-Hoeffding y se define comoM(u_{1},ldots,u_{d})=min{u_{1},dots,u_{d}}.

El límite superior es nítido: M siempre es una cópula, corresponde a variables aleatorias comonotonas.

El límite inferior es puntiagudo, en el sentido de que para u fija, hay una cópula { tilde {C}}tal que { tilde {C}}(u)=W(u). Sin embargo, W es una cópula solo en dos dimensiones, en cuyo caso corresponde a variables aleatorias contramonótonas.

En dos dimensiones, es decir, el caso bivariado, el teorema de Fréchet-Hoeffding establece{displaystyle max{u+v-1,,0}leq C(u,v)leq min{u,v}}.

Familias de cópulas

Se han descrito varias familias de cópulas.

Cópula gaussiana

La cópula gaussiana es una distribución sobre el hipercubo unitario [0,1]^{d}. Se construye a partir de una distribución normal multivariante mathbb{R} ^{d}utilizando la transformada integral de probabilidad.

Para una matriz de correlación dada {displaystyle Ren [-1,1]^{dveces d}}, la cópula gaussiana con matriz de parámetros Rse puede escribir comoC_{R}^{text{Gauss}}(u)=Phi _{R}left(Phi ^{-1}(u_{1}),dots,Phi ^{-1}(u_{d})derecha),

donde phi ^{-1}es la función de distribución acumulativa inversa de una normal estándar y Phi_{R}es la función de distribución acumulativa conjunta de una distribución normal multivariante con vector medio cero y matriz de covarianza igual a la matriz de correlación R. Si bien no existe una fórmula analítica simple para la función de cópula, {displaystyle C_{R}^{text{Gauss}}(u)}puede tener un límite superior o inferior y aproximarse mediante integración numérica. La densidad se puede escribir como{displaystyle c_{R}^{text{Gauss}}(u)={frac {1}{sqrt {det {R}}}}exp left(-{frac {1}{ 2}}{begin{pmatrix}Phi ^{-1}(u_{1})\vdots \Phi ^{-1}(u_{d})end{pmatrix}}^{T }cdot left(R^{-1}-Iright)cdot {begin{pmatrix}Phi ^{-1}(u_{1})\vdots \Phi ^{-1 }(u_{d})end{pmatrix}}right),}

donde mathbf{yo}es la matriz identidad.

Cópulas de Arquímedes

Las cópulas de Arquímedes son una clase asociativa de cópulas. Las cópulas de Arquímedes más comunes admiten una fórmula explícita, algo que no es posible por ejemplo para la cópula de Gauss. En la práctica, las cópulas de Arquímedes son populares porque permiten modelar la dependencia en dimensiones arbitrariamente altas con un solo parámetro, que rige la fuerza de la dependencia.

Una cópula C se llama arquimediana si admite la representación{displaystyle C(u_{1},dots,u_{d};theta)=psi ^{[-1]}left(psi (u_{1};theta)+cdots + psi (u_{d};theta);theta right)}

donde psi !:[0,1]times Theta rightarrow [0,infty)es una función continua, estrictamente decreciente y convexa tal que psi (1;theta)=0,  thetaes un parámetro dentro de algún espacio de parámetros Theta, y psies la llamada función generadora y psi ^{[-1]}es su pseudo-inversa definida por{displaystyle psi ^{[-1]}(t;theta)=left{{begin{array}{ll}psi ^{-1}(t;theta)&{mbox{ si }}0leq tleq psi (0;theta)\0&{mbox{if }}psi (0;theta)leq tleq infty.end{matriz}} derecho.}

Además, la fórmula anterior para C produce una cópula psi^{-1}si y solo si psi^{-1}es d-monótono en [0,infty). Es decir, si es d-2diferenciable por tiempos y las derivadas satisfacen{displaystyle (-1)^{k}psi ^{-1,(k)}(t;theta)geq 0}

para todo tgeq 0y k=0,1,puntos,d-2y (-1)^{d-2}psi ^{-1,(d-2)}(t;theta)es no creciente y convexo.

Cópulas de Arquímedes más importantes

Las siguientes tablas destacan las cópulas de Arquímedes bivariadas más destacadas, con su correspondiente generador. No todos ellos son completamente monótonos, es decir, d -monótono para todos den mathbb {N}o d -monótono para ciertos theta en thetasolamente.

Nombre de la cópulacópula bivariada;C_{theta}(u,v)parámetro,thetagenerador,psi _{theta}(t)generador inverso,psi _{theta}^{-1}(t)
Ali–Mikhail–Haq {frac{uv}{1-theta(1-u)(1-v)}} { estilo de visualización  theta  en [-1,1]} log !left[{frac {1-theta (1-t)}{t}}right] {frac{1-theta }{exp(t)-theta }}
Clayton left[max left{u^{-theta }+v^{-theta }-1;0right}right]^{-1/theta } theta in [-1,infty)barra invertida {0} {displaystyle {frac {1}{theta}},(t^{-theta}-1)} left(1+theta tright)^{-1/theta}
Franco -{frac {1}{theta}}log !left[1+{frac {(exp(-theta u)-1)(exp(-theta v)-1)} {exp(-theta)-1}}right] theta in mathbb {R} barra invertida {0} {textstyle -log !left({frac {exp(-theta t)-1}{exp(-theta)-1}}right)} -{frac {1}{theta}},log(1+exp(-t)(exp(-theta)-1))
Gumbel {textstyle exp !left[-left((-log(u))^{theta }+(-log(v))^{theta }right)^{1/theta }derecho]} theta in [1,infty) left(-log(t)right)^{theta} exp !left(-t^{1/theta }right)
Independencia { estilo de texto uv} { estilo de visualización -  registro (t)} exp(-t)
José {textstyle {1-left[(1-u)^{theta }+(1-v)^{theta }-(1-u)^{theta }(1-v)^{theta }right]^{1/theta }}} theta in [1,infty) -log !left(1-(1-t)^{theta }right) 1-izquierda(1-exp(-t)derecha)^{1/theta}

Expectativa para los modelos de cópula y la integración de Monte Carlo

En aplicaciones estadísticas, muchos problemas se pueden formular de la siguiente manera. Uno está interesado en la expectativa de una función de respuesta g:mathbb {R} ^{d}rightarrow mathbb {R}aplicada a algún vector aleatorio (X_{1},puntos,X_{d}). Si denotamos la cdf de este vector aleatorio con H, la cantidad de interés se puede escribir como{displaystyle operatorname {E} left[g(X_{1},dots,X_{d})right]=int_{mathbb {R} ^{d}}g(x_{1},puntos,x_{d}),mathrm {d} H(x_{1},puntos,x_{d}).}

Si Hviene dado por un modelo de cópula, es decir,H(x_{1},puntos,x_{d})=C(F_{1}(x_{1}),puntos,F_{d}(x_{d}))

esta expectativa se puede reescribir como{displaystyle operatorname {E} left[g(X_{1},dots,X_{d})right]=int_{[0,1]^{d}}g(F_{1} ^{-1}(u_{1}),puntos,F_{d}^{-1}(u_{d})),mathrm {d} C(u_{1},puntos,u_{ d}).}

En el caso de que la cópula C sea absolutamente continua, es decir, C tenga una densidad c, esta ecuación se puede escribir como{displaystyle operatorname {E} left[g(X_{1},dots,X_{d})right]=int_{[0,1]^{d}}g(F_{1} ^{-1}(u_{1}),puntos,F_{d}^{-1}(u_{d}))cdot c(u_{1},puntos,u_{d}), du_{1}cdots mathrm {d} u_{d},}

y si cada distribución marginal tiene la densidad f_{i}se mantiene además que{displaystyle operatorname {E} left[g(X_{1},dots,X_{d})right]=int_{mathbb {R} ^{d}}g(x_{1},puntos x_{d})cpunto c(F_{1}(x_{1}),puntos,F_{d}(x_{d}))cpunto f_{1}(x_{1}) cdots f_{d}(x_{d}),mathrm {d} x_{1}cdots mathrm {d} x_{d}.}

Si se conocen la cópula y los marginales (o si se han estimado), esta expectativa se puede aproximar mediante el siguiente algoritmo de Monte Carlo:

  1. Extraiga una muestra (U_{1}^{k},puntos,U_{d}^{k})sim C;;(k=1,puntos,n)de tamaño n de la cópula C
  2. Al aplicar las cdf marginales inversas, produzca una muestra de (X_{1},puntos,X_{d})al establecer(X_{1}^{k},puntos,X_{d}^{k})=(F_{1}^{-1}(U_{1}^{k}),puntos,F_{d }^{-1}(U_{d}^{k}))sim H;;(k=1,puntos,n)
  3. Aproximado {displaystyle nombre del operador {E} left[g(X_{1},dots,X_{d})right]}por su valor empírico:

{displaystyle operatorname {E} left[g(X_{1},dots,X_{d})right]approx {frac {1}{n}}sum _{k=1}^ {n}g(X_{1}^{k},puntos,X_{d}^{k})}

Cópulas empíricas

Al estudiar datos multivariados, es posible que desee investigar la cópula subyacente. Supongamos que tenemos observaciones(X_{1}^{i},X_{2}^{i},puntos,X_{d}^{i}),,i=1,puntos,n

de un vector aleatorio (X_{1},X_{2},puntos,X_{d})con marginales continuos. Las correspondientes observaciones de cópula "verdaderas" serían(U_{1}^{i},U_{2}^{i},puntos,U_{d}^{i})=left(F_{1}(X_{1}^{i}), F_{2}(X_{2}^{i}),puntos,F_{d}(X_{d}^{i})derecha),,i=1,puntos,n.

Sin embargo, las funciones de distribución marginal F_{yo}generalmente no se conocen. Por lo tanto, se pueden construir observaciones de pseudocópula utilizando las funciones de distribución empíricasF_{k}^{n}(x)={frac {1}{n}}sum_{i=1}^{n}mathbf {1} (X_{k}^{i}leq X)

en cambio. Entonces, las observaciones de la pseudo cópula se definen como({tilde {U}}_{1}^{i},{tilde {U}}_{2}^{i},dots,{tilde {U}}_{d}^{i })=left(F_{1}^{n}(X_{1}^{i}),F_{2}^{n}(X_{2}^{i}),puntos,F_{d }^{n}(X_{d}^{i})derecha),,i=1,puntos,n.

La cópula empírica correspondiente se define entonces comoC^{n}(u_{1},dots,u_{d})={frac {1}{n}}sum _{i=1}^{n}mathbf {1} left({tilde {U}}_{1}^{i}leq u_{1},dots,{tilde {U}}_{d}^{i}leq u_{d}right).

Los componentes de las muestras de pseudocópula también se pueden escribir como { tilde {U}}_{k}^{i}=R_{k}^{i}/n, donde R_{k}^{i}es el rango de la observación X_{k}^{i}:R_{k}^{i}=sum_{j=1}^{n}mathbf {1} (X_{k}^{j}leq X_{k}^{i})

Por lo tanto, la cópula empírica puede verse como la distribución empírica de los datos transformados por rango.

La versión de muestra de la rho de Spearman:{displaystyle r={frac {12}{n^{2}-1}}sum_{i=1}^{n}sum_{i=1}^{n}left[C^ {n}left({frac {i}{n}},{frac {j}{n}}right)-{frac {i}{n}}cdot {frac {j}{ n}}derecho]}

Aplicaciones

Finanzas cuantitativas

Aplicaciones financieras típicas:Análisis del riesgo sistémico en los mercados financierosAnálisis y fijación de precios de opciones de diferencial, en particular en opciones de diferencial de swap de vencimiento constante de renta fijaAnálisis y valoración de la volatilidad sonrisa/sesgo de cestas exóticas, por ejemplo, lo mejor/peor deAnálisis y cotización de la sonrisa/sesgo de la volatilidad del cruce de divisas menos líquido, que es efectivamente una canasta: C = S 1 / S 2 o C = S 1 · S 2Pronóstico de valor en riesgo y optimización de cartera para minimizar el riesgo de cola para las acciones estadounidenses e internacionalesPronóstico de los rendimientos de las acciones para la optimización de la cartera en momentos más altos/la optimización a gran escalaMejorar las estimaciones del rendimiento esperado de una cartera y la matriz de varianza-covarianza para ingresar en estrategias sofisticadas de optimización de varianza mediaEstrategias de arbitraje estadístico, incluido el comercio de pares

En las finanzas cuantitativas las cópulas se aplican a la gestión de riesgos, a la gestión y optimización de carteras ya la fijación de precios de derivados.

Para los primeros, las cópulas se utilizan para realizar pruebas de estrés y controles de solidez que son especialmente importantes durante "regímenes a la baja/crisis/pánico" donde pueden ocurrir eventos extremos a la baja (p. ej., la crisis financiera mundial de 2007-2008). La fórmula también se adaptó a los mercados financieros y se utilizó para estimar la distribución de probabilidad de pérdidas en conjuntos de préstamos o bonos.

Durante un régimen a la baja, un gran número de inversores que han mantenido posiciones en activos de mayor riesgo, como acciones o bienes raíces, pueden buscar refugio en inversiones "más seguras", como efectivo o bonos. Esto también se conoce como efecto de vuelo hacia la calidad y los inversores tienden a salir de sus posiciones en activos de mayor riesgo en grandes cantidades en un corto período de tiempo. Como resultado, durante los regímenes a la baja, las correlaciones entre acciones son mayores a la baja que al alza y esto puede tener efectos desastrosos en la economía. Por ejemplo, anecdóticamente, a menudo leemos titulares de noticias financieras que informan la pérdida de cientos de millones de dólares en la bolsa de valores en un solo día; sin embargo, rara vez leemos informes de ganancias bursátiles positivas de la misma magnitud y en el mismo período de tiempo corto.

Las cópulas ayudan a analizar los efectos de los regímenes a la baja al permitir el modelado de los marginales y la estructura de dependencia de un modelo de probabilidad multivariante por separado. Por ejemplo, considere la bolsa de valores como un mercado que consta de una gran cantidad de comerciantes, cada uno de los cuales opera con sus propias estrategias para maximizar las ganancias. El comportamiento individualista de cada comerciante se puede describir modelando los marginales. Sin embargo, como todos los comerciantes operan en el mismo intercambio, las acciones de cada comerciante tienen un efecto de interacción con los demás comerciantes. Este efecto de interacción se puede describir modelando la estructura de dependencia. Por lo tanto, las cópulas nos permiten analizar los efectos de interacción que son de particular interés durante los regímenes a la baja, ya que los inversores tienden a agrupar su comportamiento y decisiones comerciales.

Los usuarios de la fórmula han sido criticados por crear "culturas de evaluación" que continuaron usando cópulas simples a pesar de que las versiones simples se reconocieron como inadecuadas para ese propósito. Por lo tanto, anteriormente, los modelos de cópula escalables para grandes dimensiones solo permitían el modelado de estructuras de dependencia elípticas (es decir, cópulas gaussianas y t de Student) que no permiten asimetrías de correlación donde las correlaciones difieren en los regímenes al alza o a la baja. Sin embargo, el desarrollo reciente de las cópulas de vid (también conocidas como cópulas de pares) permite el modelado flexible de la estructura de dependencia para carteras de grandes dimensiones. La cópula de vid canónica de Clayton permite la ocurrencia de eventos extremos a la baja y se ha aplicado con éxito en aplicaciones de optimización de cartera y gestión de riesgos. El modelo es capaz de reducir los efectos de las correlaciones negativas extremas y produce un rendimiento estadístico y económico mejorado en comparación con las cópulas de dependencia elípticas escalables, como la cópula gaussiana y Student-t.

Otros modelos desarrollados para aplicaciones de gestión de riesgos son las cópulas de pánico que se combinan con estimaciones de mercado de las distribuciones marginales para analizar los efectos de los regímenes de pánico en la distribución de pérdidas y ganancias de la cartera. Las cópulas de pánico se crean mediante simulación de Monte Carlo, mezcladas con una reponderación de la probabilidad de cada escenario.

En lo que respecta a la fijación de precios de derivados, el modelado de dependencia con funciones de cópula se usa ampliamente en aplicaciones de evaluación de riesgos financieros y análisis actuarial, por ejemplo, en la fijación de precios de obligaciones de deuda garantizada (CDO). Algunos creen que la metodología de aplicar la cópula gaussiana a los derivados de crédito es una de las razones detrás de la crisis financiera mundial de 2008-2009; véase David X. Li § CDO y cópula gaussiana.

A pesar de esta percepción, existen intentos documentados dentro de la industria financiera, antes de la crisis, para abordar las limitaciones de la cópula gaussiana y de las funciones de la cópula en general, específicamente la falta de dinámica de dependencia. Falta la cópula gaussiana, ya que solo permite una estructura de dependencia elíptica, ya que la dependencia solo se modela utilizando la matriz de varianza-covarianza. Esta metodología es tan limitada que no permite que evolucione la dependencia, ya que los mercados financieros exhiben una dependencia asimétrica, por lo que las correlaciones entre activos aumentan significativamente durante las recesiones en comparación con las repuntes. Por lo tanto, los enfoques de modelado que utilizan la cópula gaussiana presentan una representación deficiente de los eventos extremos.Ha habido intentos de proponer modelos que rectifiquen algunas de las limitaciones de la cópula.

Además de los CDO, las cópulas se han aplicado a otras clases de activos como una herramienta flexible en el análisis de productos derivados de activos múltiples. La primera aplicación de este tipo fuera del crédito fue utilizar una cópula para construir una superficie de volatilidad implícita de la cesta, teniendo en cuenta la sonrisa de volatilidad de los componentes de la cesta. Desde entonces, las cópulas han ganado popularidad en la fijación de precios y la gestión de riesgos de opciones sobre activos múltiples en presencia de una sonrisa de volatilidad, en derivados de renta variable, divisas y renta fija.

Ingeniería civil

Recientemente, las funciones de cópula se han aplicado con éxito a la formulación de bases de datos para el análisis de confiabilidad de puentes de carreteras y a varios estudios de simulación multivariante en ingeniería civil, confiabilidad de ingeniería eólica y sísmica e ingeniería mecánica y marina. Los investigadores también están probando estas funciones en el campo del transporte para comprender la interacción entre los comportamientos de los conductores individuales que, en su totalidad, da forma al flujo de tráfico.

Ingeniería de confiabilidad

Las cópulas se utilizan para el análisis de confiabilidad de sistemas complejos de componentes de máquinas con modos de falla en competencia.

Análisis de datos de garantía

Las cópulas se utilizan para el análisis de datos de garantía en el que se analiza la dependencia de la cola.

Combustión turbulenta

Las cópulas se utilizan para modelar la combustión turbulenta parcialmente premezclada, que es común en las cámaras de combustión prácticas.

Medicamento

Las cópulas tienen muchas aplicaciones en el área de la medicina, por ejemplo,

  1. Las cópulas se han utilizado en el campo de la resonancia magnética nuclear (RMN), por ejemplo, para segmentar imágenes, para llenar una vacante de modelos gráficos en genética de imágenes en un estudio sobre esquizofrenia y para distinguir entre pacientes normales y con Alzheimer.
  2. Las cópulas han estado en el área de la investigación cerebral basada en señales EEG, por ejemplo, para detectar somnolencia durante la siesta diurna, rastrear cambios en los anchos de banda equivalentes instantáneos (IEBW), derivar sincronía para el diagnóstico temprano de la enfermedad de Alzheimer, caracterizar la dependencia en oscilatorio actividad entre los canales de EEG, y para evaluar la fiabilidad del uso de métodos para capturar la dependencia entre pares de canales de EEG utilizando sus envolventes variables en el tiempo. Las funciones de cópula se han aplicado con éxito al análisis de dependencias neuronales y recuentos de picos en neurociencia.
  3. Se ha desarrollado un modelo de cópula en el campo de la oncología, por ejemplo, para modelar conjuntamente genotipos, fenotipos y vías para reconstruir una red celular para identificar interacciones entre fenotipos específicos y múltiples características moleculares (p. ej., mutaciones y cambios en la expresión génica). Bao et al. utilizó datos de la línea celular de cáncer NCI60 para identificar varios subconjuntos de características moleculares que funcionan conjuntamente como predictores de fenotipos clínicos. La cópula propuesta puede tener un impacto en la investigación biomédica, desde el tratamiento del cáncer hasta la prevención de enfermedades. La cópula también se ha utilizado para predecir el diagnóstico histológico de lesiones colorrectales a partir de imágenes de colonoscopia y para clasificar los subtipos de cáncer.

Geodesia

La combinación de métodos basados ​​en SSA y Copula se ha aplicado por primera vez como una nueva herramienta estocástica para la predicción de EOP.

Investigación de hidrología

Las cópulas se han utilizado tanto en análisis teóricos como aplicados de datos hidroclimáticos. Los estudios teóricos adoptaron la metodología basada en la cópula, por ejemplo, para obtener una mejor comprensión de las estructuras de dependencia de la temperatura y la precipitación en diferentes partes del mundo. Los estudios aplicados adoptaron la metodología basada en cópulas para examinar, por ejemplo, las sequías agrícolas o los efectos conjuntos de los extremos de temperatura y precipitación sobre el crecimiento de la vegetación.

Investigación del clima y el tiempo

Las cópulas se han utilizado ampliamente en investigaciones relacionadas con el clima y el tiempo.

Variabilidad de la irradiancia solar

Las cópulas se han utilizado para estimar la variabilidad de la irradiancia solar en redes espaciales y temporalmente para ubicaciones individuales.

Generación de vectores aleatorios

Se pueden generar grandes trazas sintéticas de vectores y series de tiempo estacionarias usando cópulas empíricas mientras se preserva toda la estructura de dependencia de pequeños conjuntos de datos. Dichos rastros empíricos son útiles en varios estudios de rendimiento basados ​​en simulación.

Ranking de motores eléctricos

Las cópulas se han utilizado para la clasificación de calidad en la fabricación de motores conmutados electrónicamente.

Procesamiento de la señal

Las cópulas son importantes porque representan una estructura de dependencia sin usar distribuciones marginales. Las cópulas se han utilizado ampliamente en el campo de las finanzas, pero su uso en el procesamiento de señales es relativamente nuevo. Las cópulas se han empleado en el campo de la comunicación inalámbrica para clasificar señales de radar, detección de cambios en aplicaciones de detección remota y procesamiento de señales EEG en medicina. En esta sección, se presenta una breve derivación matemática para obtener la función de densidad de cópula seguida de una tabla que proporciona una lista de funciones de densidad de cópula con las aplicaciones de procesamiento de señales relevantes.

Derivación matemática de la función de densidad de cópula

Para cualesquiera dos variables aleatorias X e Y, la función de distribución de probabilidad conjunta continua se puede escribir como{displaystyle F_{XY}(x,y)=Pr {begin{Bmatriz}Xleq {x},Yleq {y}end{Bmatriz}},}

donde {textstyle F_{X}(x)=Pr {begin{Bmatriz}Xleq {x}end{Bmatriz}}}y {textstyle F_{Y}(y)=Pr {begin{Bmatriz}Yleq {y}end{Bmatriz}}}son las funciones de distribución acumulativa marginal de las variables aleatorias X e Y, respectivamente.

entonces la función de distribución de la cópula { estilo de visualización C (u, v)}se puede definir usando el teorema de Sklar como:

{displaystyle F_{XY}(x,y)=C(F_{X}(x),F_{Y}(y))triangleq C(u,v)},

donde { estilo de visualización u = F_ {X} (x)}y {displaystyle v=F_{Y}(y)}son funciones de distribución marginal, { estilo de visualización F_ {XY} (x, y)}conjunta y { estilo de visualización u, v  en (0,1)}.

Comenzamos usando la relación entre la función de densidad de probabilidad conjunta (PDF) y la función de distribución acumulativa conjunta (CDF) y sus derivadas parciales.{displaystyle {begin{alignedat}{6}f_{XY}(x,y)={}&{parcial ^{2}F_{XY}(x,y) sobre parcial x,parcial y}\vdots \f_{XY}(x,y)={}&{parcial ^{2}C(F_{X}(x),F_{Y}(y)) over parcial x,parcial y}\vdots \f_{XY}(x,y)={}&{parcial ^{2}C(u,v) over parcial u,parcial v} cdot {F_{X}(x) parcial sobre x parcial}cdot {F_{Y}(y) parcial sobre y parcial}\vdots \f_{XY}(x,y)={}&c(u,v)f_{X}(x)f_{Y}(y)\vdots \{frac {f_{XY}(x,y)}{f_{X}(x)f_{Y}(y)}}={}&c(u,v)end{alineado en}}}

donde c(u,v)es la función de densidad de cópula, { estilo de visualización f_ {X} (x)}y { Displaystyle f_ {Y} (y)}son las funciones de densidad de probabilidad marginal de X e Y, respectivamente. Es importante entender que hay cuatro elementos en esta ecuación, y si se conocen tres elementos, se puede calcular el cuarto elemento. Por ejemplo, se puede utilizar,

Lista de funciones y aplicaciones de densidad de cópula

Varias funciones de densidad de cópula bivariadas son importantes en el área de procesamiento de señales. { estilo de visualización u = F_ {X} (x)}y {displaystyle v=F_{Y}(y)}son funciones de distribuciones marginales y { estilo de visualización f_ {X} (x)}y { Displaystyle f_ {Y} (y)}son funciones de densidad marginales. Se ha demostrado que la extensión y generalización de cópulas para el procesamiento estadístico de señales construye nuevas cópulas bivariadas para distribuciones exponenciales, Weibull y Rician. Zeng et al. presentó algoritmos, simulación, selección óptima y aplicaciones prácticas de estas cópulas en el procesamiento de señales.

Densidad de cópula: c (u, v)Usar
gaussiano{displaystyle {begin{alineado}={}&{frac {1}{sqrt {1-rho ^{2}}}}exp left(-{frac {(a^{2} +b^{2})rho ^{2}-2abrho }{2(1-rho ^{2})}}right)\&{text{donde}}rho in (-1,1)\&{text{donde }}a={sqrt {2}}operatorname {erf} ^{-1}({2u-1})\&{text{donde } }b={sqrt {2}}operatorname {erf} ^{-1}({2v-1})\&{text{donde }}operatorname {erf} (z)={frac { 2}{sqrt {pi }}}int limits _{0}^{z}exp(-t^{2}),dtend{alineado}}}clasificación supervisada de imágenes de radar de apertura sintética (SAR),validación de autenticación biométrica, modelado de dependencia estocástica en integración a gran escala de energía eólica, clasificación no supervisada de señales de radar
Exponencial{displaystyle {begin{alineado}={}&{frac {1}{1-rho }}exp left({frac {rho (ln(1-u)+ln(1 -v))}{1-rho }}right)cdot I_{0}left({frac {2{sqrt {rho ln(1-u)ln(1-v)} }}{1-rho }}right)\&{text{donde }}x=F_{X}^{-1}(u)=-ln(1-u)/lambda \ &{text{donde}}y=F_{Y}^{-1}(v)=-ln(1-v)/mu end{alineado}}}sistema de colas con infinitos servidores
RayleighSe ha demostrado que las cópulas exponencial bivariada, Rayleigh y Weibull son equivalentesdetección de cambios a partir de imágenes SAR
WeibullSe ha demostrado que las cópulas exponencial bivariada, Rayleigh y Weibull son equivalentescomunicación digital a través de canales que se desvanecen
Log-normalla cópula logarítmica normal bivariada y la cópula gaussiana son equivalentesla sombra se desvanece junto con el efecto multitrayecto en el canal inalámbrico
Farlie-Gumbel-Morgenstern (FGM){displaystyle {begin{alineado}={}&1+theta (1-2u)(1-2v)\&{text{donde }}theta in [-1,1]end{alineado} }}procesamiento de la información de la incertidumbre en los sistemas basados ​​en el conocimiento
Clayton{displaystyle {begin{alineado}={}&(1+theta)(uv)^{(-1-theta)}(-1+u^{-theta }+v^{-theta })^{(-2-1/theta)}\&{text{donde }}theta in (-1,infty),theta neq 0end{alineado}}}estimación de ubicación de fuente de señal aleatoria y prueba de hipótesis utilizando datos heterogéneos
Franco{displaystyle {begin{alineado}={}&{frac {theta e^{theta (u+v)}(e^{theta }-1)}{(e^{theta }- e^{theta u}-e^{theta v}+e^{theta (u+v)})^{2}}}\&{text{donde}}theta in (- infty,+infty),theta neq 0end{alineado}}}detección de cambios en aplicaciones de teledetección
camiseta de estudiante{displaystyle {begin{alineado}={}&{frac {Gamma (0.5v)Gamma (0.5v+1)(1+(t_{v}^{-2}(u)+t_{ v}^{-2}(v)-2rho t_{v}^{-1}(u)t_{v}^{-1}(v))/(v(1-rho ^{2 })))^{-0.5(v+2)})}{{sqrt {1-rho ^{2}}}cdot Gamma (0.5(v+1))^{2}(1+ t_{v}^{-2}(u)/v)^{-0.5(v+1)}(1+t_{v}^{-2}(v)/v)^{-0.5(v+ 1)}}}\&{text{donde}}rho in (-1,1)\&{text{donde}}phi (z)={frac {1}{sqrt {2pi }}}int limits _{-infty }^{z}exp left({frac {-t^{2}}{2}}right),dt\& {text{donde }}t_{v}(xmid v)=int limits _{-infty }^{x}{frac {Gamma {(0.5(v+1))}}{ {sqrt {vpi }}(Gamma {0.5v})(1+v^{-1}t^{2})^{0.5(v+1)}}}dt\&{text {donde }}v={text{grados de libertad}}\&{text{donde }}Gamma {text{ es la función Gamma}}end{alineada}}}clasificación supervisada de imágenes SAR,fusión de decisiones de sensores correlacionados
Nakagami-m
rican