Cópula (probabilidades)
En teoría de probabilidad y estadística, una cópula es una función de distribución acumulativa multivariante para la cual la distribución de probabilidad marginal de cada variable es uniforme en el intervalo [0, 1]. Las cópulas se utilizan para describir/modelar la dependencia (intercorrelación) entre variables aleatorias. Su nombre, introducido por el matemático aplicado Abe Sklar en 1959, proviene del latín para "enlace" o "lazo", similar pero no relacionado con las cópulas gramaticales en lingüística. Las cópulas se han utilizado ampliamente en finanzas cuantitativas para modelar y minimizar el riesgo de cola y aplicaciones de optimización de cartera.
El teorema de Sklar establece que cualquier distribución conjunta multivariante se puede escribir en términos de funciones de distribución marginal univariante y una cópula que describe la estructura de dependencia entre las variables.
Las cópulas son populares en aplicaciones estadísticas de alta dimensión, ya que permiten modelar y estimar fácilmente la distribución de vectores aleatorios al estimar marginales y cópulas por separado. Hay muchas familias de cópulas paramétricas disponibles, que normalmente tienen parámetros que controlan la fuerza de la dependencia. A continuación se describen algunos modelos de cópula paramétrica populares.
Las cópulas bidimensionales se conocen en otras áreas de las matemáticas con el nombre de permutones y medidas doblemente estocásticas.
Definición matemática
Considere un vector aleatorio . Supongamos que sus marginales son continuas, es decir, las CDF marginales
son funciones continuas. Al aplicar la transformada integral de probabilidad a cada componente, el vector aleatorio
tiene marginales que se distribuyen uniformemente en el intervalo [0, 1].
La cópula de se define como la función de distribución acumulada conjunta de
:
La cópula C contiene toda la información sobre la estructura de dependencia entre los componentes de mientras que las funciones de distribución acumulativa marginal
contienen toda la información sobre las distribuciones marginales de
.
El reverso de estos pasos se puede utilizar para generar muestras pseudoaleatorias a partir de clases generales de distribuciones de probabilidad multivariadas. Es decir, dado un procedimiento para generar una muestra a partir de la función de cópula, la muestra requerida se puede construir como
Los inversos no son problemáticos casi con seguridad, ya
que se supuso que eran continuos. Además, la fórmula anterior para la función de cópula se puede reescribir como:
Definición
En términos probabilísticos, es una cópula d -dimensional si C es una función de distribución acumulada conjunta de un vector aleatorio d -dimensional en el cubo unitario con marginales uniformes.
En términos analíticos, es una cópula d -dimensional si
, la cópula es cero si alguno de los argumentos es cero,
, la cópula es igual a u si un argumento es u y todos los demás 1,
- C es d -no decreciente, es decir, para cada hiperrectángulo
el C -volumen de B no es negativo:
donde el .
Por ejemplo, en el caso bivariado, es una cópula bivariada si
,
y
para todos
y
.
Teorema de sklar
El teorema de Sklar, llamado así por Abe Sklar, proporciona la base teórica para la aplicación de cópulas. El teorema de Sklar establece que toda función de distribución acumulativa multivariante
de un vector aleatorio se puede expresar en términos de sus marginales
y una cópula
. En efecto:
En caso de que la distribución multivariante tenga una densidad , y si esta está disponible, se cumple además que
donde es la densidad de la cópula.
El teorema también establece que, dada , la cópula es única en
, que es el producto cartesiano de los rangos de las CDF marginales. Esto implica que la cópula es única si los marginales
son continuos.
Lo contrario también es cierto: dada una cópula y marginales
, entonces
define una función de distribución acumulativa d
-dimensional con distribuciones marginales.
Condición de estacionariedad
Las cópulas funcionan principalmente cuando las series temporales son estacionarias y continuas. Por lo tanto, un paso de preprocesamiento muy importante es verificar la autocorrelación, la tendencia y la estacionalidad dentro de la serie temporal.
Cuando las series de tiempo se autocorrelacionan, pueden generar una dependencia de no existencia entre conjuntos de variables y dar como resultado una estructura de dependencia de Copula incorrecta.
Límites de la cópula de Fréchet-Hoeffding
El teorema de Fréchet-Hoeffding (después de Maurice René Fréchet y Wassily Hoeffding) establece que para cualquier cópula y cualquiera se cumplen
los siguientes límites:
La función W se denomina límite inferior de Fréchet-Hoeffding y se define como
La función M se llama límite superior de Fréchet-Hoeffding y se define como
El límite superior es nítido: M siempre es una cópula, corresponde a variables aleatorias comonotonas.
El límite inferior es puntiagudo, en el sentido de que para u fija, hay una cópula tal que
. Sin embargo, W es una cópula solo en dos dimensiones, en cuyo caso corresponde a variables aleatorias contramonótonas.
En dos dimensiones, es decir, el caso bivariado, el teorema de Fréchet-Hoeffding establece.
Familias de cópulas
Se han descrito varias familias de cópulas.
Cópula gaussiana
La cópula gaussiana es una distribución sobre el hipercubo unitario . Se construye a partir de una distribución normal multivariante
utilizando la transformada integral de probabilidad.
Para una matriz de correlación dada , la cópula gaussiana con matriz de parámetros
se puede escribir como
donde es la función de distribución acumulativa inversa de una normal estándar y
es la función de distribución acumulativa conjunta de una distribución normal multivariante con vector medio cero y matriz de covarianza igual a la matriz de correlación
. Si bien no existe una fórmula analítica simple para la función de cópula,
puede tener un límite superior o inferior y aproximarse mediante integración numérica. La densidad se puede escribir como
donde es la matriz identidad.
Cópulas de Arquímedes
Las cópulas de Arquímedes son una clase asociativa de cópulas. Las cópulas de Arquímedes más comunes admiten una fórmula explícita, algo que no es posible por ejemplo para la cópula de Gauss. En la práctica, las cópulas de Arquímedes son populares porque permiten modelar la dependencia en dimensiones arbitrariamente altas con un solo parámetro, que rige la fuerza de la dependencia.
Una cópula C se llama arquimediana si admite la representación
donde es una función continua, estrictamente decreciente y convexa tal que
,
es un parámetro dentro de algún espacio de parámetros
, y
es la llamada función generadora y
es su pseudo-inversa definida por
Además, la fórmula anterior para C produce una cópula si y solo si
es d-monótono en
. Es decir, si es
diferenciable por tiempos y las derivadas satisfacen
para todo y
y
es no creciente y convexo.
Cópulas de Arquímedes más importantes
Las siguientes tablas destacan las cópulas de Arquímedes bivariadas más destacadas, con su correspondiente generador. No todos ellos son completamente monótonos, es decir, d -monótono para todos o d -monótono para ciertos
solamente.
Nombre de la cópula | cópula bivariada | parámetro | generador | generador inverso |
---|---|---|---|---|
Ali–Mikhail–Haq | | | | |
Clayton | | | | |
Franco | | | | |
Gumbel | | | | |
Independencia | | | | |
José | | | | |
Expectativa para los modelos de cópula y la integración de Monte Carlo
En aplicaciones estadísticas, muchos problemas se pueden formular de la siguiente manera. Uno está interesado en la expectativa de una función de respuesta aplicada a algún vector aleatorio
. Si denotamos la cdf de este vector aleatorio con
, la cantidad de interés se puede escribir como
Si viene dado por un modelo de cópula, es decir,
esta expectativa se puede reescribir como
En el caso de que la cópula C sea absolutamente continua, es decir, C tenga una densidad c, esta ecuación se puede escribir como
y si cada distribución marginal tiene la densidad se mantiene además que
Si se conocen la cópula y los marginales (o si se han estimado), esta expectativa se puede aproximar mediante el siguiente algoritmo de Monte Carlo:
- Extraiga una muestra
de tamaño n de la cópula C
- Al aplicar las cdf marginales inversas, produzca una muestra de
al establecer
- Aproximado
por su valor empírico:
Cópulas empíricas
Al estudiar datos multivariados, es posible que desee investigar la cópula subyacente. Supongamos que tenemos observaciones
de un vector aleatorio con marginales continuos. Las correspondientes observaciones de cópula "verdaderas" serían
Sin embargo, las funciones de distribución marginal generalmente no se conocen. Por lo tanto, se pueden construir observaciones de pseudocópula utilizando las funciones de distribución empíricas
en cambio. Entonces, las observaciones de la pseudo cópula se definen como
La cópula empírica correspondiente se define entonces como
Los componentes de las muestras de pseudocópula también se pueden escribir como , donde
es el rango de la observación
:
Por lo tanto, la cópula empírica puede verse como la distribución empírica de los datos transformados por rango.
La versión de muestra de la rho de Spearman:
Aplicaciones
Finanzas cuantitativas
Aplicaciones financieras típicas:Análisis del riesgo sistémico en los mercados financierosAnálisis y fijación de precios de opciones de diferencial, en particular en opciones de diferencial de swap de vencimiento constante de renta fijaAnálisis y valoración de la volatilidad sonrisa/sesgo de cestas exóticas, por ejemplo, lo mejor/peor deAnálisis y cotización de la sonrisa/sesgo de la volatilidad del cruce de divisas menos líquido, que es efectivamente una canasta: C = S 1 / S 2 o C = S 1 · S 2Pronóstico de valor en riesgo y optimización de cartera para minimizar el riesgo de cola para las acciones estadounidenses e internacionalesPronóstico de los rendimientos de las acciones para la optimización de la cartera en momentos más altos/la optimización a gran escalaMejorar las estimaciones del rendimiento esperado de una cartera y la matriz de varianza-covarianza para ingresar en estrategias sofisticadas de optimización de varianza mediaEstrategias de arbitraje estadístico, incluido el comercio de pares |
En las finanzas cuantitativas las cópulas se aplican a la gestión de riesgos, a la gestión y optimización de carteras ya la fijación de precios de derivados.
Para los primeros, las cópulas se utilizan para realizar pruebas de estrés y controles de solidez que son especialmente importantes durante "regímenes a la baja/crisis/pánico" donde pueden ocurrir eventos extremos a la baja (p. ej., la crisis financiera mundial de 2007-2008). La fórmula también se adaptó a los mercados financieros y se utilizó para estimar la distribución de probabilidad de pérdidas en conjuntos de préstamos o bonos.
Durante un régimen a la baja, un gran número de inversores que han mantenido posiciones en activos de mayor riesgo, como acciones o bienes raíces, pueden buscar refugio en inversiones "más seguras", como efectivo o bonos. Esto también se conoce como efecto de vuelo hacia la calidad y los inversores tienden a salir de sus posiciones en activos de mayor riesgo en grandes cantidades en un corto período de tiempo. Como resultado, durante los regímenes a la baja, las correlaciones entre acciones son mayores a la baja que al alza y esto puede tener efectos desastrosos en la economía. Por ejemplo, anecdóticamente, a menudo leemos titulares de noticias financieras que informan la pérdida de cientos de millones de dólares en la bolsa de valores en un solo día; sin embargo, rara vez leemos informes de ganancias bursátiles positivas de la misma magnitud y en el mismo período de tiempo corto.
Las cópulas ayudan a analizar los efectos de los regímenes a la baja al permitir el modelado de los marginales y la estructura de dependencia de un modelo de probabilidad multivariante por separado. Por ejemplo, considere la bolsa de valores como un mercado que consta de una gran cantidad de comerciantes, cada uno de los cuales opera con sus propias estrategias para maximizar las ganancias. El comportamiento individualista de cada comerciante se puede describir modelando los marginales. Sin embargo, como todos los comerciantes operan en el mismo intercambio, las acciones de cada comerciante tienen un efecto de interacción con los demás comerciantes. Este efecto de interacción se puede describir modelando la estructura de dependencia. Por lo tanto, las cópulas nos permiten analizar los efectos de interacción que son de particular interés durante los regímenes a la baja, ya que los inversores tienden a agrupar su comportamiento y decisiones comerciales.
Los usuarios de la fórmula han sido criticados por crear "culturas de evaluación" que continuaron usando cópulas simples a pesar de que las versiones simples se reconocieron como inadecuadas para ese propósito. Por lo tanto, anteriormente, los modelos de cópula escalables para grandes dimensiones solo permitían el modelado de estructuras de dependencia elípticas (es decir, cópulas gaussianas y t de Student) que no permiten asimetrías de correlación donde las correlaciones difieren en los regímenes al alza o a la baja. Sin embargo, el desarrollo reciente de las cópulas de vid (también conocidas como cópulas de pares) permite el modelado flexible de la estructura de dependencia para carteras de grandes dimensiones. La cópula de vid canónica de Clayton permite la ocurrencia de eventos extremos a la baja y se ha aplicado con éxito en aplicaciones de optimización de cartera y gestión de riesgos. El modelo es capaz de reducir los efectos de las correlaciones negativas extremas y produce un rendimiento estadístico y económico mejorado en comparación con las cópulas de dependencia elípticas escalables, como la cópula gaussiana y Student-t.
Otros modelos desarrollados para aplicaciones de gestión de riesgos son las cópulas de pánico que se combinan con estimaciones de mercado de las distribuciones marginales para analizar los efectos de los regímenes de pánico en la distribución de pérdidas y ganancias de la cartera. Las cópulas de pánico se crean mediante simulación de Monte Carlo, mezcladas con una reponderación de la probabilidad de cada escenario.
En lo que respecta a la fijación de precios de derivados, el modelado de dependencia con funciones de cópula se usa ampliamente en aplicaciones de evaluación de riesgos financieros y análisis actuarial, por ejemplo, en la fijación de precios de obligaciones de deuda garantizada (CDO). Algunos creen que la metodología de aplicar la cópula gaussiana a los derivados de crédito es una de las razones detrás de la crisis financiera mundial de 2008-2009; véase David X. Li § CDO y cópula gaussiana.
A pesar de esta percepción, existen intentos documentados dentro de la industria financiera, antes de la crisis, para abordar las limitaciones de la cópula gaussiana y de las funciones de la cópula en general, específicamente la falta de dinámica de dependencia. Falta la cópula gaussiana, ya que solo permite una estructura de dependencia elíptica, ya que la dependencia solo se modela utilizando la matriz de varianza-covarianza. Esta metodología es tan limitada que no permite que evolucione la dependencia, ya que los mercados financieros exhiben una dependencia asimétrica, por lo que las correlaciones entre activos aumentan significativamente durante las recesiones en comparación con las repuntes. Por lo tanto, los enfoques de modelado que utilizan la cópula gaussiana presentan una representación deficiente de los eventos extremos.Ha habido intentos de proponer modelos que rectifiquen algunas de las limitaciones de la cópula.
Además de los CDO, las cópulas se han aplicado a otras clases de activos como una herramienta flexible en el análisis de productos derivados de activos múltiples. La primera aplicación de este tipo fuera del crédito fue utilizar una cópula para construir una superficie de volatilidad implícita de la cesta, teniendo en cuenta la sonrisa de volatilidad de los componentes de la cesta. Desde entonces, las cópulas han ganado popularidad en la fijación de precios y la gestión de riesgos de opciones sobre activos múltiples en presencia de una sonrisa de volatilidad, en derivados de renta variable, divisas y renta fija.
Ingeniería civil
Recientemente, las funciones de cópula se han aplicado con éxito a la formulación de bases de datos para el análisis de confiabilidad de puentes de carreteras y a varios estudios de simulación multivariante en ingeniería civil, confiabilidad de ingeniería eólica y sísmica e ingeniería mecánica y marina. Los investigadores también están probando estas funciones en el campo del transporte para comprender la interacción entre los comportamientos de los conductores individuales que, en su totalidad, da forma al flujo de tráfico.
Ingeniería de confiabilidad
Las cópulas se utilizan para el análisis de confiabilidad de sistemas complejos de componentes de máquinas con modos de falla en competencia.
Análisis de datos de garantía
Las cópulas se utilizan para el análisis de datos de garantía en el que se analiza la dependencia de la cola.
Combustión turbulenta
Las cópulas se utilizan para modelar la combustión turbulenta parcialmente premezclada, que es común en las cámaras de combustión prácticas.
Medicamento
Las cópulas tienen muchas aplicaciones en el área de la medicina, por ejemplo,
- Las cópulas se han utilizado en el campo de la resonancia magnética nuclear (RMN), por ejemplo, para segmentar imágenes, para llenar una vacante de modelos gráficos en genética de imágenes en un estudio sobre esquizofrenia y para distinguir entre pacientes normales y con Alzheimer.
- Las cópulas han estado en el área de la investigación cerebral basada en señales EEG, por ejemplo, para detectar somnolencia durante la siesta diurna, rastrear cambios en los anchos de banda equivalentes instantáneos (IEBW), derivar sincronía para el diagnóstico temprano de la enfermedad de Alzheimer, caracterizar la dependencia en oscilatorio actividad entre los canales de EEG, y para evaluar la fiabilidad del uso de métodos para capturar la dependencia entre pares de canales de EEG utilizando sus envolventes variables en el tiempo. Las funciones de cópula se han aplicado con éxito al análisis de dependencias neuronales y recuentos de picos en neurociencia.
- Se ha desarrollado un modelo de cópula en el campo de la oncología, por ejemplo, para modelar conjuntamente genotipos, fenotipos y vías para reconstruir una red celular para identificar interacciones entre fenotipos específicos y múltiples características moleculares (p. ej., mutaciones y cambios en la expresión génica). Bao et al. utilizó datos de la línea celular de cáncer NCI60 para identificar varios subconjuntos de características moleculares que funcionan conjuntamente como predictores de fenotipos clínicos. La cópula propuesta puede tener un impacto en la investigación biomédica, desde el tratamiento del cáncer hasta la prevención de enfermedades. La cópula también se ha utilizado para predecir el diagnóstico histológico de lesiones colorrectales a partir de imágenes de colonoscopia y para clasificar los subtipos de cáncer.
Geodesia
La combinación de métodos basados en SSA y Copula se ha aplicado por primera vez como una nueva herramienta estocástica para la predicción de EOP.
Investigación de hidrología
Las cópulas se han utilizado tanto en análisis teóricos como aplicados de datos hidroclimáticos. Los estudios teóricos adoptaron la metodología basada en la cópula, por ejemplo, para obtener una mejor comprensión de las estructuras de dependencia de la temperatura y la precipitación en diferentes partes del mundo. Los estudios aplicados adoptaron la metodología basada en cópulas para examinar, por ejemplo, las sequías agrícolas o los efectos conjuntos de los extremos de temperatura y precipitación sobre el crecimiento de la vegetación.
Investigación del clima y el tiempo
Las cópulas se han utilizado ampliamente en investigaciones relacionadas con el clima y el tiempo.
Variabilidad de la irradiancia solar
Las cópulas se han utilizado para estimar la variabilidad de la irradiancia solar en redes espaciales y temporalmente para ubicaciones individuales.
Generación de vectores aleatorios
Se pueden generar grandes trazas sintéticas de vectores y series de tiempo estacionarias usando cópulas empíricas mientras se preserva toda la estructura de dependencia de pequeños conjuntos de datos. Dichos rastros empíricos son útiles en varios estudios de rendimiento basados en simulación.
Ranking de motores eléctricos
Las cópulas se han utilizado para la clasificación de calidad en la fabricación de motores conmutados electrónicamente.
Procesamiento de la señal
Las cópulas son importantes porque representan una estructura de dependencia sin usar distribuciones marginales. Las cópulas se han utilizado ampliamente en el campo de las finanzas, pero su uso en el procesamiento de señales es relativamente nuevo. Las cópulas se han empleado en el campo de la comunicación inalámbrica para clasificar señales de radar, detección de cambios en aplicaciones de detección remota y procesamiento de señales EEG en medicina. En esta sección, se presenta una breve derivación matemática para obtener la función de densidad de cópula seguida de una tabla que proporciona una lista de funciones de densidad de cópula con las aplicaciones de procesamiento de señales relevantes.
Derivación matemática de la función de densidad de cópula
Para cualesquiera dos variables aleatorias X e Y, la función de distribución de probabilidad conjunta continua se puede escribir como
donde y
son las funciones de distribución acumulativa marginal de las variables aleatorias X e Y, respectivamente.
entonces la función de distribución de la cópula se puede definir usando el teorema de Sklar como:
,
donde y
son funciones de distribución marginal,
conjunta y
.
Comenzamos usando la relación entre la función de densidad de probabilidad conjunta (PDF) y la función de distribución acumulativa conjunta (CDF) y sus derivadas parciales.
donde es la función de densidad de cópula,
y
son las funciones de densidad de probabilidad marginal de X e Y, respectivamente. Es importante entender que hay cuatro elementos en esta ecuación, y si se conocen tres elementos, se puede calcular el cuarto elemento. Por ejemplo, se puede utilizar,
- cuando se conoce la función de densidad de probabilidad conjunta entre dos variables aleatorias, se conoce la función de densidad de cópula y se conoce una de las dos funciones marginales, entonces, se puede calcular la otra función marginal, o
- cuando se conocen las dos funciones marginales y la función de densidad de la cópula, entonces se puede calcular la función de densidad de probabilidad conjunta entre las dos variables aleatorias, o
- cuando se conocen las dos funciones marginales y la función de densidad de probabilidad conjunta entre las dos variables aleatorias, entonces se puede calcular la función de densidad de cópula.
Lista de funciones y aplicaciones de densidad de cópula
Varias funciones de densidad de cópula bivariadas son importantes en el área de procesamiento de señales. y
son funciones de distribuciones marginales y
y
son funciones de densidad marginales. Se ha demostrado que la extensión y generalización de cópulas para el procesamiento estadístico de señales construye nuevas cópulas bivariadas para distribuciones exponenciales, Weibull y Rician. Zeng et al. presentó algoritmos, simulación, selección óptima y aplicaciones prácticas de estas cópulas en el procesamiento de señales.
Densidad de cópula: c (u, v) | Usar | |
---|---|---|
gaussiano | clasificación supervisada de imágenes de radar de apertura sintética (SAR),validación de autenticación biométrica, modelado de dependencia estocástica en integración a gran escala de energía eólica, clasificación no supervisada de señales de radar | |
Exponencial | sistema de colas con infinitos servidores | |
Rayleigh | Se ha demostrado que las cópulas exponencial bivariada, Rayleigh y Weibull son equivalentes | detección de cambios a partir de imágenes SAR |
Weibull | Se ha demostrado que las cópulas exponencial bivariada, Rayleigh y Weibull son equivalentes | comunicación digital a través de canales que se desvanecen |
Log-normal | la cópula logarítmica normal bivariada y la cópula gaussiana son equivalentes | la sombra se desvanece junto con el efecto multitrayecto en el canal inalámbrico |
Farlie-Gumbel-Morgenstern (FGM) | procesamiento de la información de la incertidumbre en los sistemas basados en el conocimiento | |
Clayton | estimación de ubicación de fuente de señal aleatoria y prueba de hipótesis utilizando datos heterogéneos | |
Franco | detección de cambios en aplicaciones de teledetección | |
camiseta de estudiante | clasificación supervisada de imágenes SAR,fusión de decisiones de sensores correlacionados | |
Nakagami-m | ||
rican |
Contenido relacionado
Modelo de Black-Scholes
Fraude bursátil
Obligación garantizada por deuda