Función de supervivencia

Compartir Imprimir Citar

La función de supervivencia es una función que da la probabilidad de que un paciente, dispositivo u otro objeto de interés sobreviva más allá de un cierto tiempo.

La función de supervivencia también se conoce como función de supervivencia o función de fiabilidad.

El término función de confiabilidad es común en ingeniería, mientras que el término función de supervivencia se usa en una gama más amplia de aplicaciones, incluida la mortalidad humana. La función de supervivencia es la función de distribución acumulativa complementaria del tiempo de vida. A veces, las funciones de distribución acumulativa complementarias se denominan funciones de supervivencia en general.

Definición

Sea el tiempo de vida T una variable aleatoria continua con función de distribución acumulativa F (t) en el intervalo [0,∞). Su función de supervivencia o función de confiabilidad es:t})=int _{t}^{infty }f(u),du=1-F(t).">

Ejemplos de funciones de supervivencia

Los siguientes gráficos muestran ejemplos de funciones de supervivencia hipotéticas. El eje x es el tiempo. El eje y es la proporción de sujetos que sobreviven. Los gráficos muestran la probabilidad de que un sujeto sobreviva más allá del tiempo t.

Cuatro funciones de supervivencia

Por ejemplo, para la función de supervivencia 1, la probabilidad de sobrevivir más de t = 2 meses es 0,37. Es decir, el 37% de los sujetos sobreviven más de 2 meses.

Función de supervivencia 1

Para la función de supervivencia 2, la probabilidad de sobrevivir más de t = 2 meses es 0,97. Es decir, el 97% de los sujetos sobreviven más de 2 meses.

Función de supervivencia 2

La mediana de supervivencia puede determinarse a partir de la función de supervivencia. Por ejemplo, para la función de supervivencia 2, el 50 % de los sujetos sobreviven 3,72 meses. La mediana de supervivencia es, por lo tanto, de 3,72 meses.

función de supervivencia mediana de supervivencia

En algunos casos, la mediana de supervivencia no se puede determinar a partir del gráfico. Por ejemplo, para la función de supervivencia 4, más del 50 % de los sujetos sobreviven más que el período de observación de 10 meses.

Mediana de supervivencia superior a 10 meses

La función de supervivencia es una de varias formas de describir y mostrar datos de supervivencia. Otra forma útil de mostrar datos es un gráfico que muestre la distribución de los tiempos de supervivencia de los sujetos. Olkin, página 426, da el siguiente ejemplo de datos de supervivencia. Se registró el número de horas entre fallas sucesivas de un sistema de aire acondicionado. Los tiempos entre fallas sucesivas son 1, 3, 5, 7, 11, 11, 11, 12, 14, 14, 14, 16, 16, 20, 21, 23, 42, 47, 52, 62, 71, 71, 87, 90, 95, 120, 120, 225, 246 y 261 horas. El tiempo medio entre fallos es de 59,6. Este valor medio se utilizará en breve para ajustar una curva teórica a los datos. La siguiente figura muestra la distribución del tiempo entre fallas. Las marcas azules debajo del gráfico son las horas reales entre fallas sucesivas.

Distribución de los tiempos de falla de CA

La distribución de los tiempos de falla se superpone con una curva que representa una distribución exponencial. Para este ejemplo, la distribución exponencial se aproxima a la distribución de los tiempos de falla. La curva exponencial es una distribución teórica ajustada a los tiempos de falla reales. Esta particular curva exponencial se especifica mediante el parámetro lambda, λ= 1/(tiempo medio entre fallos) = 1/59,6 = 0,0168. La distribución de los tiempos de falla se denomina función de densidad de probabilidad (pdf), si el tiempo puede tomar cualquier valor positivo. En las ecuaciones, la función de densidad de probabilidad se especifica como f(t). Si el tiempo solo puede tomar valores discretos (como 1 día, 2 días, etc.), la distribución de los tiempos de falla se denomina función de masa de probabilidad (pmf). La mayoría de los métodos de análisis de supervivencia asumen que el tiempo puede tomar cualquier valor positivo y f(t) es la función de densidad de probabilidad.

Otra forma útil de mostrar los datos de supervivencia es un gráfico que muestre las fallas acumuladas hasta cada punto de tiempo. Estos datos pueden mostrarse como el número acumulativo o la proporción acumulativa de fallas hasta cada vez. El siguiente gráfico muestra la probabilidad acumulada (o proporción) de fallas en cada momento para el sistema de aire acondicionado. La línea de escalones en negro muestra la proporción acumulada de fallas. Para cada paso hay una marca azul en la parte inferior del gráfico que indica un tiempo de falla observado. La línea roja suave representa la curva exponencial ajustada a los datos observados.

CDF para fallas de CA

Un gráfico de la probabilidad acumulada de fallas hasta cada punto de tiempo se denomina función de distribución acumulada o CDF. En el análisis de supervivencia, la función de distribución acumulativa da la probabilidad de que el tiempo de supervivencia sea menor o igual a un tiempo específico, t.

Sea T el tiempo de supervivencia, que es cualquier número positivo. Un tiempo particular se designa con la letra minúscula t. La función de distribución acumulada de T es la función{displaystyle F(t)=operatorname {P} (Tleq t),}

donde el lado derecho representa la probabilidad de que la variable aleatoria T sea menor o igual que t. Si el tiempo puede tomar cualquier valor positivo, entonces la función de distribución acumulativa F(t) es la integral de la función de densidad de probabilidad f(t).

Para el ejemplo del aire acondicionado, el gráfico de la CDF a continuación ilustra que la probabilidad de que el tiempo hasta la falla sea menor o igual a 100 horas es 0.81, según lo estimado usando la curva exponencial ajustada a los datos.

AC Tiempo hasta falla LT 100 horas

Una alternativa a graficar la probabilidad de que el tiempo de falla sea menor o igual a 100 horas es graficar la probabilidad de que el tiempo de falla sea mayor a 100 horas. La probabilidad de que el tiempo de falla sea mayor a 100 horas debe ser 1 menos la probabilidad de que el tiempo de falla sea menor o igual a 100 horas, porque la probabilidad total debe sumar 1.

Esto da

P(tiempo de falla > 100 horas) = ​​1 - P(tiempo de falla < 100 horas) = ​​1 – 0,81 = 0,19.

Esta relación se generaliza a todos los tiempos de falla:

P(T > t) = 1 - P(T < t) = 1 – función de distribución acumulativa.

Esta relación se muestra en los gráficos siguientes. El gráfico de la izquierda es la función de distribución acumulativa, que es P(T < t). El gráfico de la derecha es P(T > t) = 1 - P(T < t). El gráfico de la derecha es la función de supervivencia, S(t). El hecho de que S(t) = 1 – CDF es la razón por la que otro nombre para la función de supervivencia es función de distribución acumulativa complementaria.

La función de supervivencia es 1 - CDF

Funciones de supervivencia paramétricas

En algunos casos, como el ejemplo del acondicionador de aire, la distribución de los tiempos de supervivencia puede aproximarse bien mediante una función como la distribución exponencial. Varias distribuciones se usan comúnmente en el análisis de supervivencia, incluidas la exponencial, Weibull, gamma, normal, log-normal y log-logística. Estas distribuciones están definidas por parámetros. La distribución normal (gaussiana), por ejemplo, está definida por los dos parámetros media y desviación estándar. Se dice que las funciones de supervivencia que están definidas por parámetros son paramétricas.

En los cuatro gráficos de función de supervivencia que se muestran arriba, la forma de la función de supervivencia está definida por una distribución de probabilidad particular: la función de supervivencia 1 está definida por una distribución exponencial, la 2 está definida por una distribución de Weibull, la 3 está definida por una distribución log-logística, y 4 está definido por otra distribución de Weibull.

Función de supervivencia exponencial

Para una distribución de supervivencia exponencial, la probabilidad de falla es la misma en cada intervalo de tiempo, sin importar la edad del individuo o del dispositivo. Este hecho conduce a la propiedad "sin memoria" de la distribución de supervivencia exponencial: la edad de un sujeto no tiene efecto sobre la probabilidad de fracaso en el siguiente intervalo de tiempo. El exponencial puede ser un buen modelo para la vida útil de un sistema donde las piezas se reemplazan cuando fallan. También puede ser útil para modelar la supervivencia de organismos vivos en intervalos cortos. No es probable que sea un buen modelo de la vida útil completa de un organismo vivo. Como señalan Efron y Hastie (p. 134), "si la vida humana fuera exponencial, no habría personas mayores o jóvenes, solo personas afortunadas o desafortunadas".

Función de supervivencia de Weibull

Una suposición clave de la función de supervivencia exponencial es que la tasa de riesgo es constante. En un ejemplo anterior, la proporción de hombres que mueren cada año se mantuvo constante en un 10 %, lo que significa que la tasa de riesgo se mantuvo constante. La suposición de riesgo constante puede no ser apropiada. Por ejemplo, entre la mayoría de los organismos vivos, el riesgo de muerte es mayor en la vejez que en la mediana edad, es decir, la tasa de riesgo aumenta con el tiempo. Para algunas enfermedades, como el cáncer de mama, el riesgo de recurrencia es menor después de 5 años, es decir, la tasa de riesgo disminuye con el tiempo. La distribución de Weibull amplía la distribución exponencial para permitir índices de riesgo constantes, crecientes o decrecientes.

Otras funciones de supervivencia paramétricas

Hay varias otras funciones de supervivencia paramétricas que pueden proporcionar un mejor ajuste a un conjunto de datos en particular, incluidas normal, lognormal, log-logística y gamma. La elección de la distribución paramétrica para una aplicación en particular se puede hacer usando métodos gráficos o usando pruebas formales de ajuste. Estas distribuciones y pruebas se describen en libros de texto sobre análisis de supervivencia. Lawless tiene una amplia cobertura de modelos paramétricos.

Las funciones de supervivencia paramétricas se utilizan comúnmente en aplicaciones de fabricación, en parte porque permiten la estimación de la función de supervivencia más allá del período de observación. Sin embargo, el uso apropiado de funciones paramétricas requiere que los datos estén bien modelados por la distribución elegida. Si no se dispone de una distribución adecuada, o no se puede especificar antes de un ensayo clínico o experimento, las funciones de supervivencia no paramétricas ofrecen una alternativa útil.

Funciones de supervivencia no paramétricas

Un modelo paramétrico de supervivencia puede no ser posible o deseable. En estas situaciones, el método más común para modelar la función de supervivencia es el estimador no paramétrico de Kaplan-Meier.

Propiedades

Así que eso{displaystyle S(t)=exp[-int _{0}^{t}lambda(t')dt']}