Modelo semiparamétrico
En estadística, un modelo semiparamétrico es un modelo estadístico que tiene componentes paramétricos y no paramétricos.
Un modelo estadístico es una familia parametrizada de distribuciones: indexado por un parámetro .
- Un modelo paramétrico es un modelo en el que el parámetro indexación es un vector en -dimensional Espacio euclidiano, para algún entero no negativo . Así, es finito-dimensional, y .
- Con un modelo no paramétrico, el conjunto de posibles valores del parámetro es un subconjunto de algún espacio , que no es necesariamente finito-dimensional. Por ejemplo, podríamos considerar el conjunto de todas las distribuciones con media 0. Tales espacios son espacios vectoriales con estructura topológica, pero no pueden ser finitos-dimensionales como espacios vectoriales. Así, para un espacio posiblemente infinito .
- Con un modelo semiparamétrico, el parámetro tiene un componente finito-dimensional y un componente infinite-dimensional (a menudo una función de valor real definida en la línea real). Así, , donde es un espacio infinita.
Puede aparecer al principio que los modelos semiparamétricos incluyen modelos noparamétricos, ya que tienen un componente dimensional infinito y finito. Sin embargo, un modelo semiparamétrico se considera "smaller" que un modelo completamente no paramétrico porque a menudo estamos interesados sólo en el componente finito-dimensional de . Es decir, el componente dimensional es considerado como un parámetro de molestia. En modelos no paramétricos, por contraste, el interés primario es estimar el parámetro infinite-dimensional. Así, la tarea de estimación es estadísticamente más difícil en los modelos no paramétricos.
Estos modelos suelen utilizar suavizado o núcleos.
Ejemplo
Un ejemplo bien conocido de un modelo semiparamétrico es el modelo de riesgos proporcionales de Cox. Si estamos interesados en estudiar el tiempo a un evento como la muerte debido al cáncer o el fracaso de una bombilla, el modelo Cox especifica la siguiente función de distribución para :
Donde es el vector covariado, y y son parámetros desconocidos. . Aquí. es finito-dimensional y es de interés; es una función no negativa desconocida del tiempo (conocida como la función de riesgo de referencia) y es a menudo un parámetro de molestia. El conjunto de posibles candidatos es infinita.
Véase también
- regresión semiparamétrica
- Modelo estadístico
- Método generalizado de momentos
Notas
- ^ Bickel, P. J.; Klaassen, C. A. J.; Ritov, Y.; Wellner, J. A. (2006), "Semiparametrics", in Kotz, S.; et al. (eds.), Encyclopedia of Statistical Sciences, Wiley.
- ^ Oakes, D. (2006), "Modelos semiparamétricos", en Kotz, S.; et al. (eds.), Encyclopedia of Statistical Sciences, Wiley.
- ^ Balakrishnan, N.; Rao, C. R. (2004). Handbook of Statistics 23: Advances in Survival Analysis. Elsevier. p. 126.
Referencias
- Bickel, P. J.; Klaassen, C. A. J.; Ritov, Y.; Wellner, J. A. (1998), Estimación eficiente y adaptativa para modelos semiparamétricos, Springer
- Härdle, Wolfgang; Müller, Marlene; Sperlich, Stefan; Werwatz, Axel (2004), No paramétrica y semiparamétrica Modelos, Springer
- Kosorok, Michael R. (2008), Introducción a los procesos empíricos y semiparamétricos Inferencias, Springer
- Tsiatis, Anastasios A. (2006), semiparamétrica Teoría y datos perdidos, Springer
- Begun, Janet M.; Hall, W. J.; Huang, Wei-Min; Wellner, Jon A. (1983), "Information and asymptotic efficiency in parametric—nonparametric models", Annals of Statistics, 11 (1983), no. 2, 432--452