Lema de Neyman-Pearson
En las estadísticas, Neyman-Pearson lemma fue presentado por Jerzy Neyman y Egon Pearson en un periódico en 1933. La lema Neyman-Pearson es parte de la teoría Neyman-Pearson de las pruebas estadísticas, que introdujo conceptos como errores del segundo tipo, función de poder y comportamiento inductivo. La anterior teoría pesqueña de las pruebas de significado postuló sólo una hipótesis. Al introducir una hipótesis concurrente, el sabor de las pruebas estadísticas Neyman-Pearsonian permite investigar los dos tipos de errores. Los casos triviales donde uno siempre rechaza o acepta la hipótesis nula son de poco interés, pero sí demuestra que uno no debe renunciar al control sobre un tipo de error mientras calibra el otro. Neyman y Pearson procedieron a restringir su atención a la clase de todos pruebas de nivel mientras que posteriormente minimiza el error tipo II, tradicionalmente denotado por . Su papel seminal de 1933, incluyendo la lema Neyman-Pearson, llega al final de este esfuerzo, no sólo mostrando la existencia de pruebas con la mayor potencia que conservan un nivel predeterminado de error tipo I (), pero también proporcionar una manera de construir tales pruebas. El teorema Karlin-Rubin extiende la lema Neyman-Pearson a configuraciones que implican hipótesis compuestas con ratios de probabilidad monotona.
Declaración
Considere una prueba con hipótesis y , donde la función de densidad de probabilidad (o función de masa de probabilidad) para .
Para cualquier prueba de hipótesis con conjunto de rechazo , y , decimos que se satisface la condición si
- Es decir, la prueba tiene tamaño (es decir, la probabilidad de rechazar falsamente la hipótesis nula es ).
- tales que
Donde es un conjunto ignorable en ambos y casos: .- Es decir, tenemos una prueba de relación de probabilidad estricta, excepto en un subconjunto ignorable.
Para cualquier , que el conjunto de nivel pruebas son el conjunto de todas las pruebas de hipótesis con tamaño a la mayoría . Es decir, dejar que su sistema de rechazo sea , tenemos .
Neyman-Pearson lemma—Existencia:
Si una hipótesis prueba satisfizo condición, entonces es una prueba uniformemente más potente (UMP) en el conjunto de nivel pruebas.
Unicidad:Si existe una prueba de hipótesis que satisfice condición, con entonces cada prueba UMP en el conjunto de niveles pruebas satisfichas condición con la misma .
Además, la prueba y el test de acuerdo con probabilidad si o .
En la práctica, el índice de verosimilitud se utiliza a menudo directamente para elaborar pruebas (consulte prueba de índice de verosimilitud). Sin embargo, también se puede utilizar para sugerir estadísticas de prueba particulares que podrían ser de interés o para sugerir pruebas simplificadas; para esto, se considera la manipulación algebraica de la razón para ver si contiene estadísticas clave relacionadas con el tamaño de la razón (es decir, si una estadística grande corresponde a una proporción pequeña o grande).
Dada cualquier prueba de hipótesis con conjunto de rechazo , definir su función de potencia estadística .
Existencia:
Dada alguna prueba de hipótesis que satisfice condición, llame a su región de rechazo (donde NP representa a Neyman-Pearson).
Para cualquier nivel prueba de hipótesis con región de rechazo tenemos excepto en un conjunto ignorable .
Entonces integrelo sobre para obtener .
Desde y , encontramos que .
Así el prueba de rechazo es una prueba UMP en el conjunto de nivel pruebas.
Unicidad:
Para cualquier otro nivel de UMP test, con región de rechazo , tenemos de la parte de la Existencia, .
Desde La prueba es UMP, el lado izquierdo debe ser cero. Desde el lado derecho da Así que... test tiene tamaño .
Desde el componente es no negativo, e integra a cero, debe ser exactamente cero excepto en un conjunto ignorable .
Desde test satisfies condición, que los ignorantes se establezcan en la definición de condición .
es ignorable, ya que para todos , tenemos .
Análogamente, es ignorable.
Define (donde) significa diferencia simétrica). Es la unión de tres conjuntos ignorables, así es un conjunto ignorable.
Entonces tenemos y . Así que... prueba de rechazo satisfios condición con la misma .
Desde es ignorable, su subconjunto es también ignorable. En consecuencia, las dos pruebas coinciden con la probabilidad si o .
Ejemplo
Vamos. ser una muestra aleatoria de la distribución donde la media es conocido, y supone que deseamos probar contra la . La probabilidad de este conjunto de datos normalmente distribuidos es
Podemos calcular el índice de verosimilitud para encontrar la estadística clave en esta prueba y su efecto en el resultado de la prueba:
Esta relación solo depende de los datos a través de . Por lo tanto, por la lema Neyman-Pearson, la prueba más poderosa de este tipo de hipótesis para estos datos dependerá solamente de . También, por inspección, podemos ver que si Entonces es una función decreciente . Así que debemos rechazar si es suficientemente grande. El umbral de rechazo depende del tamaño de la prueba. En este ejemplo, se puede demostrar que la estadística de prueba es una variable aleatoria distribuida a escala Chi-square y se puede obtener un valor crítico exacto.
Aplicación en economía
Una variante del lema de Neyman-Pearson ha encontrado una aplicación en el dominio aparentemente no relacionado de la economía del valor de la tierra. Uno de los problemas fundamentales de la teoría del consumidor es calcular la función de demanda del consumidor dados los precios. En particular, dada una propiedad de tierra heterogénea, una medida de precio sobre la tierra y una medida de utilidad subjetiva sobre la tierra, el problema del consumidor es calcular la mejor parcela de tierra que puede comprar, es decir, la parcela de tierra con la mayor utilidad, cuyo precio es como máximo su presupuesto. Resulta que este problema es muy similar al problema de encontrar la prueba estadística más potente, por lo que se puede utilizar el lema de Neyman-Pearson.
Usos en ingeniería eléctrica
El lema de Neyman-Pearson es bastante útil en ingeniería electrónica, concretamente en el diseño y uso de sistemas de radar, sistemas de comunicación digital y sistemas de procesamiento de señales. En los sistemas de radar, el lema de Neyman-Pearson se utiliza para establecer primero la tasa de detecciones perdidas en un nivel deseado (bajo) y luego minimizar la tasa de falsas alarmas, o viceversa. Ni las falsas alarmas ni las detecciones perdidas pueden establecerse a tasas arbitrariamente bajas, incluido cero. Todo lo anterior se aplica también a muchos sistemas de procesamiento de señales.
Usos en física de partículas
El lema de Neyman-Pearson se aplica a la construcción de ratios de verosimilitud específicos del análisis, utilizado, por ejemplo, para prueba de firmas de nueva física frente a la predicción nominal del Modelo Estándar en conjuntos de datos de colisiones protón-protón recopilados en el LHC.
Descubrimiento del lema
Neyman escribió sobre el descubrimiento del lema de la siguiente manera. Se han insertado saltos de párrafo.
Puedo señalar el momento particular cuando entendí cómo formular el problema desdogmático de la prueba más poderosa de una simple hipótesis estadística contra una alternativa simple fija. En la actualidad [probablemente 1968], el problema aparece totalmente trivial y al alcance fácil de un primer grado. Pero, con cierto grado de vergüenza, debo confesar que tomó algo como media década de esfuerzo combinado de E. S. P. [Egon Pearson] y yo mismo para aclarar las cosas.
La solución de la pregunta particular mencionada llegó una noche cuando estaba sentado solo en mi habitación en el Laboratorio Estadístico de la Escuela de Agricultura de Varsovia, pensando duro en algo que debería haber sido obvio mucho antes. El edificio estaba encerrado y, a las 8 p.m., escuché voces fuera llamándome. Esta era mi esposa, con algunos amigos, diciéndome que era hora de ir a una película.
Mi primera reacción fue la de la molestia. Y entonces, como me levanté de mi escritorio para responder a la llamada, de repente entendí: para cualquier región crítica dada y para cualquier hipótesis alternativa dada, es posible calcular la probabilidad del error del segundo tipo; está representado por esta integral particular. Una vez hecho esto, la región crítica óptima sería la que minimiza esta misma integral, sujeta a la condición lateral que se refiere a la probabilidad del error del primer tipo. Nos enfrentamos a un problema particular del cálculo de la variación, probablemente un problema simple.
Estos pensamientos llegaron en un flash, antes de llegar a la ventana para señalar a mi esposa. El incidente está claro en mi memoria, pero no recuerdo la película que vimos. Puede haber sido Buster Keaton.
Contenido relacionado
Conjunto vacío
Historia de la lógica
Ley de los grandes números