La desigualdad de Hoeffding

format_list_bulleted Contenido keyboard_arrow_down
ImprimirCitar

En teoría de la probabilidad, la desigualdad de Hoeffding proporciona un límite superior a la probabilidad de que la suma de variables aleatorias independientes acotadas se desvíe de su valor esperado en más de una determinada cantidad. La desigualdad de Hoeffding fue demostrada por Wassily Hoeffding en 1963.

La desigualdad de Hoeffding es un caso especial de la desigualdad de Azuma-Hoeffding y de la desigualdad de McDiarmid. Es similar al límite de Chernoff, pero tiende a ser menos nítido, en particular cuando la varianza de las variables aleatorias es pequeña. Es similar, pero incomparable, a una de las desigualdades de Bernstein.

Declaración

Vamos. X1,... Xn ser variables aleatorias independientes Casi seguro. Considere la suma de estas variables aleatorias,

Entonces el teorema de Hoeffding establece que, para todos los t > 0,

Aquí E[Sn] es el valor esperado de Sn.

Tenga en cuenta que las desigualdades también se cumplen cuando los Xi se han obtenido utilizando muestreo sin reemplazo.; en este caso las variables aleatorias ya no son independientes. Una prueba de esta afirmación se puede encontrar en el artículo de Hoeffding. Para límites ligeramente mejores en el caso del muestreo sin reemplazo, véase, por ejemplo, el artículo de Serfling (1974).

Ejemplo

Suppose y para todos i. Esto puede ocurrir cuando Xi son variables independientes Bernoulli al azar, aunque no necesitan ser distribuidas de forma idéntica. Entonces tenemos la desigualdad

para todos . Esta es una versión del límite aditivo Chernoff que es más general, ya que permite variables aleatorias que toman valores entre cero y uno, pero también más débil, ya que el límite Chernoff da un mejor límite de cola cuando las variables aleatorias tienen pequeña varianza.

Caso general de variables aleatorias acotadas desde arriba

La desigualdad de Hoeffding se puede extender al caso de variables aleatorias acotadas desde arriba.

Vamos. X1,... Xn ser variables aleatorias independientes y Casi seguro. Denote by

La desigualdad de Hoeffding por obligarse de variables aleatorias superiores establece que para todos ,

En particular, si para todos , entonces para todos ,

Caso general de variables aleatorias subgaussianas

La prueba de la desigualdad de Hoeffding se puede generalizar a cualquier distribución subgaussiana. Recuerde que una variable aleatoria X se llama subgaussiana, si

para algunos c]0. Para cualquier variable fija X, para para algunos suficientemente grandes T. Entonces... para todos así que... rendimientos

para . Así que cada variable atada es sub-Gaussian.

Para una variable aleatoria X, la siguiente norma es finita si y sólo si X es subgaussiano:

Entonces deja que X1,..., Xn son variables aleatorias subgaussianas independientes de media cero, la versión general de la desigualdad de Hoeffding establece que:

donde c > 0 es una constante absoluta.

Prueba

La prueba de la desigualdad de Hoeffding se sigue de manera similar a las desigualdades de concentración como los límites de Chernoff. La principal diferencia es el uso del lema de Hoeffding:

Suppose X es una variable aleatoria real tal que Casi seguro. Entonces...

Usando esta lema, podemos probar la desigualdad de Hoeffding. Como en la declaración del teorema, supongamos X1,... Xn son n variables aleatorias independientes casi seguro para todos i, y dejar .

Luego, para s, t > 0, la desigualdad de Markov y la independencia de Xi implica:

Este límite superior es el mejor para el valor de s minimizando el valor dentro del exponencial. Esto se puede hacer fácilmente optimizando una cuadrática, dando

Escribiendo el límite anterior para este valor de s, obtenemos el límite deseado:

Uso

Intervalos de confianza

La desigualdad de Hoeffding se puede utilizar para obtener intervalos de confianza. Consideramos una moneda que muestra cabezas con probabilidad p y colas con probabilidad 1 − p. Tiramos la moneda n tiempos, generando n muestras (que son i.i.d Bernoulli variables aleatorias). El número esperado de veces que la moneda aparece cabezas es pn. Además, la probabilidad de que la moneda aparezca cabezas al menos k los tiempos pueden cuantificarse exactamente por la siguiente expresión:

donde H(n) es el número de cabezas en n lanzamientos de moneda.

Cuando k = (p + ε)n para algunos ε > 0, la desigualdad de Hoeffding limita esta probabilidad por un término que es exponencialmente pequeño en ε2 n:

Dado que este límite se cumple en ambos lados de la media, la desigualdad de Hoeffding implica que el número de caras que vemos se concentra alrededor de su media, con una cola exponencialmente pequeña.

Pensando en como el "observado" significa, esta probabilidad puede ser interpretada como el nivel de significación (probabilidad de cometer un error) para un intervalo de confianza alrededor de tamaño 2Î:

Encontrar n para el signo de desigualdad opuesto en lo anterior, es decir, n que viola la desigualdad pero no la igualdad anterior, nos da:

Por lo tanto, necesitamos al menos muestras para adquirir una - intervalo de confianza .

Por lo tanto, el costo de adquirir el intervalo de confianza es sublineal en términos de nivel de confianza y cuadrático en términos de precisión. Tenga en cuenta que existen métodos más eficientes para estimar un intervalo de confianza.

Contenido relacionado

Conjunto vacío

En matemáticas, el conjunto vacío es el conjunto único que no tiene elementos; su tamaño o cardinalidad es cero. Algunas teorías axiomáticas de...

Historia de la lógica

La historia de la lógica se ocupa del estudio del desarrollo de la ciencia de la inferencia válida tal como se encuentran en el Organon, encontraron una...

Ley de los grandes números

En la teoría de la probabilidad, la ley de los grandes números es un teorema que describe el resultado de realizar el mismo experimento un gran número de...
Más resultados...
Tamaño del texto:
undoredo
format_boldformat_italicformat_underlinedstrikethrough_ssuperscriptsubscriptlink
save