Teorema de Cox

Ajustar Compartir Imprimir Citar

El teorema de Cox, llamado así por el físico Richard Threlkeld Cox, es una derivación de las leyes de la teoría de la probabilidad a partir de un cierto conjunto de postulados. Esta derivación justifica la llamada interpretación "lógica" de la probabilidad, ya que las leyes de probabilidad derivadas del teorema de Cox son aplicables a cualquier proposición. La probabilidad lógica (también conocida como bayesiana objetiva) es un tipo de probabilidad bayesiana. Otras formas de bayesianismo, como la interpretación subjetiva, reciben otras justificaciones.

Suposiciones de Cox

Cox quería que su sistema cumpliera las siguientes condiciones:

  1. Divisibilidad y comparabilidad: la plausibilidad de una proposición es un número real y depende de la información que tenemos relacionada con la proposición.
  2. Sentido común: las plausibilidades deben variar considerablemente con la evaluación de las plausibilidades en el modelo.
  3. Consistencia: si la plausibilidad de una proposición se puede derivar de muchas maneras, todos los resultados deben ser iguales.

Los postulados que se establecen aquí están tomados de Arnborg y Sjödin. El "sentido común" incluye la coherencia con la lógica aristotélica en el sentido de que las proposiciones lógicamente equivalentes tendrán la misma plausibilidad.

Los postulados establecidos originalmente por Cox no eran matemáticamente rigurosos (aunque más que la descripción informal anterior), como señaló Halpern. Sin embargo, parece posible aumentarlos con varias suposiciones matemáticas hechas implícita o explícitamente por Cox para producir una prueba válida.

Notación de Cox:La plausibilidad de una proposición Adada cierta información relacionada Xse denota por {displaystyle Amid X}.

Los postulados de Cox y las ecuaciones funcionales son:

En forma de ecuación funcional{displaystyle ABmid X=g(Amid X,Bmid AX)}Debido a la naturaleza asociativa de la conjunción en la lógica proposicional, la coherencia con la lógica da una ecuación funcional que dice que la función gramoes una operación binaria asociativa.

Todas las operaciones binarias asociativas estrictamente crecientes en los números reales son isomorfas a la multiplicación de números en un subintervalo de [0, +∞], lo que significa que hay una función monótona que wasigna plausibilidades a [0, +∞] tal que{displaystyle w(ABmid X)=w(Amid X)w(Bmid AX)}

{displaystyle w(Bmid X)=w(Amid X)w(Bmid X)}Esto será válido para cualquier proposición Bque conduzca a{ estilo de visualización w (A  mid X) = 1}

{displaystyle w(Amid X)=w(Bmid X)w(Amid X)}Esto será válido para cualquier proposición Bque, sin pérdida de generalidad, conduzca a una solución{displaystyle w(Amid X)=0}Debido al requisito de monotonicidad, esto significa que wasigna plausibilidades al intervalo [0, 1].

Esto postula la existencia de una función Ftal que{displaystyle w({text{no }}Amid X)=f(w(Amid X))}Debido a que "un doble negativo es un afirmativo", la coherencia con la lógica da una ecuación funcional{ estilo de visualización f (f (x)) = x,}diciendo que la función Fes una involución, es decir, es su propia inversa.

Las ecuaciones funcionales anteriores y la coherencia con la lógica implican que{displaystyle w(ABmid X)=w(Amid X)f(w({text{not }}Bmid AX))=w(Amid X)fleft({w(A{text{ no }}Bmid X) over w(Amid X)}right)}Como ABes lógicamente equivalente a licenciado en Letras, también obtenemos{displaystyle w(Amid X)fleft({w(A{text{ not }}Bmid X) over w(Amid X)}right)=w(Bmid X)fleft({w(B{text{ not }}Amid X) over w(Bmid X)}right)}Si, en particular, {displaystyle B={text{ no }}(AD)}, entonces también {displaystyle A{text{ no }}B={text{no }}B}y {displaystyle B{text{ no }}A={text{ no }}A}y obtenemos{displaystyle w(A{text{ no }}Bmid X)=w({text{not }}Bmid X)=f(w(Bmid X))}y{displaystyle w(B{text{ no }}Amid X)=w({text{not }}Amid X)=f(w(Amid X))}Abreviando {displaystyle w(Amid X)=x}y {displaystyle w(Bmid X)=y}obtenemos la ecuación funcional{displaystyle x,fleft({f(y) over x}right)=y,fleft({f(x) over y}right)}

Implicaciones de los postulados de Cox

Las leyes de probabilidad derivables de estos postulados son las siguientes. Sea { estilo de visualización A  medio B}la plausibilidad de la proposición Adada Bsatisfaciendo los postulados de Cox. Entonces hay una función wque asigna plausibilidades al intervalo [0,1] y un número positivo metrotal que

  1. La certeza está representada por{displaystyle w(Amid B)=1.}
  2. {displaystyle w^{m}(A|B)+w^{m}({text{no}}Amid B)=1.}
  3. {displaystyle w(ABmid C)=w(Amid C)w(Bmid AC)=w(Bmid C)w(Amid BC).}

Es importante notar que los postulados implican solo estas propiedades generales. Podemos recuperar las leyes habituales de probabilidad estableciendo una nueva función, denotada convencionalmente PAGSo Pr, igual a { estilo de visualización w^{m}}. Entonces obtenemos las leyes de probabilidad en una forma más familiar:

  1. Cierta verdad está representada por { estilo de visualización  Pr (A  mid B) = 1}, y cierta falsedad por{ estilo de visualización  Pr (A  mid B) = 0.}
  2. {displaystyle Pr(Amid B)+Pr({text{not }}Amid B)=1.}
  3. {displaystyle Pr(ABmid C)=Pr(Amid C)Pr(Bmid AC)=Pr(Bmid C)Pr(Amid BC).}

La regla 2 es una regla para la negación y la regla 3 es una regla para la conjunción. Dado que cualquier proposición que contenga conjunción, disyunción y negación puede reformularse de manera equivalente usando solo conjunción y negación (la forma normal conjuntiva), ahora podemos manejar cualquier proposición compuesta.

Las leyes así derivadas producen una aditividad finita de probabilidad, pero no una aditividad contable. La formulación teórica de medida de Kolmogorov asume que una medida de probabilidad es contablemente aditiva. Esta condición ligeramente más fuerte es necesaria para la demostración de ciertos teoremas.

Interpretación y discusión adicional

El teorema de Cox ha llegado a utilizarse como una de las justificaciones para el uso de la teoría de la probabilidad bayesiana. Por ejemplo, en Jaynes se analiza en detalle en los capítulos 1 y 2 y es la piedra angular del resto del libro. La probabilidad se interpreta como un sistema formal de lógica, la extensión natural de la lógica aristotélica (en la que cada afirmación es verdadera o falsa) al ámbito del razonamiento en presencia de incertidumbre.

Se ha debatido en qué medida el teorema excluye modelos alternativos para razonar sobre la incertidumbre. Por ejemplo, si se eliminaran ciertos supuestos matemáticos "poco intuitivos", se podrían idear alternativas, por ejemplo, un ejemplo proporcionado por Halpern. Sin embargo, Arnborg y Sjödin sugieren postulados adicionales de "sentido común", que permitirían relajar los supuestos en algunos casos y descartar el ejemplo de Halpern. Hardy o Dupré y Tipler idearon otros enfoques.

La formulación original del teorema de Cox se encuentra en Cox (1946), que se amplía con resultados adicionales y más discusión en Cox (1961). Jaynes cita a Abel por el primer uso conocido de la ecuación funcional de asociatividad. János Aczél proporciona una larga prueba de la "ecuación de asociatividad" (páginas 256-267). Jaynes reproduce la prueba más breve de Cox en la que se supone diferenciabilidad. Una guía del teorema de Cox de Van Horn tiene como objetivo presentar al lector de manera integral todas estas referencias.