Probabilidad

La probabilidad es la rama de las matemáticas que se ocupa de las descripciones numéricas de la probabilidad de que ocurra un evento, o de la probabilidad de que una proposición sea verdadera. La probabilidad de un evento es un número entre 0 y 1, donde, en términos generales, 0 indica imposibilidad del evento y 1 indica certeza. Cuanto mayor sea la probabilidad de un evento, más probable es que el evento ocurra. Un ejemplo simple es el lanzamiento de una moneda justa (imparcial). Dado que la moneda es justa, los dos resultados ("cara" y "cruz") son igualmente probables; la probabilidad de "cara" es igual a la probabilidad de "cruz"; y dado que no son posibles otros resultados, la probabilidad de "cara" o "cruz" es 1/2 (que también podría escribirse como 0,5 o 50%).
A estos conceptos se les ha dado una formalización matemática axiomática en la teoría de la probabilidad, que se usa ampliamente en áreas de estudio como estadística, matemáticas, ciencia, finanzas, juegos de azar, inteligencia artificial, aprendizaje automático, ciencias de la computación, teoría de juegos y filosofía para, por ejemplo, por ejemplo, sacar inferencias sobre la frecuencia esperada de eventos. La teoría de la probabilidad también se usa para describir la mecánica subyacente y las regularidades de los sistemas complejos.
Interpretaciones
Cuando se trata de experimentos aleatorios y bien definidos en un entorno puramente teórico (como lanzar una moneda), las probabilidades se pueden describir numéricamente por el número de resultados deseados, dividido por el número total de todos los resultados. Por ejemplo, lanzar una moneda dos veces arrojará resultados "cara-cara", "cara-cruz", "cruz-cara" y "cruz-cruz". La probabilidad de obtener un resultado de "cara a cara" es de 1 de 4 resultados o, en términos numéricos, 1/4, 0,25 o 25%. Sin embargo, cuando se trata de la aplicación práctica, existen dos categorías principales en competencia de interpretaciones de probabilidad, cuyos adherentes tienen diferentes puntos de vista sobre la naturaleza fundamental de la probabilidad:
- Los objetivistas asignan números para describir algún estado de cosas objetivo o físico. La versión más popular de la probabilidad objetiva es la probabilidad frecuentista, que afirma que la probabilidad de un evento aleatorio denota la frecuencia relativa de ocurrencia del resultado de un experimento cuando el experimento se repite indefinidamente. Esta interpretación considera que la probabilidad es la frecuencia relativa "a largo plazo" de los resultados. Una modificación de esto es la probabilidad de propensión, que interpreta la probabilidad como la tendencia de algún experimento a producir un resultado determinado, incluso si se realiza una sola vez.
- Los subjetivistas asignan números por probabilidad subjetiva, es decir, como un grado de creencia. El grado de creencia se ha interpretado como "el precio al que compraría o vendería una apuesta que paga 1 unidad de utilidad si E, 0 si no E", aunque esa interpretación no está universalmente aceptada. La versión más popular de la probabilidad subjetiva es la probabilidad bayesiana, que incluye conocimientos de expertos y datos experimentales para generar probabilidades. El conocimiento experto está representado por alguna distribución de probabilidad previa (subjetiva). Estos datos se incorporan en una función de verosimilitud. El producto de la probabilidad anterior y la probabilidad, cuando se normaliza, da como resultado una distribución de probabilidad posterior que incorpora toda la información conocida hasta la fecha.Por el teorema de concordancia de Aumann, los agentes bayesianos cuyas creencias previas son similares terminarán con creencias posteriores similares. Sin embargo, antecedentes suficientemente diferentes pueden conducir a conclusiones diferentes, independientemente de la cantidad de información que compartan los agentes.
Etimología
La palabra probabilidad deriva del latín probabilitas , que también puede significar "probidad", una medida de la autoridad de un testigo en un caso legal en Europa, y a menudo se correlaciona con la nobleza del testigo. En cierto sentido, esto difiere mucho del significado moderno de probabilidad , que, por el contrario, es una medida del peso de la evidencia empírica y se obtiene a partir del razonamiento inductivo y la inferencia estadística.
Historia
El estudio científico de la probabilidad es un desarrollo moderno de las matemáticas. Los juegos de azar muestran que ha habido interés en cuantificar las ideas de probabilidad durante milenios, pero las descripciones matemáticas exactas surgieron mucho más tarde. Hay razones para el lento desarrollo de las matemáticas de la probabilidad. Mientras que los juegos de azar proporcionaron el ímpetu para el estudio matemático de la probabilidad, las supersticiones de los jugadores aún oscurecen las cuestiones fundamentales.
Según Richard Jeffrey, "Antes de mediados del siglo XVII, el término 'probable' (en latín probabilis ) significaba aprobable , y se aplicaba en ese sentido, unívocamente, a la opinión y a la acción. Una acción u opinión probable era tal como la gente sensata emprendería o mantendría, dadas las circunstancias". Sin embargo, especialmente en contextos legales, 'probable' también podría aplicarse a proposiciones para las cuales había buena evidencia.
El erudito italiano del siglo XVI, Gerolamo Cardano, demostró la eficacia de definir las probabilidades como la proporción entre los resultados favorables y los desfavorables (lo que implica que la probabilidad de un evento viene dada por la proporción entre los resultados favorables y el número total de resultados posibles ). Aparte del trabajo elemental de Cardano, la doctrina de las probabilidades data de la correspondencia de Pierre de Fermat y Blaise Pascal (1654). Christiaan Huygens (1657) dio el primer tratamiento científico conocido del tema. Ars Conjectandi de Jakob Bernoulli (póstumo, 1713) y Doctrine of Chances de Abraham de Moivre (1718) trataron el tema como una rama de las matemáticas. Ver El surgimiento de la probabilidad de Ian Hackingy The Science of Conjecture de James Franklin para las historias del desarrollo temprano del concepto mismo de probabilidad matemática.
La teoría de los errores se remonta a la Opera Miscellanea de Roger Cotes (póstuma, 1722), pero una memoria preparada por Thomas Simpson en 1755 (impresa en 1756) aplicó por primera vez la teoría a la discusión de los errores de observación. La reimpresión (1757) de esta memoria establece los axiomas de que los errores positivos y negativos son igualmente probables y que ciertos límites asignables definen el rango de todos los errores. Simpson también analiza los errores continuos y describe una curva de probabilidad.
Las dos primeras leyes del error que se propusieron se originaron con Pierre-Simon Laplace. La primera ley se publicó en 1774 y establecía que la frecuencia de un error podía expresarse como una función exponencial de la magnitud numérica del error, sin tener en cuenta el signo. La segunda ley del error fue propuesta en 1778 por Laplace y estableció que la frecuencia del error es una función exponencial del cuadrado del error. La segunda ley del error se llama distribución normal o ley de Gauss. "Es difícil históricamente atribuir esa ley a Gauss, quien a pesar de su conocida precocidad probablemente no había hecho este descubrimiento antes de los dos años".
Daniel Bernoulli (1778) introdujo el principio del máximo producto de las probabilidades de un sistema de errores concurrentes.
Adrien-Marie Legendre (1805) desarrolló el método de los mínimos cuadrados y lo introdujo en sus Nouvelles méthodes pour la détermination des orbites des comètes ( Nuevos métodos para determinar las órbitas de los cometas ). Ignorando la contribución de Legendre, un escritor irlandés-estadounidense, Robert Adrian, editor de "The Analyst" (1808), dedujo por primera vez la ley de la facilidad de error,
donde es una constante que depende de la precisión de la observación, y
es un factor de escala que asegura que el área bajo la curva es igual a 1. Dio dos demostraciones, siendo la segunda esencialmente la misma que la de John Herschel (1850). Gauss dio la primera prueba que parece haber sido conocida en Europa (la tercera después de la de Adrian) en 1809. Laplace (1810, 1812), Gauss (1823), James Ivory (1825, 1826), Hagen (1837) dieron más pruebas. ), Friedrich Bessel (1838), WF Donkin (1844, 1856) y Morgan Crofton (1870). Otros colaboradores fueron Ellis (1844), De Morgan (1864), Glaisher (1872) y Giovanni Schiaparelli (1875). La fórmula de Peters (1856) para r , el error probable de una sola observación, es bien conocida.
En el siglo XIX, los autores de la teoría general incluyeron a Laplace, Sylvestre Lacroix (1816), Littrow (1833), Adolphe Quetelet (1853), Richard Dedekind (1860), Helmert (1872), Hermann Laurent (1873), Liagre, Didion y Karl Pearson. Augustus De Morgan y George Boole mejoraron la exposición de la teoría.
En 1906, Andrey Markov introdujo la noción de cadenas de Markov, que jugó un papel importante en la teoría de procesos estocásticos y sus aplicaciones. La teoría moderna de la probabilidad basada en la teoría de la medida fue desarrollada por Andrey Kolmogorov en 1931.
En el lado geométrico, los colaboradores de The Educational Times fueron influyentes (Miller, Crofton, McColl, Wolstenholme, Watson y Artemas Martin). Ver geometría integral para más información.
Teoría
Al igual que otras teorías, la teoría de la probabilidad es una representación de sus conceptos en términos formales, es decir, en términos que pueden considerarse por separado de su significado. Estos términos formales son manipulados por las reglas de las matemáticas y la lógica, y cualquier resultado es interpretado o traducido al dominio del problema.
Ha habido al menos dos intentos exitosos de formalizar la probabilidad, a saber, la formulación de Kolmogorov y la formulación de Cox. En la formulación de Kolmogorov (ver también espacio de probabilidad), los conjuntos se interpretan como eventos y la probabilidad como una medida de una clase de conjuntos. En el teorema de Cox, la probabilidad se toma como una primitiva (es decir, no se analiza más), y el énfasis está en construir una asignación consistente de valores de probabilidad a las proposiciones. En ambos casos, las leyes de probabilidad son las mismas, excepto por los detalles técnicos.
Existen otros métodos para cuantificar la incertidumbre, como la teoría de Dempster-Shafer o la teoría de la posibilidad, pero son esencialmente diferentes y no compatibles con las leyes de probabilidad generalmente entendidas.
Aplicaciones
La teoría de la probabilidad se aplica en la vida cotidiana en la evaluación y modelización de riesgos. La industria y los mercados de seguros utilizan la ciencia actuarial para determinar los precios y tomar decisiones comerciales. Los gobiernos aplican métodos probabilísticos en la regulación ambiental, el análisis de derechos y la regulación financiera.
Un ejemplo del uso de la teoría de la probabilidad en el comercio de acciones es el efecto de la probabilidad percibida de cualquier conflicto generalizado en Oriente Medio sobre los precios del petróleo, que tiene un efecto dominó en la economía en su conjunto. Una evaluación por parte de un comerciante de productos básicos de que es más probable que haya una guerra puede hacer que los precios de ese producto suban o bajen, y señala a otros comerciantes de esa opinión. En consecuencia, las probabilidades no se evalúan de forma independiente ni necesariamente racional. La teoría de las finanzas conductuales surgió para describir el efecto de tal pensamiento grupal sobre los precios, las políticas y la paz y los conflictos.
Además de la evaluación financiera, la probabilidad se puede utilizar para analizar tendencias biológicas (p. ej., propagación de enfermedades), así como ecológicas (p. ej., cuadrados de Punnett biológicos). Al igual que con las finanzas, la evaluación de riesgos se puede utilizar como una herramienta estadística para calcular la probabilidad de que ocurran eventos no deseados y puede ayudar a implementar protocolos para evitar encontrarse con tales circunstancias. La probabilidad se utiliza para diseñar juegos de azar para que los casinos puedan obtener una ganancia garantizada y, al mismo tiempo, ofrecer pagos a los jugadores con la frecuencia suficiente para alentar la continuación del juego.
Otra aplicación significativa de la teoría de la probabilidad en la vida cotidiana es la confiabilidad. Muchos productos de consumo, como automóviles y productos electrónicos de consumo, utilizan la teoría de la confiabilidad en el diseño del producto para reducir la probabilidad de falla. La probabilidad de falla puede influir en las decisiones de un fabricante sobre la garantía de un producto.
El modelo de lenguaje de caché y otros modelos de lenguaje estadístico que se utilizan en el procesamiento del lenguaje natural también son ejemplos de aplicaciones de la teoría de la probabilidad.
Tratamiento matemático
Considere un experimento que puede producir una serie de resultados. La colección de todos los resultados posibles se denomina espacio muestral del experimento, a veces denotado como . El conjunto potencia del espacio muestral se forma considerando todas las diferentes colecciones de posibles resultados. Por ejemplo, lanzar un dado puede producir seis resultados posibles. Una colección de posibles resultados da un número impar en el dado. Así, el subconjunto {1,3,5} es un elemento del conjunto potencia del espacio muestral de tiradas de dados. Estas colecciones se denominan "eventos". En este caso, {1,3,5} es el evento de que el dado cae en algún número impar. Si los resultados que realmente ocurren caen en un evento dado, se dice que el evento ha ocurrido.
Una probabilidad es una forma de asignar a cada evento un valor entre cero y uno, con el requisito de que el evento formado por todos los resultados posibles (en nuestro ejemplo, el evento {1,2,3,4,5,6}) sea asignó un valor de uno. Para calificar como una probabilidad, la asignación de valores debe cumplir el requisito de que para cualquier colección de eventos mutuamente excluyentes (eventos sin resultados comunes, como los eventos {1,6}, {3} y {2,4}) , la probabilidad de que ocurra al menos uno de los eventos está dada por la suma de las probabilidades de todos los eventos individuales.
La probabilidad de un evento A se escribe como ,
, o
. Esta definición matemática de probabilidad puede extenderse a espacios muestrales infinitos, e incluso espacios muestrales incontables, utilizando el concepto de medida.
El opuesto o complemento de un evento A es el evento [no A ] (es decir, el evento de que A no ocurre), a menudo denotado como ,
, o
; su probabilidad viene dada por P (no A ) = 1 − P ( A ) . Como ejemplo, la posibilidad de no sacar un seis en un dado de seis caras es 1 – (posibilidad de sacar un seis)
. Para un tratamiento más completo, ver Evento complementario.
Si dos eventos A y B ocurren en una sola realización de un experimento, esto se denomina intersección o probabilidad conjunta de A y B , denotada como .
Eventos independientes
Si dos eventos, A y B son independientes, entonces la probabilidad conjunta es
Por ejemplo, si se lanzan dos monedas, entonces la posibilidad de que ambas salgan cara es .
Eventos mutuamente excluyentes
Si el evento A o el evento B pueden ocurrir pero nunca ambos simultáneamente, entonces se denominan eventos mutuamente excluyentes.
Si dos eventos son mutuamente excluyentes, entonces la probabilidad de que ambos ocurran se denota como y
Si dos eventos son mutuamente excluyentes, entonces la probabilidad de que ocurra cualquiera se denota como y
Por ejemplo, la posibilidad de sacar un 1 o un 2 en un dado de seis caras es
Eventos no mutuamente excluyentes
Si los eventos no son mutuamente excluyentes entonces
Por ejemplo, al sacar una carta de una baraja de cartas, la posibilidad de obtener una carta de corazón o figura (J, Q, K) (o ambas) es , ya que entre las 52 cartas de una baraja, 13 son corazones, 12 son figuras y 3 son ambos: aquí las posibilidades incluidas en los "3 que son ambos" se incluyen en cada uno de los "13 corazones" y los "12 figuras", pero solo debe contarse una vez.
La probabilidad condicional
La probabilidad condicional es la probabilidad de algún evento A , dada la ocurrencia de algún otro evento B. La probabilidad condicional se escribe , y se lee "la probabilidad de A dada B ". se define por
Si entonces
está formalmente indefinido por esta expresión. En este caso
y
son independientes, ya que
. Sin embargo, es posible definir una probabilidad condicional para algunos eventos de probabilidad cero utilizando un álgebra σ de dichos eventos (como los que surgen de una variable aleatoria continua).
Por ejemplo, en una bolsa de 2 bolas rojas y 2 bolas azules (4 bolas en total), la probabilidad de sacar una bola roja es ; sin embargo, al tomar una segunda bola, la probabilidad de que sea roja o azul depende de la bola tomada previamente. Por ejemplo, si se toma una bola roja, entonces la probabilidad de sacar una bola roja nuevamente sería
, ya que solo habrían quedado 1 bola roja y 2 azules. Y si previamente se sacó una bola azul, la probabilidad de sacar una bola roja será
.
Probabilidad inversa
En teoría y aplicaciones de probabilidad, la regla de Bayes relaciona las probabilidades de un evento al evento
, antes (anterior a) y después (posterior a) condicionado en otro evento
. las probabilidades en
al evento
es simplemente la razón de las probabilidades de los dos eventos. Cuando arbitrariamente muchos eventos
son de interés, no solo dos, la regla se puede reformular como posterior es proporcional a la probabilidad de tiempos anteriores ,
donde el símbolo de proporcionalidad significa que el lado izquierdo es proporcional a (es decir, es igual a una constante por) el lado derecho como
varía, para fijo o dado
(Lee, 2012; Bertsch McGrayne, 2012). De esta forma se remonta a Laplace (1774) ya Cournot (1843); ver Fienberg (2005). Ver Probabilidad inversa y regla de Bayes.
Resumen de probabilidades
Evento | Probabilidad |
---|---|
A | |
No un | |
A o B | |
A y B | |
A dado B | |
Relación con la aleatoriedad y la probabilidad en la mecánica cuántica
En un universo determinista, basado en conceptos newtonianos, no habría probabilidad si se conocieran todas las condiciones (demonio de Laplace), (pero hay situaciones en las que la sensibilidad a las condiciones iniciales supera nuestra capacidad para medirlas, es decir, conocerlas). En el caso de una rueda de ruleta, si se conocen la fuerza de la mano y el período de esa fuerza, el número en el que se detendrá la bola sería una certeza (aunque en la práctica, esto probablemente solo sería cierto para un rueda de la ruleta que no había sido exactamente nivelada, como reveló el casino newtoniano de Thomas A. Bass). Esto también supone el conocimiento de la inercia y la fricción de la rueda, el peso, la suavidad y la redondez de la bola, las variaciones en la velocidad de la mano durante el giro, etc. Por lo tanto, una descripción probabilística puede ser más útil que la mecánica newtoniana para analizar el patrón de resultados de tiradas repetidas de una rueda de ruleta. Los físicos se enfrentan a la misma situación en la teoría cinética de los gases, donde el sistema, aunque deterministaen principio , es tan complejo (con el número de moléculas típicamente del orden de magnitud de la constante de Avogadro6.02 × 10 ) que solo es factible una descripción estadística de sus propiedades.
Se requiere la teoría de la probabilidad para describir los fenómenos cuánticos. Un descubrimiento revolucionario de la física de principios del siglo XX fue el carácter aleatorio de todos los procesos físicos que ocurren a escalas subatómicas y se rigen por las leyes de la mecánica cuántica. La función de onda objetiva evoluciona de forma determinista pero, según la interpretación de Copenhague, se trata de probabilidades de observación, y el resultado se explica por un colapso de la función de onda cuando se realiza una observación. Sin embargo, la pérdida del determinismo en aras del instrumentalismo no encontró la aprobación universal. Albert Einstein comentó en una famosa carta a Max Born: "Estoy convencido de que Dios no juega a los dados".Al igual que Einstein, Erwin Schrödinger, quien descubrió la función de onda, creía que la mecánica cuántica es una aproximación estadística de una realidad determinista subyacente. En algunas interpretaciones modernas de la mecánica estadística de la medición, se invoca la decoherencia cuántica para dar cuenta de la aparición de resultados experimentales subjetivamente probabilísticos.
Contenido relacionado
Conjunto vacío
Historia de la lógica
Símbolo Mayor que (>)
Menor que <
Abscisa y ordenada