Teorema de Cox
O teorema de Cox, que recebe este nome em homenagem ao físico norte-americano Richard Threlkeld Cox, é uma derivação das leis da teoria das probabilidades a partir de um certo conjunto de postulados. Esta derivação justifica a então chamada interpretação "lógica" da probabilidade, já que as leis de probabilidade derivadas pelo teorema de Cox são aplicáveis a qualquer proposição. A probabilidade lógica, também chamada de bayesiana objetiva, é um tipo de probabilidade bayesiana. Outras formas de bayesianismo, tais como a interpretação subjetiva, recebem outras justificações.
Pressupostos de Cox
editarCox desejou que seu sistema satisfizesse as seguintes condições:
- Divisibilidade e comparabilidade — A plausibilidade de uma proposição é um número real e é dependente da informação que temos relacionada com a proposição.[1]
- Senso comum — Plausibilidades devem variar sensivelmente com a avaliação das plausibilidades no modelo.[2]
- Consistência – Se a plausibilidade de uma proposição pode ser derivada em muitas formas, todos os resultados devem ser iguais.[3]
"Senso comum" inclui consistência com a lógica aristotélica no sentido de que proposições logicamente equivalentes terão a mesma plausibilidade.
Os postulados como originalmente afirmados por Cox não eram matematicamente rigorosos.[4][5] No entanto, é possível aumentar estes postulados como vários pressupostos matemáticos feitos implícita ou explicitamente por Cox para produzir uma prova válida.
A notação de Cox é:
- A plausibilidade de uma proposição dada alguma informação relacionada é denotada por .
Os postulados de Cox e as equações funcionais são:
- A plausibilidade da conjunção de duas proposições , dada alguma informação relacionada , é determinada pela plausibilidade de dada e pela de dada . Na forma de uma equação funcional:
- Por causa da natureza associativa da conjunção na lógica proposicional, a consistência com a lógica dá uma equação funcional que diz que a função é uma operação binária associativa.
- Adicionalmente, Cox postula que a função é monótona. Todas as operações binárias associativas crescentes em números reais são isomórficas em relação à multiplicação dos números no intervalo , o que significa que há uma função que mapeia as plausibilidades em relação a , tal que:
- A plausibilidade de uma proposição determina a plausibilidade da negação da proposição. Isto postula a existência de uma função , tal que:
- Como "uma dupla negativa é uma afirmativa", a consistência com a lógica dá uma equação funcional:
- o que diz que a função é uma involução, isto é, é sua própria inversa.
- Além disso, Cox postula que a função é monótona. As equações funcionais acima e a consistência com a lógica implicam que:
- Já que é logicamente equivalente a , também temos:
- Se, em particular, , então e também e temos:
- e
- Abreviando e , temos a equação funcional:
Implicações dos postulados de Cox
editarAs leis de probabilidade deriváveis destes postulados são as seguintes.[6] Considere a plausibilidade da proposição dada que satisfaz os postulados de Cox. Então, há uma função que mapeia as plausibilidades em relação ao intervalo e um número positivo , tal que:
- A certeza é representada por .
- .
- .
É importante notar que os postulados implicam apenas estas propriedades gerais. Podemos recuperar as leis usuais de probabilidade ao configurar uma função nova, convencionalmente denotada ou , igual a . Então, obtêm-se as leis de probabilidade em uma forma mais familiar:
- A verdade certa é representada por e a falsidade certa por .
- .
- .
A segunda regra é uma regra para negação e a terceira regra é uma regra para conjunção. Dado que qualquer proposição contendo conjunção, disjunção e negação pode ser equivalentemente refraseada usando conjunção e negação apenas (a forma normal conjuntiva), pode-se agora manejar qualquer proposição composta.
As leis assim derivadas produzem aditividade finita de probabilidade, mas não aditividade contável. A formulação teórica da medida de Kolmogorov assume que uma medida de probabilidade é contavelmente aditiva. Esta condição levemente mais forte é necessária para a prova de certos teoremas.
Interpretação e discussão posterior
editarO teorema de Cox veio a ser usado como uma das justificações para o uso da teoria da probabilidade bayesiana. A probabilidade pode ser interpretada como um sistema formal da lógica, a extensão natural da lógica aristotélica (na qual toda afirmação é verdadeira ou falsa) no domínio do raciocínio na presença de incerteza.[6]
Tem-se debatido com que intensidade o teorema exclui modelos alternativos para raciocínio sobre incerteza. Por exemplo, se certos pressupostos matemáticos "não intuitivos" fossem descartados, então, alternativas poderiam ser concebidas.[4] No entanto, foram sugeridos postulados adicionais de "senso comum" que permitiriam o relaxamento dos pressupostos em alguns casos.[1][2][3] Outras abordagens em direção semelhante já foram desenvolvidas.[7][8]
Cox formulou pela primeira vez o teorema em 1946.[9] Em 1961, estendeu o teorema com resultados adicionais e mais discussões.[10] O matemático norueguês Niels Henrik Abel foi creditado por ter usado pela primeira vez a equação funcional de associatividade.[6][11] O matemático húngaro-canadense János Aczél ofereceu uma longa prova da equação de associatividade.[12]
Ver também
editarReferências
editar- ↑ a b Arnborg, Stefan; Sjödin, Gunnar (29 de maio de 2001). «On the foundations of Bayesianism» (PDF). AIP Conference Proceedings. Consultado em 6 de fevereiro de 2018
- ↑ a b Arnborg, Stefan; Sjödin, Gunnar (2003). «What is the plausibility of probability?» (PDF). Numerisk analys och datalogi, Kungl Tekniska Högskolan. Consultado em 6 de fevereiro de 2018
- ↑ a b Arnborg, Stefan; Sjödin, Gunnar (2000). «Bayes Rules in Finite Models» (PDF). Numerisk analys och datalogi, Kungl Tekniska Högskolan. Consultado em 6 de fevereiro de 2018
- ↑ a b Halpern, Joseph (1999). «A counterexample to theorems of Cox and Fine». Journal of Artificial intelligence Research. Consultado em 6 de fevereiro de 2018
- ↑ Halpern, Joseph (1999). «Technical Addendum, Cox's theorem Revisited». Journal of Artificial Intelligence Research. Consultado em 6 de fevereiro de 2018
- ↑ a b c Jaynes, Edwin (2003). Probability Theory: The Logic of Science (PDF). Cambridge: Cambridge University Press. 95 páginas. Consultado em 6 de fevereiro de 2018
- ↑ Hardy, Michael. «Scaled Boolean algebras». Advances in Applied Mathematics. 29 (2): 243–292. doi:10.1016/s0196-8858(02)00011-8
- ↑ Dupré, Maurice J.; Tipler, Frank J. (2009). «New axioms for rigorous Bayesian probability». Bayesian Analysis (em inglês). 4 (3): 599–606. ISSN 1936-0975. doi:10.1214/09-ba422
- ↑ Cox, Richard Threlkeld (1946). «Probability, Frequency and Reasonable Expectation». American Journal of Physics. Consultado em 6 de fevereiro de 2018
- ↑ Cox, Richard Threlkeld (1961). The algebra of probable inference. Baltimore,: Johns Hopkins Press. ISBN 9780801869822. OCLC 1037825
- ↑ Abel, Niels Henrik (1826). «Untersuchung der Functionen zweier unabhängig veränderlichen Größen x und y, wie f(x, y), welche die Eigenschaft haben, daß f(z, f (x,y)) eine symmetrische Function von z, x und y ist». Journal für die reine und angewandte Mathematik. Consultado em 6 de fevereiro de 2018
- ↑ J., Aczél, (1966). Lectures on functional equations and their applications. New York: Academic Press. ISBN 9780080955254. OCLC 297771518