Inferência causal

Ramo da estatística que analisa a inferência de relações causais entre variáveis

A inferência causal é o processo de determinar o efeito real e independente de um fenômeno particular que é um componente de um sistema maior. A principal diferença entre inferência causal e inferência de associação é que a inferência causal analisa a resposta de uma variável de efeito quando uma causa da variável de efeito é alterada.[1][2] A ciência de por que as coisas ocorrem é chamada de etiologia. Diz-se que a inferência causal fornece a evidência da causalidade teorizada pelo raciocínio causal.

A inferência causal é amplamente estudada em todas as ciências. Várias inovações no desenvolvimento e implementação de metodologias destinadas a determinar a causalidade proliferaram nas últimas décadas. A inferência causal permanece especialmente difícil onde a experimentação é difícil ou impossível, o que é comum na maioria das ciências.

Definição

editar

Inferir a causa de algo tem sido descrito como:

  • "raciocínio para a conclusão de que algo é, ou provavelmente é, a causa de outra coisa".[3]
  • "Identificação da causa ou causas de um fenômeno, estabelecendo covariação de causa e efeito, uma relação temporal com a causa anterior ao efeito e a eliminação de causas alternativas plausíveis." [4]

Metodologia

editar

Em geral

editar

A inferência causal é conduzida através do estudo de sistemas onde a medida de uma variável é suspeita de afetar a medida de outra. A inferência causal é conduzida em relação ao método científico. O primeiro passo da inferência causal é formular uma hipótese nula falseável, que é posteriormente testada com métodos estatísticos. A inferência estatística frequencista é o uso de métodos estatísticos para determinar a probabilidade de que os dados ocorram sob a hipótese nula por acaso: a inferência bayesiana é usada para determinar o efeito de uma variável independente.[5] A inferência estatística em geral é usada para determinar a diferença entre as variações nos dados originais que são variações aleatórias ou o efeito de um mecanismo causal bem especificado. Notavelmente, a correlação não implica causalidade, então o estudo da causalidade está tão preocupado com o estudo de mecanismos causais potenciais quanto com a variação entre os dados. Um padrão de inferência causal frequentemente procurado é um experimento onde o tratamento é atribuído aleatoriamente, mas todos os outros fatores de confusão são mantidos constantes. A maioria dos esforços em inferência causal está na tentativa de replicar condições experimentais.

Os estudos epidemiológicos empregam diferentes métodos epidemiológicos de coleta e medição de evidências de fatores de risco e efeito e diferentes formas de medir a associação entre os dois. Os resultados de uma revisão de métodos para inferência causal em 2020 descobriram que usar a literatura existente para programas de treinamento clínico pode ser desafiador. Isso ocorre porque os artigos publicados geralmente presumem uma base técnica avançada, podem ser escritos a partir de múltiplas perspectivas estatísticas, epidemiológicas, da ciência da computação ou filosóficas, as abordagens metodológicas continuam a se expandir rapidamente e muitos aspectos da inferência causal recebem cobertura limitada.[6]

Estruturas comuns para inferência causal incluem o modelo de pizza causal (componente-causa), o modelo causal estrutural de Pearl, modelagem de equação estrutural e modelo causal de Rubin (resultado potencial), que são frequentemente usados em áreas como como ciências sociais e epidemiologia.[7]

Experimental

editar

A verificação experimental de mecanismos causais é possível usando métodos experimentais. A principal motivação por trás de um experimento é manter constantes outras variáveis experimentais enquanto se manipula propositalmente a variável de interesse. Se o experimento produzir efeitos estatisticamente significativos como resultado da manipulação apenas da variável de tratamento, há motivos para acreditar que um efeito causal pode ser atribuído à variável de tratamento, supondo que outros padrões para o desenho experimental tenham sido atendidos.

Abordagens em epidemiologia

editar

A epidemiologia estuda padrões de saúde e doença em populações definidas de seres vivos para inferir causas e efeitos. Uma associação entre uma exposição a um suposto fator de risco e uma doença pode ser sugestiva, mas não é equivalente à causalidade, pois a correlação não implica causalidade. Historicamente, os postulados de Koch têm sido usados desde o século 19 para decidir se um microrganismo era a causa de uma doença. No século 20 os critérios de Bradford Hill, descritos em 1965,[8] foram usados para avaliar a causalidade de variáveis fora da microbiologia, embora mesmo esses critérios não sejam formas exclusivas de determinar a causalidade.

Abordagens em informática

editar

A determinação de causa e efeito a partir de dados observacionais conjuntos para duas variáveis independentes do tempo, digamos X e Y, foi abordada usando assimetria entre evidências para algum modelo nas direções, X → Y e Y → X. As abordagens primárias são baseadas em algoritmos modelos de teoria da informação e modelos de ruído. 

Modelos de ruído

editar

Incorpore um termo de ruído independente no modelo para comparar as evidências das duas direções.

Aqui estão alguns dos modelos de ruído para a hipótese Y → X com o ruído E:

  • Ruído aditivo:[9]  
  • Ruído linear:[10]  
  • Pós não linear:[11]  
  • Ruído heterocedástico:  
  • Ruído funcional:[12]  

Abordagens em ciências sociais

editar

Economia e ciência política

editar

Nas ciências econômicas e na ciência política, a inferência causal é muitas vezes difícil, devido à complexidade do mundo real das realidades econômicas e políticas e à incapacidade de recriar muitos fenômenos de grande escala dentro de experimentos controlados. A inferência causal nas ciências econômicas e políticas continua a ver melhorias na metodologia e no rigor, devido ao aumento do nível de tecnologia disponível para os cientistas sociais, o aumento no número de cientistas sociais e pesquisas e melhorias nas metodologias de inferência causal em todas as ciências sociais.[13]

Veja também

editar

Referências

editar
  1. Pearl, Judea (1 de janeiro de 2009). «Causal inference in statistics: An overview» (PDF). Statistics Surveys. 3: 96–146. doi:10.1214/09-SS057 . Consultado em 24 de setembro de 2012. Cópia arquivada (PDF) em 6 de agosto de 2010 
  2. Morgan, Stephen; Winship, Chris (2007). Counterfactuals and Causal inference. [S.l.]: Cambridge University Press. ISBN 978-0-521-67193-4 
  3. «causal inference». Encyclopædia Britannica, Inc. Consultado em 24 de agosto de 2014. Arquivado do original em 3 de maio de 2015 
  4. John Shaughnessy; Eugene Zechmeister; Jeanne Zechmeister (2000). Research Methods in Psychology. [S.l.]: McGraw-Hill Humanities/Social Sciences/Languages. pp. Chapter 1 : Introduction. ISBN 978-0077825362. Consultado em 24 de agosto de 2014. Cópia arquivada em 15 de outubro de 2014 
  5. Schrodt, Philip A (1 de março de 2014). «Seven deadly sins of contemporary quantitative political analysis». Journal of Peace Research (em inglês). 51 (2): 287–300. ISSN 0022-3433. doi:10.1177/0022343313499597. Consultado em 16 de fevereiro de 2021. Cópia arquivada em 15 de agosto de 2021 
  6. Landsittel, Douglas; Srivastava, Avantika; Kropf, Kristin (2020). «A Narrative Review of Methods for Causal Inference and Associated Educational Resources». Quality Management in Health Care (em inglês). 29 (4): 260–269. ISSN 1063-8628. PMID 32991545. doi:10.1097/QMH.0000000000000276. Consultado em 26 de fevereiro de 2021. Cópia arquivada em 15 de agosto de 2021 
  7. Greenland, Sander; Brumback, Babette (outubro de 2002). «An overview of relations among causal modelling methods». International Journal of Epidemiology (em inglês). 31 (5): 1030–1037. ISSN 1464-3685. PMID 12435780. doi:10.1093/ije/31.5.1030. Consultado em 17 de fevereiro de 2022. Cópia arquivada em 23 de abril de 2022 
  8. Hill, Austin Bradford (1965). «The Environment and Disease: Association or Causation?». Proceedings of the Royal Society of Medicine. 58 (5): 295–300. PMC 1898525 . PMID 14283879. doi:10.1177/003591576505800503. Consultado em 25 de fevereiro de 2014. Cópia arquivada em 19 de fevereiro de 2021 
  9. Hoyer, Patrik O., et al. "Nonlinear causal discovery with additive noise models Arquivado em 2020-11-02 no Wayback Machine." NIPS. Vol. 21. 2008.
  10. Shimizu, Shohei; et al. (2011). «DirectLiNGAM: A direct method for learning a linear non-Gaussian structural equation model» (PDF). The Journal of Machine Learning Research. 12: 1225–1248. arXiv:1101.2489 . Consultado em 27 de julho de 2019. Cópia arquivada (PDF) em 23 de julho de 2021 
  11. Zhang, Kun, and Aapo Hyvärinen. "On the identifiability of the post-nonlinear causal model Arquivado em 2021-10-19 no Wayback Machine." Proceedings of the Twenty-Fifth Conference on Uncertainty in Artificial Intelligence. AUAI Press, 2009.
  12. Mooij, Joris M., et al. "Probabilistic latent variable models for distinguishing between cause and effect Arquivado em 2020-07-22 no Wayback Machine." NIPS. 2010.
  13. Angrist, Joshua D.; Pischke, Jörn-Steffen (junho de 2010). «The Credibility Revolution in Empirical Economics: How Better Research Design Is Taking the Con out of Econometrics». Journal of Economic Perspectives (em inglês). 24 (2): 3–30. ISSN 0895-3309. doi:10.1257/jep.24.2.3