Codificação preditiva

Na neurociência, a codificação preditiva (também conhecida como processamento preditivo) é uma teoria da função cerebral que postula que o cérebro está constantemente gerando e atualizando um "modelo mental" do ambiente. De acordo com a teoria, esse modelo mental é usado para prever sinais de entrada dos sentidos que são então comparados com os sinais de entrada reais desses sentidos. A codificação preditiva é membro de um conjunto mais amplo de teorias que seguem a hipótese do cérebro bayesiano.

Origens

editar

Os ancestrais teóricos da codificação preditiva datam de 1860 com o conceito de inferência inconsciente de Helmholtz.[1] Inferência inconsciente se refere à ideia de que o cérebro humano preenche informações visuais para dar sentido a uma cena. Por exemplo, se algo é relativamente menor que outro objeto no campo visual, o cérebro usa essa informação como uma provável indicação de profundidade, de modo que o observador acaba (e involuntariamente) experimentando profundidade. A compreensão da percepção como a interação entre estímulos sensoriais (de baixo para cima) e conhecimento conceitual (de cima para baixo) continuou a ser estabelecida por Jerome Bruner que, a partir da década de 1940, estudou as maneiras pelas quais necessidades, motivações e expectativas influenciam a percepção, pesquisa que veio a ser conhecida como psicologia New Look ("Novo Olhar"). Em 1981, McClelland e Rumelhart examinaram a interação entre características de processamento (linhas e contornos) que formam letras, que por sua vez formam palavras. Embora as características sugiram a presença de uma palavra, eles descobriram que quando as letras eram colocadas no contexto de uma palavra, as pessoas conseguiam identificá-las mais rapidamente do que quando elas eram colocadas em uma não palavra sem contexto semântico. O modelo de processamento paralelo de McClelland e Rumelhart descreve a percepção como o encontro de elementos de cima para baixo (conceituais) e de baixo para cima (sensoriais).[2]

No final da década de 1990, a ideia de processamento de cima para baixo e de baixo para cima foi traduzida em um modelo computacional de visão por Rao e Ballard. O artigo demonstrou que poderia haver um modelo generativo de uma cena (processamento de cima para baixo), que receberia feedback por meio de sinais de erro (o quanto a entrada visual variou da previsão), o que posteriormente levaria à atualização da previsão. O modelo computacional foi capaz de replicar efeitos de campo receptivo bem estabelecidos, bem como efeitos de campo receptivo extraclássicos menos compreendidos, como o end-stopping.[3]

Em 2004, Rick Grush propôs um modelo de processamento perceptual neural segundo o qual o cérebro gera constantemente previsões baseadas em um modelo generativo (o que Grush chamou de "emulador") e compara essa previsão com a entrada sensorial real. A diferença, ou "resíduo sensorial", seria então usada para atualizar o modelo de modo a produzir uma estimativa mais precisa do domínio percebido. Segundo Grush, os sinais de cima para baixo e de baixo para cima seriam combinados de uma forma sensível ao ruído esperado (também conhecido como incerteza) no sinal de baixo para cima, de modo que, em situações em que o sinal sensorial fosse conhecido por ser menos confiável, a previsão de cima para baixo receberia maior peso, e vice-versa. A estrutura de emulação também se mostrou hierárquica, com emuladores específicos de modalidade fornecendo expectativas de cima para baixo para sinais sensoriais, bem como emuladores de nível superior fornecendo expectativas das causas distais desses sinais. Grush aplicou a teoria à percepção visual, às imagens visuais e motoras, à linguagem e aos fenômenos da teoria da mente.[4]

Estrutura geral

editar
 
Esquema conceitual de codificação preditiva com 2 níveis

A codificação preditiva foi desenvolvida inicialmente como um modelo do sistema sensorial, em que o cérebro resolve o problema de modelar causas distais de entrada sensorial por meio de uma versão da inferência bayesiana. Assume-se que o cérebro mantém representações internas ativas das causas distais, o que lhe permite prever as entradas sensoriais. Uma comparação entre previsões e informações sensoriais produz uma medida de diferença (por exemplo, erro de previsão, energia livre ou surpresa) que, se for suficientemente grande além dos níveis de ruído estatístico esperado, fará com que o modelo interno seja atualizado para prever melhor as informações sensoriais no futuro.[5]

Os erros de previsão não só podem ser usados para inferir causas distais, mas também para aprendê-las por meio da plasticidade neural.[3] Aqui a ideia é que as representações aprendidas pelos neurônios corticais refletem as regularidades estatísticas nos dados sensoriais. Essa ideia também está presente em muitas outras teorias de aprendizagem neural, como a codificação esparsa, com a diferença central de que na codificação preditiva não apenas as conexões com entradas sensoriais são aprendidas (ou seja, o campo receptivo), mas também conexões preditivas de cima para baixo de representações de nível superior. Isso torna a codificação preditiva semelhante a alguns outros modelos de aprendizagem hierárquica, como máquinas de Helmholtz e redes de crença profunda, que, no entanto, empregam algoritmos de aprendizagem diferentes. Assim, o uso duplo de erros de previsão para inferência e aprendizagem é uma das características definidoras da codificação preditiva.[6]

Pesagem de precisão

editar

A precisão da entrada sensorial é sua previsibilidade com base no ruído do sinal e outros fatores. As estimativas de precisão são cruciais para minimizar eficazmente o erro de previsão, pois permitem ponderar as entradas sensoriais e as previsões de acordo com a sua fiabilidade.[7] Por exemplo, o ruído no sinal visual varia entre o amanhecer e o anoitecer, de modo que uma maior confiança condicional é atribuída aos erros de previsão sensorial em plena luz do dia do que ao anoitecer.[8] Abordagens semelhantes são usadas com sucesso em outros algoritmos que realizam inferência bayesiana, por exemplo, para filtragem bayesiana no filtro de Kalman.[9]

Também foi proposto que tal ponderação de erros de previsão em proporção à sua precisão estimada é, em essência, atenção,[10] e que o processo de dedicação de atenção pode ser neurobiologicamente realizado por sistemas de ativação reticular ascendentes (ARAS) otimizando o “ganho” de unidades de erro de previsão. No entanto, também foi argumentado que a ponderação de precisão só pode explicar a "atenção espacial endógena", mas não outras formas de atenção.[11]

Inferência ativa

editar

O mesmo princípio de minimização de erros de previsão foi usado para fornecer uma explicação do comportamento em que as ações motoras não são comandos, mas previsões proprioceptivas descendentes. Neste esquema de inferência ativa, os arcos reflexos clássicos são coordenados de modo a amostrar seletivamente a entrada sensorial de maneiras que melhor cumpram as previsões, minimizando assim os erros de previsão proprioceptiva.[10] Na verdade, Adams et al. (2013) analisam evidências que sugerem que esta visão da codificação preditiva hierárquica no sistema motor fornece uma estrutura baseada em princípios e neuralmente plausível para explicar a organização agranular do córtex motor.[12] Essa visão sugere que “os sistemas perceptivo e motor não devem ser considerados separados, mas sim como uma única máquina de inferência ativa que tenta prever sua entrada sensorial em todos os domínios: visual, auditivo, somatossensorial, interoceptivo e, no caso do sistema motor, proprioceptivo."[12]

Teoria neural na codificação preditiva

editar

Grande parte do trabalho inicial que aplicou uma estrutura de codificação preditiva aos mecanismos neurais veio do processamento sensorial, particularmente no córtex visual.[3][13] Essas teorias pressupõem que a arquitetura cortical pode ser dividida em níveis hierarquicamente empilhados, que correspondem a diferentes regiões corticais. Acredita-se que cada nível abriga (pelo menos) dois tipos de neurônios: "neurônios de previsão", que visam prever as entradas de baixo para cima no nível atual, e "neurônios de erro", que sinalizam a diferença entre entrada e previsão. Acredita-se que esses neurônios sejam principalmente neurônios piramidais superficiais e não superficiais, enquanto os interneurônios desempenham funções diferentes.[13]

Nas regiões corticais, há evidências de que diferentes camadas corticais podem facilitar a integração de projeções de pré-alimentação e retroalimentação entre hierarquias.[13] Portanto, essas camadas corticais foram consideradas centrais no cálculo de previsões e erros de previsão, sendo a unidade básica uma coluna cortical.[13][14] Uma visão comum é que:[13][15]

  • Neurônios de erro residem nas camadas supragranulares 2 e 3, uma vez que esses neurônios apresentam atividade esparsa e tendem a responder a eventos inesperados
  • Neurônios de previsão residem na camada profunda 5, onde muitos neurônios exibem respostas densas
  • A ponderação de precisão pode ser implementada por meio de diversos mecanismos, como neuromoduladores ou projeções de longo alcance de outras áreas do cérebro (por exemplo, tálamo)

Entretanto, até agora não há consenso sobre como o cérebro provavelmente implementa a codificação preditiva. Algumas teorias, por exemplo, propõem que as camadas supragranulares contêm não apenas neurônios de erro, mas também neurônios de previsão.[13] Também ainda é debatido por quais mecanismos os neurônios de erro podem calcular o erro de previsão.[16] Como os erros de previsão podem ser negativos e positivos, mas os neurônios biológicos só podem mostrar atividade positiva, são necessários esquemas de codificação de erros mais complexos. Para contornar este problema, teorias mais recentes propuseram que a computação de erros poderia ocorrer em dendritos neurais.[17][18] Ver também a memória temporal hierárquica do córtex.

Aplicações da codificação preditiva

editar

Percepção

editar

A evidência empírica para codificação preditiva é mais robusta para processamento perceptual. Já em 1999, Rao e Ballard propuseram um modelo hierárquico de processamento visual no qual a área cortical visual de ordem superior envia previsões e as conexões de pré-alimentação transportam os erros residuais entre as previsões e as atividades reais de nível inferior.[3] De acordo com este modelo, cada nível na rede do modelo hierárquico (exceto o nível mais baixo, que representa a imagem) tenta prever as respostas no nível imediatamente inferior por meio de conexões de retroalimentação, e o sinal de erro é usado para corrigir a estimativa do sinal de entrada em cada nível simultaneamente.[3] Emberson et al. estabeleceram a modulação de cima para baixo em bebês usando um paradigma de omissão audiovisual multimodal, determinando que até mesmo os cérebros infantis têm expectativas sobre a futura entrada sensorial que é transportada a jusante dos córtices visuais e são capazes de feedback baseado em expectativas. Dados de espectroscopia funcional próxima ao infravermelho (fNIRS) mostraram que o córtex occipital infantil respondeu à omissão visual inesperada (sem entrada de informação visual), mas não à omissão visual esperada. Esses resultados estabelecem que, em um sistema de percepção organizado hierarquicamente, neurônios de ordem superior enviam previsões para neurônios de ordem inferior, que por sua vez enviam de volta o sinal de erro de previsão.[19]

Interocepção

editar

Existem vários modelos concorrentes para o papel da codificação preditiva na interocepção.

Em 2013, Anil Seth propôs que os nossos estados de sentimentos subjetivos, também conhecidos como emoções, são gerados por modelos preditivos que são ativamente construídos a partir de avaliações interoceptivas causais.[20] Em relação à forma como atribuímos estados internos de outros a causas, Sasha Ondobaka, James Kilner e Karl Friston (2015) propuseram que o princípio da energia livre requer que o cérebro produza uma série contínua de previsões com o objetivo de reduzir a quantidade de erro de previsão que se manifesta como “energia livre”. Esses erros são então usados para modelar informações antecipatórias sobre qual será o estado do mundo exterior e sobre atribuições de causas desse estado do mundo, incluindo a compreensão das causas do comportamento dos outros. Isso é especialmente necessário porque, para criar essas atribuições, nossos sistemas sensoriais multimodais precisam de previsões interoceptivas para se organizarem. Portanto, Ondobaka postula que a codificação preditiva é fundamental para entender os estados internos de outras pessoas.[21]

Em 2015, Lisa Feldman Barrett e W. Kyle Simmons propuseram o modelo de codificação de interocepção preditiva incorporada, uma estrutura que unifica os princípios de inferência ativa bayesiana com uma estrutura fisiológica de conexões corticocorticais. Usando esse modelo, eles postularam que os córtices visceromotores agranulares são responsáveis por gerar previsões sobre a interocepção, definindo assim a experiência da interocepção.[22]

Contrariamente à noção indutiva de que as categorias de emoção são biologicamente distintas, Barrett propôs mais tarde a teoria da emoção construída, que é o relato de que uma categoria de emoção biológica é construída com base numa categoria conceptual— a acumulação de instâncias que partilham um objetivo. Em um modelo de codificação preditiva, Barrett levanta a hipótese de que, na interocepção, nossos cérebros regulam nossos corpos ativando "simulações incorporadas" (representações corporais completas da experiência sensorial) para antecipar o que nossos cérebros preveem que o mundo externo nos lançará sensorialmente e como responderemos a isso com ações. Essas simulações são preservadas se, com base nas previsões do nosso cérebro, elas nos preparam bem para o que realmente ocorre posteriormente no mundo externo, ou elas, e nossas previsões, são ajustadas para compensar seus erros em comparação ao que realmente ocorre no mundo externo e quão bem preparados estávamos para isso. Então, em um processo de tentativa-erro-ajuste, nossos corpos encontram semelhanças em objetivos entre certas simulações antecipatórias bem-sucedidas e as agrupam em categorias conceituais. Toda vez que surge uma nova experiência, nossos cérebros usam esse histórico de tentativa-erro-ajuste para associar a nova experiência a uma das categorias de simulações corrigidas acumuladas com as quais ela compartilha mais semelhanças. Em seguida, eles aplicam a simulação corrigida dessa categoria à nova experiência, na esperança de preparar nossos corpos para o resto da experiência. Caso contrário, a previsão, a simulação e talvez os limites da categoria conceitual serão revisados na esperança de maior precisão na próxima vez, e o processo continua. Barrett levanta a hipótese de que, quando o erro de previsão para uma determinada categoria de simulações para experiências do tipo x é minimizado, o resultado é uma simulação informada por correção que o corpo irá reativar para cada experiência do tipo x, resultando em uma representação totalmente incorporada e informada por correção da experiência sensorial—uma emoção. Nesse sentido, Barrett propõe que construímos nossas emoções porque a estrutura de categorias conceituais que nossos cérebros usam para comparar novas experiências e escolher a simulação sensorial preditiva apropriada para ativar é construída em tempo real.[23][24]

Ciência da computação

editar

Com a crescente popularidade da aprendizagem de representação, a teoria também tem sido ativamente buscada e aplicada na aprendizagem de máquina e campos relacionados.[25][26][27]

Desafios

editar

Um dos maiores desafios para testar a codificação preditiva tem sido a imprecisão de como exatamente funciona a minimização do erro de previsão.[28] Em alguns estudos, o aumento do sinal BOLD foi interpretado como sinal de erro, enquanto em outros indica mudanças na representação de entrada.[28] Uma questão crucial que precisa ser abordada é o que constitui exatamente o sinal de erro e como ele é calculado em cada nível de processamento de informações.[13] Outro desafio que foi colocado é a tratabilidade computacional da codificação preditiva. De acordo com Kwisthout e van Rooij, a subcomputação em cada nível da estrutura de codificação preditiva esconde potencialmente um problema computacionalmente intratável, o que equivale a “obstáculos intratáveis” que os modeladores computacionais ainda não superaram.[29]

Ver também

editar

Referências

  1. «Helmholtz's Treatise on Physiological Optics - Free». 20 de março de 2018. Consultado em 5 de janeiro de 2022. Arquivado do original em 20 March 2018  Verifique data em: |arquivodata= (ajuda)
  2. McClelland, J. L.; Rumelhart, D. E. (1981). «An interactive activation model of context effects in letter perception: I. An account of basic findings». Psychological Review. 88 (5): 375–407. doi:10.1037/0033-295X.88.5.375  Verifique o valor de |name-list-format=amp (ajuda)
  3. a b c d e Rao, Rajesh P. N.; Ballard, Dana H. (1999). «Predictive coding in the visual cortex: A functional interpretation of some extra-classical receptive-field effects». Nature Neuroscience. 2 (1): 79–87. PMID 10195184. doi:10.1038/4580 
  4. Grush, Rick (2004). «The emulation theory of representation: Motor control, imagery, and perception». Behavioral and Brain Sciences (em inglês). 27 (3): 377–396. ISSN 0140-525X. PMID 15736871. doi:10.1017/S0140525X04000093 
  5. Clark, Andy (2013). «Whatever next? Predictive brains, situated agents, and the future of cognitive science». Behavioral and Brain Sciences. 36 (3): 181–204. PMID 23663408. doi:10.1017/S0140525X12000477  
  6. Friston, Karl (August 2018). «Does predictive coding have a future?». Nature Neuroscience (em inglês). 21 (8): 1019–1021. ISSN 1546-1726. doi:10.1038/s41593-018-0200-7  Verifique data em: |data= (ajuda)
  7. Friston, Karl J.; Feldman, Harriet (2010). «Attention, Uncertainty, and Free-Energy». Frontiers in Human Neuroscience. 4: 215. PMC 3001758 . PMID 21160551. doi:10.3389/fnhum.2010.00215  
  8. Hohwy, Jakob (2012). «Attention and Conscious Perception in the Hypothesis Testing Brain». Frontiers in Psychology. 3: 96. PMC 3317264 . PMID 22485102. doi:10.3389/fpsyg.2012.00096  
  9. Czigler, Denham, Susan L.; Dura-Bernal, Salvador; Coath, Martin; Balaguer-Ballaster, Emili (2010). «Neurocomputational models of perceptual organization». In: Czigler, István; Winkler, István. Unconscious Memory Representations in Perception: Processes and Mechanisms in the Brain (em inglês). [S.l.]: John Benjamins Publishing 
  10. a b Friston, Karl (2009). «The free-energy principle: A rough guide to the brain?». Trends in Cognitive Sciences. 13 (7): 293–301. PMID 19559644. doi:10.1016/j.tics.2009.04.005 
  11. Ransom M. & Fazelpour S (2015). Three Problems for the Predictive Coding Theory of Attention. http://mindsonline.philosophyofbrains.com/2015/session4/three-problems-for-the-predictive-coding-theory-of-attention/
  12. a b Adams, Rick A.; Shipp, Stewart; Friston, Karl J. (2013). «Predictions not commands: Active inference in the motor system». Brain Structure and Function. 218 (3): 611–643. PMC 3637647 . PMID 23129312. doi:10.1007/s00429-012-0475-5 
  13. a b c d e f g Bastos, Andre M.; Usrey, W. Martin; Adams, Rick A.; Mangun, George R.; Fries, Pascal; Friston, Karl J. (2012). «Canonical Microcircuits for Predictive Coding». Neuron. 76 (4): 695–711. PMC 3777738 . PMID 23177956. doi:10.1016/j.neuron.2012.10.038 
  14. Bennett, Max (2020). «An Attempt at a Unified Theory of the Neocortical Microcircuit in Sensory Cortex». Frontiers in Neural Circuits. 14: 40. PMC 7416357 . PMID 32848632. doi:10.3389/fncir.2020.00040  
  15. Keller, Georg B.; Mrsic-Flogel, Thomas D. (October 2018). «Predictive Processing: A Canonical Cortical Computation». Neuron. 100 (2): 424–435. PMC 6400266 . doi:10.1016/j.neuron.2018.10.003  Verifique data em: |data= (ajuda)
  16. Millidge, Beren; Seth, Anil (19 de janeiro de 2022). «Predictive Coding: a Theoretical and Experimental Review». arXiv:2107.12979  [cs.AI] 
  17. Mikulasch, Fabian A.; Rudelt, Lucas; Wibral, Michael; Priesemann, Viola (January 2023). «Where is the error? Hierarchical predictive coding through dendritic error computation». Trends in Neurosciences. 46 (1): 45–59. arXiv:2205.05303 . doi:10.1016/j.tins.2022.09.007  Verifique data em: |data= (ajuda)
  18. Whittington, James C.R.; Bogacz, Rafal (March 2019). «Theories of Error Back-Propagation in the Brain». Trends in Cognitive Sciences. 23 (3): 235–250. PMC 6382460 . doi:10.1016/j.tics.2018.12.005  Verifique data em: |data= (ajuda)
  19. Emberson, Lauren L.; Richards, John E.; Aslin, Richard N. (2015). «Top-down modulation in the infant brain: Learning-induced expectations rapidly affect the sensory cortex at 6 months». Proceedings of the National Academy of Sciences. 112 (31): 9585–9590. Bibcode:2015PNAS..112.9585E. PMC 4534272 . PMID 26195772. doi:10.1073/pnas.1510343112  
  20. Seth, Anil K. (2013). «Interoceptive inference, emotion, and the embodied self». Trends in Cognitive Sciences. 17 (11): 565–573. PMID 24126130. doi:10.1016/j.tics.2013.09.007  
  21. Ondobaka, Sasha; Kilner, James; Friston, Karl (2017). «The role of interoceptive inference in theory of mind». Brain and Cognition. 112: 64–68. PMC 5312780 . PMID 26275633. doi:10.1016/j.bandc.2015.08.002 
  22. Barrett, Lisa Feldman; Simmons, W. Kyle (2015). «Interoceptive predictions in the brain». Nature Reviews Neuroscience. 16 (7): 419–429. PMC 4731102 . PMID 26016744. doi:10.1038/nrn3950 
  23. Barrett, Lisa Feldman (2016). «The theory of constructed emotion: An active inference account of interoception and categorization». Social Cognitive and Affective Neuroscience. 12 (1): 1–23. PMC 5390700 . PMID 27798257. doi:10.1093/scan/nsw154 
  24. Barrett, L.F. (2017). How emotions are made: The secret life of the brain. New York: Houghton Mifflin Harcourt. ISBN 0544133315
  25. Millidge, Beren; Salvatori, Tommaso (18 de fevereiro de 2022). «Predictive Coding: Towards a Future of Deep Learning beyond Backpropagation?». arXiv:2202.09467  [cs.NE] 
  26. Ororbia, Alexander G.; Kifer, Daniel (19 de abril de 2022). «The Neural Coding Framework for Learning Generative Models». Nature Communications. 13 (1): 2064. PMC 9018730 . PMID 35440589. doi:10.1038/s41467-022-29632-7  
  27. Hinton, Geoffrey E. (2007). «Learning multiple layers of representation». Trends in Cognitive Sciences. 11 (10): 428–434. PMID 17921042. doi:10.1016/j.tics.2007.09.004 
  28. a b Kogo, Naoki; Trengove, Chris (2015). «Is predictive coding theory articulated enough to be testable?». Frontiers in Computational Neuroscience. 9: 111. PMC 4561670 . PMID 26441621. doi:10.3389/fncom.2015.00111  
  29. Kwisthout, Johan; Van Rooij, Iris (2020). «Computational Resource Demands of a Predictive Bayesian Brain». Computational Brain & Behavior. 3 (2): 174–188. doi:10.1007/s42113-019-00032-3  |hdl-access= requer |hdl= (ajuda)