目录
- 心理学的学科话语体系与分析水平
- 心理学的规范模型与描述模型
- 从理性分析流派看传统认知心理学的弊端
- 从规范模型到过程模型 - 资源理性分析
- 如何整合心理学
- 阅读推荐和顺序
本文为Bayesian Models of Cognition: Reverse Engineering the Mind一书的书评。
心理学的学科话语体系与分析水平
在老阳课上说,学习任意一个学科的方法就是回答三个问题:这个学科的思想源头是什么?这个学科的核心话语体系是什么?由核心话语体系出发推演出的二级话语体系是什么?
功夫在诗外,老阳又提出研究者应该思考的第四个问题:其他学科或者领域是如何看待这个学科或者领域的大问题。比如认知语言学的核心话语体系是“基本层次隐喻”,以社会心理学的框架来看,就是社会认知需要解答的问题。
有趣的是,和其他学科的phd student交流后,感受到从自然科学的视角来看,心理学实在是太伪科学,太不严谨,缺乏统一的理论构建方法。毕竟心智和思维过程并不是看得见摸得着,能够严格测量的事物。我们看到的只是路面上的车辙,试图回答车马运动的轨迹。
心理学并不是人类尺度现象上科学家遇到的唯一困难。比如,基础物理学和还原论就在解释人类尺度的现象上出现困难。这也推动了1984年圣塔菲高地关于“涌现的综合”的讨论,尝试以一种复杂系统的思路研究生命和信息系统。
那么心理学的理论构建方法是什么?是否严谨?如果不对心理学各个子领域分门别类,心理学的核心话语体系有两个出处,其一是实验生理学,强调可证伪性,操作主义,聚合性证据原则;其二是心理测量学,在经典(CTT)和现代测量理论(IRT)的框架下考察信度,效度和构念,最早的思想源头是逻辑实证主义和法理网(nomological network)。这种传统的学科视角也暴露出心理学的弊端。比如,Allen Barton说到:通过对个体的随机抽样,调查变成了社会学的绞肉机——将个体从社会背景中撕裂出来。就像是研究动物学的生物学家用绞肉机切碎动物,并在显微镜上观察细胞。
如果按照学科领域分类,各个心理学子领域的核心话语体系又可以重新定义。对认知心理学,其核心话语体系是将人类视作信息处理系统,这种思路历史上也被称作符号主义,对应的范式叫“斯滕伯格范式”,来自其有名的记忆研究。这种将人类心智视为计算机的思路也归功于早期认知科学家的双重身份,比如Herbert Simon既是心理学家也是拿到图灵奖的计算机科学家。认知心理学经过50年多次范式迭代和转移,也并未离开其对“心理机制”的探讨。对进化心理学,其核心话语体系承袭了两个领域。其一是认知心理学的思路,将认知过程视作符号计算(见社会契约理论,social contract theory);其二是生物学领域现代综合的成果,将心智视作自然选择的产物。进化心理学对符号主义的这种沿袭,除了历史原因(进化心理学比认知心理学晚30年登上历史舞台)外,还有两个学科对于一些认知过程的激烈争论。比如90年代对Wason selection task的content effect的争论就是围绕Pragmatic Reasoning Schemas theory和社会契约理论展开。
心理学的其他领域也可以做类似的分析。我们把各个心理学领域和相关学科按照David Marr的level of analysis来划分,可以看出如下分布:
- computational level: 进化心理/生物学(终极解释,种系发生),经济学(不包括行为经济学),认知科学,认知心理学(理性分析)
- algorithmic level: 认知心理学(符号主义,联结主义),进化心理学(近端解释),发展心理学
- implementation level: 认知神经科学,发展心理学(个体发生),生理心理学
知道了学科的核心话语体系和分析水平后,就有了评判其理论构建是否严谨的依据。
心理学的规范模型与描述模型
在我刚入门心理学的时候,受行为经济学影响,认为规范模型,normative model,对理解人类心理无用。看看什么叫normative model,一个例子是冯诺依曼基于决策公理推导出的期望效用理论(Expected Utility Theory,EUT)。早期决策理论由公理出发,通过放宽假设,或者根据不同的概率公理,可以得到不同的决策理论。比如基于冯诺依曼公理而非柯尔莫哥洛夫公理,可以得到量子决策理论。
EUT依赖大量数学上合理,但是人类并不遵从的公理(比如完备性),在解释实际人类决策上出现困难,比如Allais paradox。这催生了描述模型,descriptive model的开发,其中重要成果之一为前景理论(prospect theory)。框架效应(framing effect)的稳健性让Tversky一度论断:任何决策模型,不可能同时是规范模型与描述模型。
时至今日,大部分心理学模型也都是描述模型。除了Tversky的论断,另一个原因是规范模型的开发太难,对数学的要求太高。但我们也知道Tversky的论断错了,心理学的各个领域,特别是感知觉领域,都出现了足以描述人类行为的规范模型。乃至我自己也在论文中提出了一个跨期决策的normative model,用数学和计算机模拟,而非统计,来解释决策偏好的个体,年龄,性别和文化差异。
与Tversky三十年前的论断不同,Tom Griffiths等人认为心理学应该转为对规范模型的开发。这样做的理由有很多,第一是人类心智可能受到自然选择,以最优或者近似最优的方式解决重复性的进化适应挑战。第二,这么做有助于设计人工智能。第三,严谨的数学工具方便理论检验与修正。与此同时,一种与公理化不同的规范模型构建路线也应运而生,即构建Bayesian model——在给定环境刺激和损失函数的情况下,一个Bayesian reasoner的行为定义了normative。
首先区分三个混淆的概念:
- Bayesian statistics: 贝叶斯作为数据分析的方式,核心话语体系是表征定理,Cox’s theorem和维数诅咒。de Finetti’s representation theorem 表征定理告诉我们,当假定数据具有可交换性时,则贝叶斯推断(参数的先验分布)是强制的,而非一种统计风格。Cox’s theorem打通了贝叶斯统计到贝叶斯认知的桥梁,通过公理化得知,如果主观信念满足一系列公理,则信念和概率等价。本质上是descriptive model。
- Bayesian cognition: 贝叶斯认知,贝叶斯模型作为一种normative model,但不假设人脑在推断和决策时通过昂贵的贝叶斯计算,可以存在各种近似机制。比如以迪利克雷过程混合模型得到的人类对视觉信息的分组方式如果符合经验数据,并不代表人脑会使用迪利克雷过程,可能是用一些可以近似这种推断的启发式。本质上是computational model,不是process model。
- Bayesian brain hypothesis: 认为人脑在神经层面使用贝叶斯推断,本质是讨论贝叶斯推断在神经层面的implementation。
因此,从贝叶斯出发构建normative model,纯粹是从计算理论的角度描述一种行为和心理为什么出现。答案是在给定环境刺激,资源限制和目标函数时,这种行为是最优解。举一个例子,对知觉信息位置的推断可以是贝叶斯的,因为这是一个最优解。最优指的是损失函数为MSE的情况下,posterior mean estimation是最小化MSE的解,maximum likelihood estimation虽然是无偏估计,但却不是最优解,因为MSE同时包括了bias和variance。知觉领域大量研究表明人类行为符合贝叶斯推断。
基于贝叶斯构建的normative model相比descriptive model有很多优势,但同时也要看到descriptive model的弊端。其一是需要大量的统计。比如深度神经网络在识别手写字体上需要大量的训练集,远远多于基于Bayesian library learning的生成模型;又比如前景理论在估计weighting function时,需要大量的pure risky prospect和certainty equivalent试次。这种对数据的依赖本质上是自下而上(bottom-up)模型构建方式的弊端,也是早期联结主义范式的诟病。其二是心理与描述统计参数的脱节。一个能用回归描述的人类数据不能说明人类以回归的方式思考。这既因为回归分析基于的是群体数据,也因为回归本质是一种不基于理论提出的模型。用Statistical rethinking这本书的术语来说,就是geocentric model。托勒密的地心说模型可以很好地描述天体运行轨迹,却不代表天体围绕地球运转。另一个例子依然来自前景理论,基于风险决策得到的心理经济函数不能代表人类心智本身存在基于这些函数的运算,比如决策领域的description-experience gap,当概率通过经验来判断,会得到心理经济函数无法描述的结果。后来的理论,比如decision by sampling theory,给出了不同于心理经济函数的过程解释。
进一步说,大部分心理学所谓的理论都停留在描述层面,以数据驱动加模糊的语言描述心理过程。这当然不能简单粗暴地归结于心理学家水平不行或者缺乏科学素养。事实上,心理学全领域引用最高的几个理论,社会学习理论,自我决定论的提出者都是天赋极高,理论功底极为深厚的学者。从观察到理论,也是横跨各个学科通用的理论构建方法。比如狭义相对论的提出也基于了迈克尔逊-莫雷实验的观测结果。但是,一种纯粹靠描述和数据驱动的学科,必然是效率低下,且无法统一的。
从理性分析流派看传统认知心理学的弊端
认知心理学是大部分心理学学生最早接触的学科,还是一名工科本科生的我,偶然读到Anderson Ericsson, Herbert Simon, Keith Stanovich的书,萌发了对心理学的兴趣。而我们对认知心理学的学习,基本绕不开斯滕伯格范式,符号主义,联结主义,具身化认知思潮,认知神经科学几大主流范式。如上所述,认知心理学注重心理机制的探讨,目标是提出process model,即主要处于算法而非计算的分析水平。
有意思的是,大部分心理学史和认知心理学大纲都忽视了认知心理学另一个重要流派,理性分析(rational analysis)。在生物学领域,理性分析也叫adaptationist。与其他几个范式不同,理性分析更像是和进化心理学1的联姻,回答的是计算层面的问题,主要学者是John Anderson。Anderson将人类行为的理性分析总结为六个步骤:
- 类似认知心理学的核心话语体系,首先描述系统(人类)需要优化的问题。损失函数的选择可以非常灵活,不一定是生物的fitness,可以是经济学的财富,消费水平,也可以是觅食中的卡路里。
- 对环境结构做假设。Herbert Simon在《人工科学》第五章中说到,人类,作为一个行为系统,是十分简单的。其行为的复杂性反应了其外部环境的复杂性。
- 设置主体行动伴随的损失,比如觅食过程中卡路里的损失。
- 推导最优解。
- 对比模型预测与经验数据。
- 修正模型。
Anderson尖锐地批判了基于认知机制的mechanistic theory,原因又有几点:
- mechanistic theory经常不对环境做明显的假设,使其验证出现困难。
- mechanistic theory有model identification的问题。同样一种现象,可以从多种不同的process model得到,因此不可识别。而基于外部环境的假设所构建的rational model不存在类似问题。
- mechanistic theory在科学解释上存在困难。如果一种实验观测可以催生很多不同的机制理论,而这些理论又有同样的解释力,那么对一个问题的理解就会存在困难。反观rational model,给定系统要解决的问题,给定环境,给定计算资源限制,那么就不存在一个极大的模型构建空间。
- mechanistic theory无法回答why的问题——一种认知架构为什么是这样而非那样?
举一个简单的例子就可以看出rational analysis的优势。对记忆的研究,如果假设一个记忆系统的目标是为有机体提取最有用的信息,那么记忆系统会有规律地遗忘,以及特定信息更容易被提取。基于一个理性模型,家喻户晓的primacy effect,spacing effect都是其推演的产物,无需再从经验出发尝试提出一个复杂的认知架构来解释。
从规范模型到过程模型 - 资源理性分析
规范模型足以为心理学提供强有力的工具回答Why的问题。但是否意味着我们需要额外的框架回答How的问题?Anderson在阐述rational analysis的优势时已经隐隐给出了答案:通过给最优化计算添加算力限制,可以找到一个以较低能量近似贝叶斯推断的算法。这要求我们从rational analysis转为resource rational analysis。而所谓的process model,不过是最优化问题的下一步,即找到特定资源限制下近似最优解的算法。
这种分析过程类似Herbert Simon从无限理性到有限理性(bounded rationality)的过渡。首先在计算问题上求出最优解,然后添加resource constraints,如果依然无法解释人类行为,则继续修改和添加constraint,直到能够描述行为数据。这使得心理学问题变为一个计算机科学的问题,要求心理学学生从计算机科学和统计学的文献中寻找近似一种优化问题的方法。
事实上,即使是计算机,在面对复杂问题时也遇到计算的困难。比如贝叶斯推断时对marginal likelihood的计算往往不存在解析解,需要用变分推断,或者马尔可夫采样的方式近似。因此,资源理性分析可以将心理学和计算机科学看作一个硬币的两面,对人和机器构建近似最优化的算法,超越算力限制。
如何整合心理学
上述对resource rational analysis的探讨不代表这种方法不存在缺陷。举一个例子,我们可以很好地用Meta-level Markov Decision Process建模人类planning的过程。但如何用类似的数学描述认知的并行加工乃至具身过程?这本来也是我要问本书第13章作者Dr. Callaway的过程,奈何讨论时间太短无法说清。但在我看来,resource rational analysis为心理学提供了统一的、科学的理论构建方法,至少目前没看到其他更好的路径。
整合的心理学应该是一门计算机科学的子领域。对优化问题的构建,要求我们学习计算机科学,统计学,经济学,进化生物学和认知科学。对人类生存环境的理解,需要我们学习进化生物学和进化心理学。在完成了优化模型的构建后,融入跨文化和发展心理学的研究,而非将文化和发展心理学作为分离的领域。以我自己的normative model of intertemporal choice为例,在建立了模型以后,通过不同文化的数据改变模型输入,看输出是否依然被模型预测;通过改变与年龄相关的变量,看输出是否依然可以预测。发展心理学的另一个用处是验证模型参数随年龄的变化。假设一种认知是hierarchical bayesian,当主体不断获得社会与文化经验后,其超参数的估计趋于稳定,使得关于成年人的实验很难排除一些混淆解释。这时就需要更小的被试来检验。
我的另一个研究也彻底放弃了从经验数据出来构建心理学理论的方法,主要是结合agent-based modeling和hierarchical Bayesian modeling,尝试从纯粹的统计性质出发得到人类社会认知的一些性质。
再说说一些错误的心理学研究思路:
- 以为研究就是增加复杂度,实验设计一定要完全接近现实才能得到有效结论。诚然,高度artificial的设计会创造artifact,但这并不代表更复杂,更生态的设计就有用。因为如果一个模型的目的是解释人类心理和行为,那么这个模型应该可以在任何复杂度的实验输入下给出输出。这说明只要实验包含了验证模型的关键信息,那么复杂度就已经足够。
- 以为跨文化差异就是文化差异。David Buss早有论述,文化也分为evoked culture和transmitted culture,前者涉及心智的一般性,文化差异仅仅由输出导致,后者涉及文化演化论,强调文化的传播。有意思的是,文化传播可以视作马尔科夫链蒙特卡洛,从而实现贝叶斯推断。
阅读推荐和顺序
对于这本Bayesian models of cognition,我猜想不同背景的读者会有不同的体会。我的认知科学入门著作是Pinker的心智探奇,所以一直认为逆向工程是认知心理学和进化心理学中非常重要的理论构建方法。不幸的是,大部分心理学研究都不会尝试构建normative model,很多还曲解功能主义的level of analysis或者仅将这种normative作为事后解释。
整本书分为两个部分,前7章为第一部分,更像是对读者的扫盲,尤其是贝叶斯基础和采样算法。第8-22章更像是针对特定主题的综述,可以选读。对传统心理学背景的读者,可能会惊诧于书中的各种严谨的数学方法,以及不同于经验驱动和非形式理论的理论构建方法。第6,11,13章抽出来,可以作为resource rational analysis的最小入门路径。如果你熟悉贝叶斯统计,特别是hierarchical Bayesian,importance sampling,Markov Chain Monte Carlo,那么可以跳过前6章,直接读8,9,10,11,13章,你将惊诧于这些统计方法在构建人类心智理论中的重要作用。如果你熟悉nonparametric Bayesian model,比如高斯过程,迪利克雷过程,贝塔过程,你可以看第9章,了解无限维的非参数模型如何解释人类的知识增长。第16章往后穿插了很多语言学领域的重要成果,大概linguistic的同学会更感兴趣。
References
Griffiths, T. L., Chater, N., & Tenenbaum, J. B. (Eds.). (2024). Bayesian models of cognition: reverse engineering the mind. MIT Press.
Anderson, J. R. (2013). The adaptive character of thought. Psychology Press.
Anderson, J. R. (1991). The adaptive nature of human categorization. Psychological review, 98(3), 409.
Simon, H. A. (2019). The Sciences of the Artificial, reissue of the third edition with a new introduction by John Laird. MIT press.
-
关于进化心理学的弊端,会专门写另一篇文章——《进化心理学为什么错了》,主要基于博一生物心理学的课程论文。 ↩︎