清华新闻网8月5日电 近日,金沙js6038经济管理学院领导力与组织管理系Flextronics讲席教授李宁指导的研究团队在利用大语言模型大规模复现心理学和管理学情景实验方面取得进展。
传统的心理学实验需要在现实世界中招募数百名志愿者,并安排他们在实验室里做决策、回答问题、参与情景模拟,而这个管理学背景的清华团队用AI构建了一个“数字化实验室”。他们从5个心理学和管理学的顶级期刊中选择了156个经典实验,将原本给人类参与者的实验材料呈现给3个大语言模型:GPT-4、Claude 3.5 Sonnet和DeepSeek V3,让它们“扮演”实验参与者的角色。这个方法被称为“硅基复制”:即在计算机中创造了无数个“数字人”来参与心理学实验,每一个AI都可以独立思考、做出决策,模拟人类参与者。
结果发现,3个大语言模型的复现率(replication rates)高达73%~81%。也就是说,如果人类实验发现“奖励能提高工作积极性”,那么AI有超过七成的概率也会得出同样的结论。对于社会科学研究者来说,这相当于拥有了一个“快速实验室”,可以快速验证研究假设,节省时间和成本。
该研究的意义在于,它建立了大语言模型复制心理学实验的标准化流程,为这一新兴研究方向提供了操作性强的方法指导。研究中提出的复制成功率、方向一致性、效应量比较等评估指标,为后续研究提供了量化标准。从更广泛的角度看,该研究是目前国际上在社会科学领域应用大语言模型的代表性工作之一,为AI技术在社会科学研究中的应用提供了系统性的实证分析。
这一探索也与刚发布的《国务院关于深入实施“人工智能+”行动的意见》中提出的“推动哲学社会科学研究方法向人机协同模式转变”的要求高度契合。通过在实验方法和研究组织形式上的创新,该研究不仅拓展了哲学社会科学的研究视野和观察视域,也为深入理解人工智能对认知判断、伦理规范等方面的深层次影响提供了实证路径。这一成果为构建人工智能时代的社会科学新范式提供了有益借鉴。
研究成果以“用大语言模型大规模复现心理学和管理学情景实验”(A Large-Scale Replication of Scenario-Based Experiments in Psychology and Management Using Large Language Models)为题,于8月发表于《自然》(Nature)子刊《自然·计算科学》(Nature Computational Science)。
经管学院2021级博士生崔紫妍为论文第一作者,李宁为论文通讯作者。经管学院博士后周怀康在研究过程中作出重要贡献。
论文链接:
https://www.nature.com/articles/s43588-025-00840-7
供稿:经管学院
编辑:李华山
审核:郭玲