这个AI知道答案,却不理解问题

日期:2026年4月30日
来源:《中国科学》出版社

摘要:几十年来,心理学家们一直争论,人类心智是否能用一个统一的理论来解释,还是必须像记忆和注意力那样拆分为独立部分。最近一个名为“Centaur”的AI模型似乎带来了突破,声称能在160项不同的认知任务中模仿人类思维。但新研究正在挑战这一大胆的断言,认为该模型并非真正“思考”,只是在记忆模式。

一个看似能模仿人类思维的尖端AI模型,实际上可能只是在记忆答案。新的测试显示它在真正的理解上存在困难,揭示了当前AI系统的一个重大缺陷。图片来源:AI/ScienceDaily.com

心理学家们长期争论,人类心智能否用一个单一的统一理论来解释,或者像注意力和记忆等不同功能必须分开研究。如今,人工智能(AI)加入了这场争论,为探索心智运作提供了新途径。

2025年7月,《自然》杂志发表了一项研究,介绍了一个名为“Centaur”的AI模型。该模型基于标准大型语言模型构建,并使用心理学实验数据进行了优化,旨在模拟人类认知行为。据报道,它在160项任务中表现出色,包括决策、执行控制和其他心理过程。这些结果引起了广泛关注,被视为AI系统更广泛复制人类思维可能迈出的一步。

新研究引发质疑
近期发表在《国家科学评论》上的一项研究挑战了这些说法。浙江大学的研究人员认为,Centaur的表面成功可能源于过度拟合训练数据。换句话说,该模型可能并非理解任务,而是学会了识别训练数据中的模式并复现预期答案。

为验证这一观点,研究人员创建了多个新的评估场景。例如,他们将描述特定心理任务的多选题提示,替换为“…”的指令…

原文链接:https://www.sciencedaily.com/releases/2026/04/260429102035.htm


关注微信号:智享开源 关注微博:IMCN开源资讯网 ,可及时获取信息

评论列表
 
 
发表评论
😀 😂 😃 😄 😅 😆 😉 😊 😋 😎 😍 😘 🥰 😜 😝 🤗 🤔 😭 😤 👍

为你推荐
Ta的个人站点

Mark Do发布文章404篇


关注微信

分类