“书生”大模型获全国数学奥赛第三名,这道题的解法突破人类思路局限
创始人
2025-12-12 19:56:04
0

(来源:上观新闻)

记者今天从上海人工智能实验室获悉,在2025年全国中学生数学奥林匹克竞赛中,实验室研发的“书生”科学多模态大模型(Intern-S1)获得102 分(满分 126 分),在人类选手中排名第三,在参赛的三个国内顶尖大模型中位列第一。阅卷专家认为,Intern-S1的答题表达方式非常接近人类,其中对第四题的解答是一个新的解法,十分巧妙,在参赛学生的解法中没有见过。这意味着,大模型能突破人类解数学题的思路局限,有望帮助人类取得新的科学发现。

据悉,今年全国中学生数学奥赛首次开展人工智能测试,三个大模型参与,与人类选手在相同时间(4.5小时)内完成答题,并由官方组织以相同标准进行阅卷评分。参与大模型训练项目的中国人民大学附属中学老师、奥数教练张端阳说:“Intern-S1能取得这样的成绩,远超我的预期,彻底改变了我对当前大模型数学能力上限的看法。”上海人工智能实验室青年领军科学家陈恺认为,数学奥赛迎来了“AlphaGo时刻”,显示出人工智能在高难度代数、几何、数论、组合数学证明题领域的巨大潜力。

中国数学会发布的2025年全国中学生数学奥林匹克竞赛AI测试结果简报

陈恺介绍,全国中学生数学奥赛加试部分的题型均为证明题,需要很长的推理链路,对大模型的推理能力提出了考验。为此,他带领团队基于“通专融合”技术架构 SAGE(智者),开发了以数学引理为核心的多轮分层推理机制、基于结果的过程校验模型,经过强化学习,让通用大模型拥有了像数学家一样逐步推导、探索和修正的思路,在做证明题时能保持长程推理的严谨性。为了让大模型做好几何证明题,科研团队采用“通用大模型+专业符号引擎”方案,通过远少于谷歌AlphaGeometry2模型的训练量,就取得了很好效果。

2016年,AlphaGo与李世石对弈中下出“神之一手”,完全出乎九段职业棋手的意料。与之相仿,“书生”科学多模态大模型在数学奥赛第四题中,给出了让阅卷专家啧啧称奇的解答。

这道题目属于组合数学:有30种颜色的纸牌,每种颜色的纸牌均有70张。开始时从这些纸牌中任意选取70张,并从上至下摆成一叠。接着进行如下操作:从最下方20张纸牌中选择一张纸牌X,满足其颜色在最上方50张纸牌中从未出现;再从最上方50张纸牌中选择一张纸牌Y,满足其颜色在最上方50张纸牌中至少出现两次;从这叠纸牌中抽出X并将其紧贴着Y的上方放回这叠纸牌中。称上述过程为一次操作。重复上述操作直至无法选取这样的纸牌X时,整个操作过程结束。(1)证明:对所有可能的初始情况及操作方式,整个操作过程都会在有限次操作后结束;(2)在所有可能的初始情况及操作方式中,求操作次数的最大可能值。

面对这道“烧脑”题,“书生”展示了正确且清晰的解题思路。阅卷专家认为,“书生”提供了“一个新的解法,巧妙的调整法,结合了几种观察到的东西,在参赛学生的解法中没有见过”。它体现出大模型已具备理解复杂概念、进行创造性推理、发现精妙解法的能力,并在表达逻辑方面,有很强的严谨性。

Intern-S1对第四题第一问的解答

Intern-S1对第四题第二问的解答

“书生”的巧妙解题,印证了上海人工智能实验室训练大模型路径的可行性。“当AI系统的强大算力和人类的顶层规划设计结合后,它确实能突破传统‘刷题’的瓶颈,展现出接近人类高手的解题素养。”张端阳说。

未来,上海人工智能实验室将把Intern-S1的长程推理能力拓展应用于物理、化学、生命科学等基础研究领域,通过与专业工具融合,让大模型从“长时间独立思考”向“长时间独立科研”转变,从而加速各领域科研范式的根本性变革,为科学新发现提供重要支撑。

原标题:《“书生”大模型获全国数学奥赛第三名,这道题的解法突破人类思路局限》

栏目主编:黄海华

来源:作者:解放日报 俞陶然

相关内容

福建省泉州市召开小微企业质...
中国质量新闻网讯 近日,福建省泉州市小微企业质量管理体系认证提升行...
2025-12-12 22:01:47
东北雨姐、猫一杯、陈震用小...
据网信北京,为进一步规范网络名人账号信息传播秩序,近期,北京市网信...
2025-12-12 22:01:38
降雪后,北京一医院6个半小...
来源:北京晚报 12月12日北京迎来初雪。11时至17时30分,北...
2025-12-12 22:01:30
广西柳州新开放85个人工智...
中新网柳州12月12日电 (林馨)12月12日,广西柳州市召开产业...
2025-12-12 22:00:55
捕捉城市心跳 2025北...
中新网北京12月12日电 “捕捉城市心跳”2025北京朝阳马路摄影...
2025-12-12 22:00:41
国家能源局负责人会见丹麦驻...
转自:证券时报人民财讯12月12日电,2025年12月10日,中国...
2025-12-12 22:00:26
国家能源局负责人会见沙特阿...
转自:财联社【国家能源局负责人会见沙特阿美高级副总裁 双方就沙特阿...
2025-12-12 22:00:12
读懂IPO|35年场地免费...
来源|时代商业研究院作者|雷小艳编辑|郑琳上交所官网显示,11月2...
2025-12-12 21:57:56
金属基复合材料制造商有研复...
12月12日,上交所上市审核委员会召开2025年第63次审议会议,...
2025-12-12 21:57:43

热门资讯

福建省泉州市召开小微企业质量管... 中国质量新闻网讯 近日,福建省泉州市小微企业质量管理体系认证提升行动工作交流会在福建泉州晋江市召开。...
东北雨姐、猫一杯、陈震用小号变... 据网信北京,为进一步规范网络名人账号信息传播秩序,近期,北京市网信办启动“清朗京华·网络名人账号乱象...
降雪后,北京一医院6个半小时接... 来源:北京晚报 12月12日北京迎来初雪。11时至17时30分,北京积水潭医院新街口院区急诊共接诊滑...
广西柳州新开放85个人工智能应... 中新网柳州12月12日电 (林馨)12月12日,广西柳州市召开产业协同发展大会,面向社会全新开放85...
捕捉城市心跳 2025北京朝... 中新网北京12月12日电 “捕捉城市心跳”2025北京朝阳马路摄影季颁奖典礼12日在北京市朝阳区望京...
国家能源局负责人会见丹麦驻华大... 转自:证券时报人民财讯12月12日电,2025年12月10日,中国国家能源局副局长何洋在京会见丹麦驻...
国家能源局负责人会见沙特阿美高... 转自:财联社【国家能源局负责人会见沙特阿美高级副总裁 双方就沙特阿美在华业务合作现状及未来前景等议题...
读懂IPO|35年场地免费!拆... 来源|时代商业研究院作者|雷小艳编辑|郑琳上交所官网显示,11月21日,申报主板IPO的陕西旅游文化...
金属基复合材料制造商有研复材科... 12月12日,上交所上市审核委员会召开2025年第63次审议会议,审议有研金属复合材料(北京)股份公...
长安汽车:控股子公司深蓝汽车拟... 转自:新华财经新华财经北京12月12日电 长安汽车12月12日公告,全资子公司长安科技拟开展增资扩股...