2.4万亿参数“最强文科生”,文心5.0正式版,你挺懂山东人啊?
创始人
2026-01-23 22:03:17
0

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

(来源:量子位)

文心大模型5.0正式版,来了。

这意味着,自2025年11月Preview版初露锋芒后,这个参数量高达2.4万亿、主打原生全模态的“巨无霸”模型的“完全体”来了。

先来看一组“入场成绩单”:

近三个月,在全球大模型竞技场LMArena上,文心5.0 Preview版多次在文本榜(Text Arena)和视觉理解榜(Vision Arena)上拿下国产第一。

1月8日,ERNIE-5.0-Preview-1220以1226分登上视觉理解榜国产第一、全球Top8;1月15日最新榜单,ERNIE-5.0-0110以1460分登上文本榜国产第一、全球Top8,文心5.0已稳稳站进了全球第一梯队。

尤其引人注目的是,在LMArena的用户反馈和评测维度中,在创意写作、复杂指令遵循、高难度理解等任务中,文心5.0优势明显。

根据官方晒出的40余项权威基准的综合评测结果,文心5.0在语言、音频、视觉理解、视觉生成的多个维度超越Gemini-2.5-Pro、GPT-5-High等模型,整体处于领先水平。

文心Moment大会现场,官方演示时输入了一段博主复刻“死了么”App教程视频,让文心5.0生成一个“活了么”App教程。

文心5.0在收到视频+文字指令后,能够自动理解视频以及核心交互逻辑,然后拆解步骤,输出一份详细版教程。

文心5.0还精准模仿了王熙凤说话风格,快速生成了一份融合现代商业逻辑的“大观园资产重组方案”。

目前,文心5.0正式版已上线文心一言网页版、文心App,并同步登陆百度智能云千帆平台。

实测“最强文科生”

在Preview阶段,我们已经系统实测过其全模态能力。这一次,重点换个角度,就看文科素养。为啥它能频频登LMArena大模型国产第一?

话不多说,马上一探究竟。

这第一关,我们考察它的知识储备和旁征博引的能力,看看模型能否在广博知识基础之上,完成有层次、有脉络的创造性整合。

因此,我们抛出了一个看似日常、实则相当刁钻的问题:

结果文心5.0说:

有点意思,它不仅引用了加缪笔下《局外人》主角莫尔索的状态——他生理上活着,但精神上与世界断绝了有意义的连接,处于一种“淡淡的死感”之中:

还谈到了谭嗣同《仁学》中提出的“微生灭”理论——“活人微死”并非一种异常状态,而是生命最基本的构成方式,我们每时每刻都在“微死”,也在“微活”:

回答逻辑清晰、层次分明,还把不同哲学视角下的观点做了完整的比较、提炼与串联

“活人微死”原来还有这么多说法,涨知识了。

下面,把问题推向更具创造性的方向,考察文采与风格理解

prompt:

文心5.0的表现,确实超出了预期。

本以为它会堆砌“大约”、“的确”、“罢”等标志性词汇,结果它不按套路来,开头就是一句:

OK,只是今夜,写稿的时候忽然觉得有些冷清。

如果说前一个问题考察的是抽象文学,那么接下来的测试,则更强调跨语境的概念创造能力

我们进一步脑洞大开,要求文心5.0在几个看似毫不相干的领域之间建立映射关系:

这个问题背后,其实藏着多重转换。它既要懂《西游记》,也要熟悉目前AI行业情况,还要在两者之间找到结构性对应关系。

文心5.0说:

就怎么说呢,一本正经搞抽象,还真戳到了现在投资人的痛点!

我们看到了文心5.0如何处理一个高度开放、需要多重知识框架融合的指令,其文科能力并不止于分析与模仿,而是具备了概念创新、体系构建与跨语境叙事的综合能力。

缺乏口才与情商支撑的文科素养是不完整的。最后,我们把视角从写作拉回现实。

在职场中,如果你遇到了类似这种倒霉事儿:

面对人际关系,沟通与交流能力如果保持在下面这种水平(手动狗头):

那还是来学一学文心5.0吧。

它直接安排了一整套方案,玄学口彩法、幽默自嘲转移焦点法、霸道总裁背锅法都写得很条理清楚,适用情况也标注了。

有木有山东的朋友来评评这能打几分:

虽然这次测试的重点放在了文本创作上,但文心5.0的全模态能力,依然值得再提一嘴。

从Preview阶段测试中我们就发现,不管是复杂的英文宣传片,还是信息密度高的视频内容,文心5.0都能直接挖掘出视频中展现的细节,输出高质量总结。更重要的是,多次实测,它的整体表现一直很稳定,几乎没出现过幻觉。

能做视频总结不算稀奇,但能总结得这么详细具体、理解得这么有深度的,确实少见。

另外,各种梗图它也都能吃透:

一番实测下来,大家说文心是AI届的“最强文科生”果然名不虚传。结合其全模态能力,其实不难发现,文心5.0的优势,体现在理解、推理与生成之间的整体协同

这也正好把问题引向了下一层,文心5.0这些表现,是怎么被支撑起来的?

底层技术全景解析

从技术上来看,与传统多模态模型先训练单模态、再拼接融合不同,文心5.0从一开始就通过原生全模态建模,融合语言、图像、视频和音频等多模态数据,实现原生全模态的统一理解和生成。

文心5.0通过对不同模态的训练目标进行离散化建模,采用统一的自回归架构进行训练,使多模态特征在统一架构下充分融合并协同优化,大幅提升了全模态统一建模能力。

正因如此,它能像人一样,看到画面能理解语境,听到声音能捕捉情绪,做到理解+生成一体化

架构层面,文心5.0采用了超大规模混合专家(MoE)模型架构,总参数超过2.4万亿,通过超稀疏激活,每次推理只调用不到3%的参数,在保持模型强大能力的同时降低计算与推理成本。

通俗来讲,模型虽然庞大,却像一台智能选择开关的发动机,只启动最关键的模块,因此既强大又能高效运转,降低计算与推理成本。

在文心5.0的后训练阶段,百度还强化了长程任务和智能体能力。通过在大规模真实与模拟工具环境合成长程任务轨迹数据,对模型进行数据增强,并基于思维链、行动链,采用端到端多轮强化学习,使得模型在规划、决策、工具调用上都有明显提升。

换句话说,它不仅能理解和生成内容,更能主动完成跨步骤、跨模态的复杂任务,为应用开发和产业落地提供了强大底座。

目前,大模型基建正在模型能力的前沿探索上成为越来越核心的壁垒。百度的飞桨和文心的联合优化,深度协同,正在发挥越来越强的作用。

在文心5.0的训练和推理环节,百度飞桨提供了全链路支撑。

训练端,依托飞桨研发的多模态编码器分离异步训练架构、五维混合并行、动态自适应显存动态卸载、流水线编排友好的弹性训练以及收敛无损的大规模FP8混合精度技术,文心5.0在预训练周期内提速超240%

推理端,飞桨设计了全模态统一多级分离推理框架,针对超稀疏混合专家架构的特性,设计实现了低时延的专家并行通信、以及Query、Token、专家多级负载均衡,最终通过多P多D动态全互联实现大规模分布式部署,并通过自适应多步投机解码、效果无损W4A8C8量化等技术进一步加速。

原生全模态深水区,如何应用是关键

如果把视角拉高一点,最近大模型竞争的重心正在明显发生变化。原生全模态路线正逐渐成为全球AI竞争的新焦点。

在国外,OpenAI的GPT-4o、Google的Gemini 3等模型已展现出原生全模态的强大潜力;在国内,文心5.0押注的正是这条更底层、也更长期的技术路径。

更重要的是,百度是全球为数不多的提供全栈AI技术的公司之一:从芯片、云、模型,到智能体应用层生态,形成了闭环的工程体系。

这种能力结构,使其在原生全模态这种长周期、高系统复杂度的路线中,具备一定的持续投入与迭代空间。

当然,这并不意味着胜负已分。

强大的技术底座是第一步,模型的价值最终要体现在实际应用中。如何将强大的基础模型转化成落地的应用模型,百度给出的判断也很务实:

在具体规划上,百度把文心的应用模型,拆成了两条线:

一方面是面向通用产品的矩阵模型,包括文心Lite模型、视频大模型、语音大模型。

另一方面是针对行业场景打磨的专精模型,包括搜索闪电专精模型、商业蒸汽机模型、文心数字人大模型及行业大模型。相比单点能力展示,这套逻辑更强调可复用、可规模化落地。

大会现场,百度把几项技术摆到了台前:

基于声音Token的端到端合成大模型,已经把语音从“拼模块”推进到真正的端到端生成;5分钟超越真人的直播技术,不只做到像不像,而是解决直播带货真正需要的情绪、节奏和感染力;而实时交互数字人技术,通过文本、语音、视频三态Token的联动,实现低延迟、低成本、高表现力、可实时互动的数字人输出。

据了解,其中一些能力已经走出了Demo阶段、进入实用场景。例如实时交互数字人技术,目前已经直接服务于内容生产、电商直播等真实场景,现场展示的罗永浩数字人,正是基于这套应用模型体系落地的案例之一。

去年,基于百度数字人生成技术的罗永浩数字人直播,就曾打破行业纪录。

总结而言,文心的技术势能正在被高效地转化为面向产业的具体解决方案。随着这些能力持续向业务渗透,模型的价值将在实际应用场景中得到放大和验证。

当然,原生全模态能否在性能、成本、稳定性以及开发者生态中形成真正的正反馈,仍需要更长时间来验证。

但可以确认的是,在这条技术路线上,百度已经成为一个具备现实可能性、值得被持续观察和看好的重要玩家。

真正的考验,now,才刚刚开始。

相关内容

江晓阳出任华泰证券资管董事...
转自:证券时报人民财讯1月23日电,1月23日晚间,华泰证券全资子...
2026-01-23 23:03:08
美国年初经济持续保持增长态...
格隆汇1月23日|标普全球市场情报首席商业经济学家Chris Wi...
2026-01-23 23:03:03
参考8年前估值定价!云南城...
每经记者|蔡鼎    每经编辑|魏文艺     ...
2026-01-23 23:02:55
南宁市举行2026年南A东...
转自:南宁发布1月22日,由自治区园区办、自治区数据局及南宁市人民...
2026-01-23 22:58:19
中科星图:“一体两翼”战略...
在产业深度变革与技术驱动并行的时代背景下,中科星图(688568)...
2026-01-23 22:58:13
你不知道的美国:弗林特水危...
(来源:CGTN)弗林特水危机是美国历史上著名的水污染和铅中毒事件...
2026-01-23 22:58:08
经观月度观察|经济修复平稳...
来源:@经济观察报微博李晓丹 实习生 王欣 彭萧州/文有色金属价格...
2026-01-23 22:58:02
江西三地人事变动
江西三地一批人事变动具体如下↓↓景德镇景德镇市第十六届人民代表大会...
2026-01-23 22:57:59
确保受灾群众温暖过冬,中央...
近日,国家防灾减灾救灾委员会办公室研究部署进一步做好灾后恢复重建、...
2026-01-23 22:57:50

热门资讯

江晓阳出任华泰证券资管董事长 转自:证券时报人民财讯1月23日电,1月23日晚间,华泰证券全资子公司——华泰证券(上海)资产管理有...
美国年初经济持续保持增长态势,... 格隆汇1月23日|标普全球市场情报首席商业经济学家Chris Williamson表示,美国PMI初...
参考8年前估值定价!云南城投拟... 每经记者|蔡鼎    每经编辑|魏文艺     云南城投(SH600239,股价2...
南宁市举行2026年南A东盟谷... 转自:南宁发布1月22日,由自治区园区办、自治区数据局及南宁市人民政府联合主办的2026年南A东盟谷...
中科星图:“一体两翼”战略驱动... 在产业深度变革与技术驱动并行的时代背景下,中科星图(688568)正处于一个极为关键的战略转型期。过...
你不知道的美国:弗林特水危机的... (来源:CGTN)弗林特水危机是美国历史上著名的水污染和铅中毒事件。2014年,弗林特市因财政危机将...
经观月度观察|经济修复平稳 政... 来源:@经济观察报微博李晓丹 实习生 王欣 彭萧州/文有色金属价格逆势大涨、制造业PMI重返扩张区间...
江西三地人事变动 江西三地一批人事变动具体如下↓↓景德镇景德镇市第十六届人民代表大会第六次会议公告(第29号)景德镇市...
确保受灾群众温暖过冬,中央冬春... 近日,国家防灾减灾救灾委员会办公室研究部署进一步做好灾后恢复重建、受灾群众安置和生活保障等工作,确保...
美国1月标普全球制造业PMI初... 每经AI快讯,1月23日,美国1月标普全球制造业PMI初值 51.9,预期52,前值51.8。 美国...