炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!
(来源:经济观察报)
文/陈永伟
2025年的帷幕已经落下,这一年中,AI行业无疑走过了极具里程碑意义的一程。从技术范式的革新,到商业逻辑的重构,从产业应用的落地,到全球规则的博弈,这一年既有突破,也留下诸多思考。
鉴于AI发展错综复杂,这里只能从十个侧面做一个简要回顾。
一、多模融合
过去几年中,AI大模型在文字、推理等方面进展神速,但它们多模态能力的发展却相对迟缓,这在很大程度上限制了其能力的发挥。比如,在4.0版本之前,GPT虽然已经能写诗、会编程,但既看不见、也画不出,如果用户想让它分析一张图片讲了什么,或是根据要求生成一张图片,它就显得力不从心。
虽然从2024年开始,AI开发者们就开始大力发展模型的多模态能力,但在相当长一段时间里,这些努力仍然主要集中在对既有模型进行组合——文本一个系统,图像一个系统,语音再来一个系统,然后用工程手段把它们拼在一起。这样的模型可以完成一些多模态任务,但由于各系统之间存在协调问题,其能力局限性一直十分明显。到了2025年,越来越多的开发者不再满足于这种“拼装式”方案,转而开始设计“原生多模态”模型,从训练之初起,就让模型在同一个体系里同时处理文本、图像、音频、视频等信息。
在设计原生多模态模型的过程中,很多人逐渐意识到:多模态模型的真正瓶颈,并不在于它能不能看图、听声音,而在于能否把视觉、语言、时间与空间组织成一个可推理、可行动的统一表征。现在的大模型在语言上已经高度成熟,却依然缺乏对三维空间、物理约束和因果关系的系统理解。因此,下一代AI的突破重点,可能并不在于再多几个参数,而在于能否构建对真实世界的内部模型,使其可以在脑中“预演”行动后果。在这种思路之下,“世界模型”与“空间智能”重新被重视,并逐渐成为设计原生多模态模型的重要理论依据。
在实践层面,多模态模型几乎成为头部AI企业的主战场。企业不再满足于“能看图”,而是把能力推进到看得准、看得全、看得懂流程,并能把视觉理解转化为可执行的动作:有的强化视觉与语言的一体化表达,有的把能力扩展到视频与长时序理解,也有的尝试把“看懂屏幕”转化为界面操作。共同的趋势是,模型不再只是回答问题,而是越来越多地介入真实任务本身。
多模态模型的蓬勃发展,为AI技术的应用化和普及化提供了强大的助力。麦肯锡在《技术趋势展望2025》中指出,多模态AI正在成为新一代AI系统的关键底座,并将与智能体(Agent)、自动化、物理系统控制深度融合,其影响将从数字世界延伸至现实世界。而Gartner则强调,多模态技术的影响将超出AI范畴,全面重塑当前的软件生态。据其预测,到2030年,80%的企业软件将在其产品中植入多模态AI能力。
二、具身爆发
如果说多模融合解决了AI“怎么看”和“怎么理解”的问题,那么具身智能(Embodied AI)要回答的,则是AI在真实世界中“做什么”和“怎么做”。虽然具身智能的发展已有数十年时间,但过去,机器人更多停留在实验室展示阶段:完成一些酷炫动作,在受限场景中做局部自动化,人们讨论的也只是它们“技术上究竟能做到什么”。而到了2025年,情况开始发生变化——具身机器人真正走向市场,行业叙事也从“能不能做到”转向“能不能规模化、能不能稳定工作、能不能进入岗位”。
最直接的信号,来自量产节奏的变化。2025年,国内的宇树、优必选,国外的波士顿动力、Apptronik等企业,都明确宣布产品进入量产与商业化试点阶段,而不再只是单台原型或演示样机。在以北美和中国为代表的主要市场中,具身机器人开始按“百台级”“千台级”规划供应链、制造与交付。IDC估算显示,2025年全球在仓储、制造、巡检等岗位的试点应用,较2024年增长了数倍。
与此同时,成本也出现了显著下降。几年前,能够与人交互的人形机器人价格动辄几十万甚至上百万美元,几乎无法商业化;而根据美国银行研究院的数据,目前典型人形机器人的价格已经下降到每台约3.5万元左右,比2023年下降至少40%,并且未来几年还有继续下探的空间。这种成本下降,正在迅速降低使用门槛,让机器人更容易走向工厂、走进家庭。
具身智能在2025年的“爆发”,是多种因素共同作用的结果。一方面,原生多模态AI的发展,补上了机器人“看不懂世界”的短板,让它不仅会跑会跳,还能理解环境、根据情境做出决策,从而具备真正的实用价值;另一方面,用工成本的持续抬升,也在扩大市场需求。制造、物流、巡检、服务等领域本就劳动力密集,在老龄化、年轻人不愿进入高强度岗位、合规与安全成本增加等因素叠加下,企业开始转而接受机器人替代,由此带动了需求的快速增长。
三、算力竞争
如果说前几年算力竞争的核心,是“谁能抢到更多GPU”,那么到了2025年,这场竞争已从资本驱动的资源争夺,升级为一场长期、立体、甚至带有地缘意义的综合博弈。
首先,算力竞争从“规模导向”转向“效率导向”。过去,人们普遍相信:模型遇到瓶颈,就继续叠加参数与算力;但随着规模膨胀,成本与复杂度迅速上升,边际收益却不断递减。越来越多公司开始意识到,决定差距的已不是算力总量,而是如何把有限算力转化为有效能力。国产模型 DeepSeek 就是典型——通过多维并行、混合精度等策略,在更低投入下做出接近性能,被视为“效率转向”的象征。
其次,部分开发者开始直接介入芯片环节。长期以来,GPU几乎是大模型训练的唯一主力,而英伟达的供应与生态具有决定性影响。为降低依赖,一些公司转向自研芯片。谷歌的TPU便是代表,如今已在核心模型训练中大规模替代GPU,逐步构建起相对自主的算力体系。
第三,算力设施开始全面“基础设施化”。过去企业扩容,只需采购服务器、租机房、叠加云服务;而在大模型时代,这种“拼装式”做法难以承载高密度并行与稳定需求。2025年的智算中心,从一开始就围绕AI负载设计:网络拓扑以并行训练为核心,甚至连选址都需要同时评估电力、能耗与时延。一些公司也通过投资与并购深入上游,押注包括“太空算力”等潜在方向。
四、范式争议
就在产业界为赢得算力竞争而各显神通之时,理论界开始对持续算力投入的理论基础——“规模法则”提出反思。过去十几年里,这几乎是一条被反复验证的铁律:更多数据、更大模型、更强算力,往往带来更好的效果,进而塑造了研究范式、资本逻辑与产业结构。但到了2025年,围绕这条路径的信心,第一次出现了系统性分化。
比如,“图灵奖”得主杨立昆多次指出,单纯扩大自回归大模型,并不会自然通向通用智能。当前以语言预测为核心的模型,本质上仍是“被动系统”,缺乏因果理解、物理常识与长期规划能力;继续堆参数与数据,只会带来收益递减,反而掩盖结构性短板。类似的观点,也被其他研究者认同。安德烈·卡帕斯强调,未来突破更可能来自训练范式、数据结构与推理机制,而不是参数规模本身;原OpenAI首席科学家伊利亚·苏茨克维同样提醒,“无限堆规模”可能正在接近阶段性极限。
不过,规模法则依然有不少拥护者。他们认为,以大模型为核心的路线仍在推进,能力边界仍在外扩,尤其在多模态和复杂推理任务上,规模仍是重要前提。DeepMind联合创始人德米斯·哈撒比就认为,通向更高层次智能的关键在于世界模型、规划与推理结构——这些并非否定规模,而是在规模基础上的方向修正。在这种视角下,规模法则未必终结,反而可能在新范式出现后获得新的生命。
规模法则是否继续有效,还需要时间来验证。但当我们把支持与反对的观点放在一起看,就会发现:双方其实都对现有范式有所不满。或许,正是这种争议,会推动AI界重新审视既有思路,从而寻找一条更优的发展路径。
五、代理崛起
2025年3月,初创公司Monica公布了一段名为Manus的AI应用演示视频。视频中,它可以根据用户要求,自动调用外部工具,完成简历筛选、房产研究、股票分析等复杂任务,全程无需人工干预。Manus一度迅速走红,被视为继 DeepSeek 之后的又一“现象级”产品;虽然随后因“技术创新不足”“炒作过度”而引发争议,但它仍被看作AI智能体崛起的重要象征。更有意味的是,Meta 随后以数十亿规模收购了Manus,从侧面印证了这一趋势。
AI智能体不同于传统大模型,它不只是“更聪明的对话界面”,而是一种能够理解目标、拆解任务、调用工具、执行操作并根据反馈调整策略的主体。它带来了人机交互方式的变化:从“人去找功能”,转向“任务驱动系统”。过去用户需要理解界面结构、在多个页面来回切换;而在智能体模式下,只需提出目标,系统便自动规划路径,在关键节点请求确认。这种转变看似细微,却显著降低了学习和使用成本。
需要强调的是,智能体的出现并非偶然,而是多项技术成熟后的结果:一方面,大模型在推理、多模态和长上下文上的能力增强,使其能够理解复杂任务;另一方面,MCP、ANP、A2A 等协议使工具调用与外部系统接入逐步标准化,AI不再局限于“只会说话”,而可以操作代码、文档、数据库乃至业务系统与物理设备,由此第一次具备跨步骤、跨系统完成任务的可行性。
可以预见,智能体将对产业生态产生深远影响。它带来的,并不仅是自动化某些岗位,而是重组流程本身——组织结构将从围绕“人”设计,逐渐转向围绕“任务”组织。在商业层面,价值计量也会从“提供能力”转向“完成事情”:企业不再按调用量付费,而更可能按任务与结果付费,从而推动商业模式发生变化。
当然,智能体的兴起也伴随风险。就业替代、隐私与数据使用边界等问题,都可能成为普及过程中的阻力。围绕豆包AI手机引发的争议,已经为我们揭开了冰山一角,类似讨论在未来一段时间内仍将持续。
六、开源盛世
2025年,开源模型已经从AI世界的边缘力量,逐渐演变为全球创新的基础设施。在这一年里,开源模型在性能、生态与采用率上全面逼近闭源体系,甚至在部分场景实现超越。多份权威报告显示,近两年新发布的大模型中,开源或“开放权重”模型已占据多数,而在被活跃调用的模型里,开源模型也占到大头,尤其在私有部署、微调和智能体等场景中占据主导。
开源模型的崛起,并不只是因为“免费”,而是AI创新逻辑正在发生变化:算力成本上升、应用需求高度分化,封闭模型难以覆盖全部场景;而开源模型依托社区协作与快速定制,在工程效率和适配能力上展现出明显优势,吸引了越来越多企业和开发者加入其中。
在这种背景下,AI创新的分工结构正在重组——基础模型不再是“终点产品”,而更像操作系统或数据库的底层平台;真正的创新,越来越多发生在模型之上的微调、工具链、智能体架构与行业应用中。开源由此不再只是理想主义选择,而成为降低门槛、加速扩散的现实机制。
在这股浪潮中,中国力量格外醒目。以 DeepSeek 与 Qwen 为代表的一批模型,在工程效率、推理成本与可部署性上形成鲜明优势。相关统计显示,2025年全球开源模型使用中,中国来源已接近三成,正在成为全球开源生态中最重要的供给方之一。
从更长时间看,2025年的“开源盛世”,并非简单的路线回潮,而是AI进入成熟阶段的标志之一:当创新不再过度依赖封闭体系与资本堆叠,而更多依赖开放协作与工程智慧,谁能够提供“可用、可改、可扩展”的技术底座,谁就将在下一阶段占据更有利的位置。
七、商业革新
过去两年,“盈利难”一直困扰着AI行业。很多公司即便做出了不错的产品,却仍然难以形成稳定收入,最终被迫退出市场。到了2025年,行业开始逐渐摸索出新的商业路径——不同层级的玩家,各自找到与自身能力匹配的变现方式,AI也从单一的技术竞赛,转向分工更加清晰的产业生态。
在技术底层,能力开始被商品化。算力、训练与推理被标准化为可计量、可定价的“生产要素”,云厂商、芯片公司与基础模型提供方,通过算力租赁、API与推理服务形成相对稳定的收入结构。随着算力基础设施化、模型效率提升,这一层也逐渐从“军备竞赛”走向“运营竞争”,单位成本下降、单位调用价值上升。
在平台服务层,“结果作为商品”(Outcome-as-a-Service,OaaS)开始崛起。过去AI产品更多停留在“功能售卖”,而智能体的普及,让“完成任务”成为核心价值单位,定价也逐渐转向按任务、流程或结果收费。虽然时间不长,但这一模式正在成为利润潜力最大、竞争最激烈的地带。
在应用层,场景分化明显成熟。2025年,一个重要变化是:通用应用的想象空间收敛,而垂直行业的价值被逐步释放。无论软件开发、企业运营、金融分析还是内容与客服,AI正深度嵌入业务流程,与数据和规则耦合,逐渐成为企业的长期系统投入,而不再是一次性工具采购。
这三层叠加在一起,标志着一个转折:AI的商业逻辑正在从“能力展示”走向“效率兑现”。过去更大的模型更容易获得关注与融资;而在2025年,真正决定成败的,是谁能把能力稳定转化为可计量的客户价值,这也促使越来越多公司把重心放在工程效率、部署成本和用户留存之上。
八、规则博弈
如果说此前AI发展的主要矛盾集中在技术层面,那么到了2025年,另一条同样重要的战线——AI治理——已经全面展开。它可以从两个维度理解:一是创新与规则之间的横向张力,二是不同制度体系之间的纵向博弈。
从横向看,矛盾并不在于“要不要监管”,而在于如何避免规则过早锁死尚未定型的技术路径。AI的不确定性,使“先立规矩、再准入”的传统方式面临挑战:制定得过早,可能固化现有形态;放得过松,又可能积累系统性风险。2025年的一个明显变化是,治理逐渐从“静态合规”转向“动态校准”,通过分层、分阶段、可调整的方式,与技术演进保持同步。
这一转向,源于对AI本质的重新理解:AI不是单一产品,而是一套持续演化的能力体系。因此,治理对象也从单个模型,延伸到数据、算力、模型训练、部署与使用场景等完整链条。共识正在形成——治理的目标不是压低创新速度,而是在不可逆节点上避免风险放大,“沙盒”“分级管理”“事后纠偏”等机制由此逐渐取代“一刀切”做法。
从纵向看,治理正在演化为国家与制度之间的竞争。规则不再只是内部秩序工具,而具有外溢效应:谁的规则更易被采纳,谁就获得更大的制度影响力。
在这一维度上,美国倾向将治理视为“护栏”,优先关注国家安全、关键基础设施与极端风险,尽量减少对研发的前置限制;其逻辑是,通过技术领先来换取治理弹性。
欧盟则强调在扩散之前先明确制度边界,通过系统化规则塑造发展方向,以规则和标准参与全球竞争。
中国更强调发展秩序与场景适配,规则与产业推进同步调整,不提前冻结技术路线,也不过度依赖事后纠偏,但对治理能力提出更高要求。
当这些不同路径在全球层面相遇时,治理便成为一场规则间的博弈:企业在不同制度间选择落地,技术在不同规则中分化演进,标准在竞争中被试探与扩散。全球治理格局因此更可能呈现多套模式并存、相互影响的状态。
从这个角度看,2025年的治理博弈,并非AI发展的“减速器”,而是其迈向成熟的标志之一——当技术被系统性治理,意味着它既足够重要,也具有潜在风险。如何在创新开放性与规则约束之间形成动态平衡,将决定AI能否长期、稳定嵌入社会结构。
九、大国竞合
2025年,AI 的国际竞争已从企业层面上升到国家层面:谁来定义下一代 AI 的技术路径?谁能掌控芯片与算力供应链?谁有能力把技术选择转化为全球通行的标准?围绕这些问题,中美欧逐渐形成了一种彼此错位、却高度纠缠的竞争格局。
在核心技术层面,美国依然掌握着最强的话语权。这种优势不仅体现在模型性能,更体现在“问题定义权”上——从大模型、多模态到世界模型、智能体架构,许多关键方向往往首先由美国提出,随之而来的评测方式与技术叙事,也自然成为行业默认参照。
中国的路径则明显不同。并未把全部筹码押在“重新定义范式”上,而是更强调在既有技术框架下,通过工程优化、系统集成和真实场景反馈,把技术转化为可规模复制的能力,从而在训练效率、算力调度、具身智能与产业级应用等方面逐步形成优势。
欧盟在核心技术原创上的存在感相对有限,但并未缺席。它更多通过基础研究网络、跨国科研项目与评测体系,在关键概念与方法论层面保持影响力,为后续标准制定保留位置。
如果说核心技术决定长期上限,那么芯片与算力供应链,则决定谁能把技术持续跑下去。美国在高端芯片设计、先进制程与软件生态上的主导,使算力逐渐具有战略属性;中国在压力之下加快推进多路径算力体系建设,一方面补齐本土芯片与制造能力,另一方面通过智算中心与算法优化增强韧性;欧洲虽然在规模上不占优势,但在设备、材料与部分关键工艺节点上仍然不可替代。
随着 AI 从软件工具走向基础设施,标准制定权的重要性迅速上升,并成为最隐蔽、也最持久的竞争战场。美国更多依托技术领先形成“事实标准”,中国在大规模部署中形成“用出来的标准”,欧洲则试图通过制度化规则,在国际标准体系中持续发声。三种路径并行,使标准本身成为竞争的一部分。
值得注意的是,这种竞争并非简单对抗。现实中的中美欧,在技术、供应链与市场层面依然高度相互依赖:美国的前沿技术离不开全球制造体系,中国的产业能力深度嵌入国际网络,欧洲的规则影响力也需要技术生态配合。由此,2025年的国际格局更接近“高强度竞争中的有限合作”。真正的较量,已不再是单一模型或一代技术的胜负,而是围绕谁能构建并长期运转一整套技术与产业体系。
十、少帅掌兵
2025年AI行业的另一个重要趋势,是一批三十岁出头、甚至二十多岁的年轻科学家开始被大公司赋予指挥权,直接影响工程架构、数据策略与下一代AI能力的走向。
腾讯在调整AI组织架构时,任命27岁的姚顺雨为首席AI科学家,并负责基础设施与大模型团队;更早之前,小米启用“95后”科学家罗福莉负责MiMo系列核心研发。在硅谷,这一趋势更为明显。Meta引入Scale AI创始人亚历山大·王担任首席AI官,并在其与公司内部元老意见冲突时仍然坚定支持,显示出对年轻技术领袖的高度信任。
这种“年轻化+实权化”的背后,是AI发展逻辑本身的变化:AI已经进入“下半场”。技术边界不再只是把模型做得更大、更久,而是重新定义问题、重塑评估方式、判断未来路径。越来越多的企业意识到,AI的核心从“解决问题”转向“提出什么问题、如何衡量进步”,而这种能力往往出现在长期浸泡在一线研究中的年轻技术派身上。
因此,“少帅掌兵”并非一时的人事口号,而是产业进入深水区后的结构性调整:当技术范式更加不确定、探索性更强,组织更需要那些愿意快速试错、敢于在不完全信息下判断的人,而不仅依赖经验丰富的工程管理者。正因如此,罗福莉、姚顺雨、亚历山大·王等年轻科学家,不仅站在研发一线,也开始直接影响公司战略与技术路径。可以预计,在未来相当长时间内,AI方向的关键抉择,很可能就掌握在这一代年轻技术领袖手中。
免责声明:本文观点仅代表作者本人,供参考、交流,不构成任何建议。
上一篇:QDII额度使用迎来新规范
下一篇:共迎中国人民警察节