“王者归来”之后 谷歌再下重注:世界模型将迎来“ChatGPT时刻”
创始人
2025-11-22 09:50:08
0

《科创板日报》11月22日讯 Gemini 3 Pro前脚刚亮相,Nano Banana Pro又紧随其后登场,短短几天,谷歌两大新品就掀翻全球AI圈,上演了一场“王者归来”的戏码。

两款模型都来自DeepMind,眼下Gemini和Nano Banana余热未过,DeepMind已投身下一个方向——在最新采访中,DeepMind首席执行官兼联合创始人Demis Hassabis(戴密斯•哈萨比斯)直言世界模型是通往AGI的关键部分。

世界模型是目前我投入最多时间的领域。你可能知道前几天发布的SIMA 2(注:谷歌一款基于Gemini技术的3D虚拟世界AI智能体),我有时候会把它称作‘在Genie思维中玩的SIMA’。这些东西让我着迷,我认为它们将是实现AGI的关键组件。它们在底层使用Gemini,但有各种扩展。”

目前,谷歌内部已将世界模型用于训练其他智能体及机器人,哈萨比斯认为,世界模型会有很多内部研究用例,也将出现一些出色的外部应用。

当被问及世界模型是否会迎来“ChatGPT时刻”时,哈萨比斯给出了肯定的回答,但只有解决了高昂的推理/服务成本瓶颈,并实现保持长时间一致性的能力之后,世界模型才能迎来真正的爆发时刻。

哈萨比斯提到的Genie,即是谷歌世界模型的“代表作”。短短一年半时间里,DeepMind就将Genie从2D一路升级至能实时生成交互式3D环境的Genie 3。只需一句话,Genie 3就能在720p分辨率下创造一个用户可以边走边看的动态世界,场景细节能在长达一分钟的记忆中保持连贯。除了游戏外,Genie 3还能为机器人或自动驾驶系统提供多元化训练场景,可以为AI智能体研究提供更长、更稳定的交互回合。

▌让AI“读懂”世界,还是“看懂”世界?

当下,这种对“世界模型”的追求正迅速在硅谷研究一线中蔓延。

Meta公司首席人工智能科学家、图灵奖得主杨立昆(Yann LeCun)在本周三正式官宣,将于年底从Meta离职。他计划创立一家专注于“世界模型”技术的初创公司,该技术旨在突破网络数据的局限,通过分析更广泛的信息来更准确地呈现物理世界及其特性。

AI教母李飞飞同样也是世界模型的拥趸,其创业公司WorldLabs在一周前推出了首款产品Marble,由多模态世界模型驱动,这个被其称为“构建空间智能未来的基础”的产品,能从一张图片、一段视频或一句话中构建持久的3D世界。

英伟达此前也已推出世界基础模型开发平台Cosmos,可以帮助开发者直接生成合成数据,用于自动驾驶和机器人研究训练中。

从本质上来说,这背后触及的是AI最核心、最本质的分歧——想实现真正的AGI,是应该让AI通过文字“读懂”世界,还是让AI“看懂”世界?

“读懂派”代表如OpenAI,认为只要堆砌的数据资料足够多,智能就能自动涌现;“看懂派”则认为大语言模型充其量只是一个强大的文本数据库,记住了海量文本,却完全不理解文本背后的物理世界。用李飞飞的话来说,世界模型能让“看见”晋升为“推理”,让“感知”转化为“行动”,让“想象”落地为“创造”。

必须承认的是,与“读懂派”交出的ChatGPT、Sora等已引发全球轰动的模型相比,世界模型领域目前确实缺乏现象级消费产品,谷歌的Genie几乎是唯一表现惊艳的案例。在这种情况下,这条路难免面临“雷声大、雨点小”的质疑声,甚至被部分舆论判定为“皇帝的新衣”。

但这是否意味着世界模型前途黯淡?下结论还为时过早。

大语言模型的成功,某种程度上建立在海量公开文本和代码的“喂食”上;而构建一个能理解并推演物理规律的世界模型,底层挑战无疑更为艰深。这项技术仍处于初期爬坡阶段,它需要的或许不是即刻的喝彩,而是更多一些的耐心与时间。

相关内容

广发研究 | 本周精选
  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力...
2025-11-22 10:25:39
专注力不足?用对方法,让“...
在信息爆炸的数字时代学习时“专注力不足”已成为困扰许多人的普遍问题...
2025-11-22 10:25:34
“这句话伴随着我们在华的每...
巴西“红色”网站11月18日文章,原题:中国:我所见、所闻与所感 ...
2025-11-22 10:25:31
​加密投资人 Simon ...
(来源:吴说)吴说获悉,Moonrock Capital 创始人 ...
2025-11-22 10:25:19
31金110牌2593分!...
转自:四川发布11月21日晚第十五届全运会在深圳胜利闭幕四川体育代...
2025-11-22 10:25:16
积极布局6G技术演进,多家...
面向“十五五”,网络强国是现代化产业体系的重要一环,第六代移动通信...
2025-11-22 10:25:12
川网传媒A股股东户数不变,...
11月21日消息,数据显示,截至2025年11月21日,川网传媒A...
2025-11-22 10:25:06
司法部、应急管理部负责人就...
2025年11月16日,国务院总理李强签署第822号国务院令,公布...
2025-11-22 10:20:57
股市的逻辑,全变了!
转自:刘晓博说财经过去几个交易日,股市风云突变,连续发生了三件大事...
2025-11-22 10:20:54

热门资讯

广发研究 | 本周精选   炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会! 01深度报告01宏 ...
专注力不足?用对方法,让“分心... 在信息爆炸的数字时代学习时“专注力不足”已成为困扰许多人的普遍问题为什么专注力会下降医生指出现代社会...
“这句话伴随着我们在华的每一天... 巴西“红色”网站11月18日文章,原题:中国:我所见、所闻与所感 中国太了不起了!这句话在巴西代表团...
​加密投资人 Simon De... (来源:吴说)吴说获悉,Moonrock Capital 创始人 Simon Dedic 在 X 发...
31金110牌2593分!四川... 转自:四川发布11月21日晚第十五届全运会在深圳胜利闭幕四川体育代表团最终在本届全运会竞技体育项目获...
积极布局6G技术演进,多家运营... 面向“十五五”,网络强国是现代化产业体系的重要一环,第六代移动通信(6G)等未来产业将成为新的增长点...
川网传媒A股股东户数不变,流通... 11月21日消息,数据显示,截至2025年11月21日,川网传媒A股股东总户数为1.64万户,较上期...
司法部、应急管理部负责人就《森... 2025年11月16日,国务院总理李强签署第822号国务院令,公布《森林草原防灭火条例》(以下简称《...
股市的逻辑,全变了! 转自:刘晓博说财经过去几个交易日,股市风云突变,连续发生了三件大事:1、华尔街对美国人工智能泡沫的担...
陈博彰任长沙市政府党组书记 转自:中国经济网综合中国经济网长沙11月22日综合报道 21日,长沙市召开全市领导干部会议。省委常委...