阿里云李飞飞:大模型Token调用激增百倍,首提AI原生数据库硬标准
创始人
2026-01-23 18:34:04
0

来源:钛媒体

图片来自AI生成

“现在谁喊AI Native(AI原生)数据库,谁就是‘大跃进’。” 阿里云资深副总裁、数据库产品事业部负责人李飞飞如此表示。

AI浪潮正以前所未有的力度,重塑数据库。过去数据库的核心任务是存得住、查得快、事务不出错,大模型到来之后,企业亟需一个能统一处理多模态数据,并能与大模型高效协同的新型数据基础设施,这个有着数十年历史的基础软件市场,正在被大模型悄然改变。

云厂商的主流做法是,在其云原生数据库底座上,快速集成向量检索、模型调用等AI能力,强调平滑升级、成本优势和对海量现有客户的延续性。而新兴势力则更倾向于讲述原生AI的故事,主张为AI工作负载从头设计存储、查询与计算架构,以获取极致的性能与灵活性。

这种对比颇有些类似AI芯片行业数年前的故事,AI芯片创业企业试图实现打造专用芯片,以实现更高的性能和更好的性价比,挑战英伟达。但是,大模型的快速演进使得那些定向优化失效,反而是更具备通用性的英伟达GPU,持续保持市场统治力。

李飞飞直言,“今天有些数据库厂商已经喊出AI Native(AI原生)数据库,我们还是实事求是,不想那么喊,因为AI赛道本身还在快速演进,我不认为现在任何人做到了所谓的AI Native。”

什么才算是真正的AI Native(AI原生)数据库,李飞飞提出了自己判断 AI 原生数据库的两项标准:超一半的数据库实例由 AI Agent(智能体)直接驱动使用;超一半的数据库输出是Token。当前尚属于向AI原生数据库演进的过渡阶段。

数据库的行业逻辑,变了

“未来一段时间,人工智能行业的瓶颈可能不再是算力,而是数据和存储。”李飞飞表示,在人工智能向超级智能(ASI)演进的路径上,经典的“内存墙”问题以新的形式回归,近期DRAM等存储硬件价格大幅上涨,正是这一趋势的体现。

存储涨价是行业变革的一个缩影,真正的推力是由大模型掀起的、重塑整个产业链的合力。AI时代的数据是文本、图片、音频、视频、向量、图结构等,传统数据库只擅长前两种的一小部分,现在要同时处理结构化 + 半结构化 + 非结构化 + 向量化表达,数据库向多模态的融合数据库演进。

李飞飞认为,从学习人、辅助人到自我迭代超越人,大模型正在吞噬一切冷数据和温数据,将其压缩为模型参数。然而,企业业务系统中实时产生的“热数据”(Hot Data),因其动态变化、高频更新的特性,短期内无法被大模型完全内化。

“热数据才是维持智能引擎运转的高价值燃料。”李飞飞强调,将高质量、实时的私域热数据,与通用的、具备强大认知能力的大模型有机结合,是实现“辅助人”到“超越人”的关键。而最佳的化学反应发生地,正是数据库内部。

为此,阿里云在过去两年将PolarDB从一个云原生数据库,快速演进为一个 “AI就绪的云原生数据库”。其核心理念是:将大模型能力嵌入数据库,让智能交互在数据实时产生的地方发生,数据不必来回搬运,也更好地保障了数据主权与隐私安全。

和过去不同的是,数据库厂商要同时懂数据和模型。传统数据库团队强在系统工程,AI 团队强在模型算法,但 AI 时代的数据库,需要两者深度融合,这不是加几个向量索引就能完成改造,而是架构层面的改变,为此阿里云也很早和百炼团队合作,但是一年前,当李飞飞宣布打通百炼时,外界还有疑问,并不完全理解阿里云的意图。

“现在回头看,绝对是轻舟已过万重山。在过去的短短几个月内,通过阿里云瑶池数据库产品体系(包括云原生数据库PolarDB、云原生数据仓库AnalyticDB、云数据库RDS等)调用百炼、PAI及内置模型算子服务所消耗的Token量,增长了超过100倍。”李飞飞说。

阿里云数据库的“4+1”行动

一位数据库产品负责人对笔者表示,业界对 “AI 原生” 的理解确实存在差异。“有的认为深度集成向量计算和模型调用就是原生,有的则认为需要从存储引擎到查询优化器为 AI 工作负载彻底重写。”

另一位行业分析师则认为,定义权之争的背后是技术路线与市场卡位的双重博弈。“原生“这个词本身就意味着代际优势和市场洗牌的机会。没有厂商愿意在此时落后于叙事。

李飞飞表示,AI原生数据库是技术演进的必然方向。从云原生到AI就绪、再到AI原生,现阶段阿里云PolarDB正在打造AI就绪的云原生数据库。

从云原生到“AI就绪”,阿里云提出了一个“4+1”的核心演进框架。首先,是存储层走向AI数据湖库(Lakebase)。传统数据库擅长处理结构化数据,而AI时代需要处理文本、图像、视频等多样化数据。多模态AI数据湖库(Lakebase)架构融合了数据库与数据湖的能力,成为支持多模态数据处理、特征提取与检索的第一步。

其次,是统一的元数据管理,AI时代的数据源爆炸性增长,且格式高度异构,元数据本身的规模已从过去的兆字节跃升至太字节级别。阿里云将Zero-ETL技术应用于元数据层,实现了数据源变更时元信息的实时自动同步,高效治理海量异构数据。

第三,是多模态检索与处理能力,数据库需从单一的结构化查询,演进为能同时支持向量、全文、图等多种检索方式的融合引擎,实现对非结构化数据的深度理解与利用。

第四,是模型算子化与Agent AI的原生支持。大模型虽能“吞噬”冷、温数据,却无法实时消化业务系统中持续产生的“热数据”,将模型推理能力以“算子”形式内置到数据库,让大模型能直接、实时地与高价值热数据互动,让Token的消耗变得场景化、有价值。同时,数据库必须成为AI Agent开发、部署和运行的最佳平台,因为未来大量的数据库交互将由自主Agent完成。

最后的“+1”,是跟上硬件创新步伐。经典的“内存墙”问题在AI时代重新凸显,内存等硬件成本正进入长期上涨周期。数据库系统必须充分利用CXL内存池化、异构计算(CPU/GPU)统一调度等硬件级创新,通过池化、共享与弹性来化解成本压力,将硬件红利转化为用户价值。

为什么是 “50%”?

尽管阿里云试图为AI原生数据库设立高门槛,但市场并未等待共识达成。过去一年,包括谷歌云、Snowflake、微软,以及国内的腾讯云、字节跳动火山引擎、蚂蚁集团 OceanBase 等,都已将 “AI 原生” 或 “AI 增强” 作为数据库产品的核心卖点。

各家路径虽有不同,但共识相近,与大模型服务的深度集成,提供从数据准备、向量化到推理调用的一站式体验,成为竞争焦点。

回到李飞飞所谈的“AI原生数据库“判断标准,“一半实例给 Agent 用”,这关乎谁在主导数据交互,未来企业内大量常规的数据查询、写入、分析任务将由 AI Agent 自主完成,而非人类工程师编写固定代码。

“一半输出是 Token”,传统数据库的核心产出是规整的表格,供给业务系统或分析师。而在李飞飞描绘的图景中,未来的数据库更像一个 “数据与 AI 的融合反应堆”,实时业务数据在此被即时转化为 Token,与内置或外联的大模型进行推理交互,直接产出智能决策、自然语言回答或驱动业务流程。

AI能力之外,行业也格外关注数据库的成本,阿里云数据库产品事业部产品管理与技术架构部负责人王远表示,规模效应始终是释放成本红利的基础。阿里云通过资源池化、多租户间的共享以及极致的弹性伸缩,这三者的共同作用,是在AI时代硬件成本上涨的背景下,确保价格优势的关键。

例如,并非所有数据都需要昂贵的高速存储,PolarDB通过智能化冷热数据分层与调度,自动将数据迁移至高性价比的存储介质,在用户无感的情况下降低存储成本。同时利用CXL等新兴硬件技术,构建超大规模的远端内存池,该池可供多租户共享复用,大幅提升内存利用率,并间接提升CPU利用率,以对冲当前内存价格的快速上涨趋势。

目前,阿里云PolarDB海内外企业客户超2万,部署规模超300万核,覆盖全球86个可用区。PolarDB 云原生与Data+AI相关功能与创新技术已规模化应用于金融、汽车、政务、互联网、电信等领域的核心业务系统,服务了某大型商业银行、理想汽车、小鹏汽车、MiniMax、GoTo集团、度小满、米哈游等知名企业。(本文作者 | 张帅,编辑 | 盖虹达)

特别声明:以上内容仅代表作者本人的观点或立场,不代表Hehson财经头条的观点或立场。如因作品内容、版权或其他问题需要与Hehson财经头条联系的,请于上述内容发布后的30天内进行。

相关内容

让消费者舒心购无忧购(大数...
核心阅读商场环境如何保持新鲜感,实体店购物后退换是否方便,预订服务...
2026-01-23 20:28:33
马踏雪原 鹿鸣山间
近日,在银装素裹的内蒙古克什克腾旗乌兰布统草原牧民们赶着马群驰骋在...
2026-01-23 20:28:29
新建运动场地2495个!内...
转自:草原云1月23日,记者从全区体育局长会议中了解到,“十四五”...
2026-01-23 20:28:25
【图解】2025农业农村发...
编辑:呼乐乐
2026-01-23 20:28:22
福建沙县农商银行被罚264...
  1月23日金融一线消息,中国人民银行福建省分行行政处罚决定信息...
2026-01-23 20:28:13
万达电影(002739)获...
1月24日,万达电影股份有限公司(股票代码:002739,简称"万...
2026-01-23 20:28:08
ST智云拟1.46亿元和解...
北京,2026年1月24日 —— 大连智云自动化装备股份有限公司(...
2026-01-23 20:28:02
宏英智能子公司拟开展600...
上海宏英智能科技股份有限公司(证券代码:001266,证券简称:宏...
2026-01-23 20:27:58
削减三分之一!大众核心品牌...
导读:大众精简核心品牌集团的董事会职位不涉及集团顶层治理结构的改变...
2026-01-23 20:27:53

热门资讯

让消费者舒心购无忧购(大数据观... 核心阅读商场环境如何保持新鲜感,实体店购物后退换是否方便,预订服务、预付费用会不会有“坑”……消费环...
马踏雪原 鹿鸣山间 近日,在银装素裹的内蒙古克什克腾旗乌兰布统草原牧民们赶着马群驰骋在白色雪原上,犹如一幅水墨画而在“中...
新建运动场地2495个!内蒙古... 转自:草原云1月23日,记者从全区体育局长会议中了解到,“十四五”期间,内蒙古聚焦各族群众多样化健身...
福建沙县农商银行被罚264万元...   1月23日金融一线消息,中国人民银行福建省分行行政处罚决定信息公示表(闽银罚决字〔2026〕1—...
万达电影(002739)获批2... 1月24日,万达电影股份有限公司(股票代码:002739,简称"万达电影")发布第七届董事会第九次会...
ST智云拟1.46亿元和解股权... 北京,2026年1月24日 —— 大连智云自动化装备股份有限公司(证券代码:300097,简称“ST...
宏英智能子公司拟开展6000万... 上海宏英智能科技股份有限公司(证券代码:001266,证券简称:宏英智能)于2026年1月22日召开...
削减三分之一!大众核心品牌集团... 导读:大众精简核心品牌集团的董事会职位不涉及集团顶层治理结构的改变,更多是出于运营层面的降本提效考量...
因投资者账户实名制管理不到位等...   炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会! (来源:北京商报)北...