(来源:中国改革报)
转自:中国改革报
□ 本报记者 杜 壮 刘 政
近日,本报记者走进北京人工智能公共算力平台的核心机房,只见机柜整齐排列,指示灯密集闪烁,散热风扇低沉嗡鸣,昼夜运转,吞吐着来自全国的人工智能算力需求。调度大屏上,算力峰值利用率与各算力节点调度率两个数字实时跃动,不断刷新着一座城市数字底座的运转节奏。
这个算力中心承载的算力,正是北京数字经济高速增长的缩影。2025年,北京市数字经济增加值突破2.4万亿元,同比增长8.7%,占全市地区生产总值的46.4%。北京算力汇聚总量超6万P,覆盖京津冀蒙等跨区域资源。
从大模型训练到场景落地,从头部企业创新到初创团队试错,算力正从稀缺资源转化为公共基础资源,像水一样流动、普惠、不可或缺。机房里日夜不息的运转声,不仅是硬件的轰鸣,更是北京数字经济从夯基垒台迈向积厚成势的真实脉动。
能源与算力的“化学反应”
北京人工智能公共算力平台由北京市海淀区政府和京能集团联合打造,京能数字产业有限公司(以下简称京能数产)承建运营。2025年3月,平台正式发布,基于自建和第三方纳管的数万P算力,面向科技企业、高校院所和创新创业群体,提供弹性智能算力资源、大模型训练和推理任务提交、大模型Token服务等不同层级的普惠算力。
京能数产技术负责人田鹏伟告诉记者,目前北京人工智能公共算力平台的算力用户以基础大模型用户、场景应用用户及科研机构为主。例如,平台通过海淀弹性算力实验室,为小微、初创企业及团队提供动态小量算力资源服务,解决初创团队的算力使用难题。
在人工智能飞速发展的当下,算力已成为核心生产力,但其背后的能源消耗亦不容忽视。田鹏伟对记者说:“新一代人工智能的直接要素是数据、模型和算力,而至关重要的间接要素却是能源。”他指出,人工智能是能耗增长最快的领域,电力消耗、机房制冷等用能成本更是占据了大模型全生命周期运营成本比较大的比重。
算力是能耗大户,如何平衡算力增长与绿色低碳,是北京数字经济发展必须回答的问题。平台依托北京本地的能源布局,在算力项目规划中统筹考虑电力资源匹配,正在积极引入周边绿电,提升绿电消纳,降低算力运营的用能成本。与此同时,平台在制冷等环节与电厂集中式制冷站协同,有效降低PUE(电能利用效率),实现“电—冷—热”多能源综合利用。这些探索为北京建设绿色算力基础设施积累了宝贵经验,也为全国算电协同发展提供了可参考的实践样本。
攻克“异构”技术壁垒
在采访中,田鹏伟多次提及“异构”一词。当前,国内算力市场芯片种类繁多,规格和性能不一,如同水平和风格各异的乐手无法完成合奏。如何将不同厂商、不同架构、分布在异地的算力资源“纳管”起来,形成统一的资源池,是业界公认的痛点,也是算力能否真正实现普惠的关键。
“光是匹配和调度算力还不够,还需要能让大模型任务跑起来、跑得好,最终还要看性价比。”田鹏伟强调。作为运营方,京能数产扮演着模型厂商与硬件厂商之间特殊纽带的角色。平台投入大量研发力量,协同上下游厂商组建跨领域技术团队,针对异域异构算力芯片进行端到端的适配与优化。
谈及技术攻坚带来的效能提升,他举例说,在大模型推理场景中,通过PD分离技术,可以将预填充(Prefill)和解码(Decode)两个计算阶段拆解,分别部署在两款特性迥异的异构算力芯片上——一款擅长高算力爆发,另一款拥有大显存和高带宽。这种异构混合并行的创新模式,经优化后整体性价比可能超过单独使用任何一款芯片。“这种‘化学反应’式的协同,单靠芯片厂商或模型厂商都很难独立完成,这正是我们作为平台运营方的核心价值。”
此外,平台打造的异域异构大规模算力调度核心技术,能有效盘活闲散算力。田鹏伟说,即便是位于内蒙古等西部节点的算力,经过平台的纳管与优化,也能以稳定的服务质量无感地服务于北京用户。这既缓解了核心城区的能耗压力,又响应了“东数西算”的战略号召,将表面的算力荒转化为实际的算力活力,通过技术手段解决了资源错配的问题。
“算力超市”开启普惠时代
在平台的线上服务模式里,一个名为“算力超市”的概念引人注目。这里打破了传统IDC服务的门槛,不仅有面向专业机构的弹性算力资源,更有面向广大开发者的“大模型Token服务”。田鹏伟解释道,当前用户需求正在明显分层,头部大模型企业需要万卡集群进行训练,而广大的中小企业和初创团队则可能只需要少量算力进行微调、推理或应用开发。
为了满足多元化的需求,北京人工智能公共算力平台构建了全层级的普惠服务体系。对于专业用户,提供裸金属服务器和容器服务,支持弹性伸缩;对于缺乏技术背景的开发者,则提供开箱即用的API接口(Token服务),用户无需关心底层芯片型号,只需像购物一样选择模型尺寸和SLA(服务等级协议),即可调用千亿参数大模型的能力,应用于聊天机器人、辅助编程或智能体开发。
这种模式的成效正在显现。年初至今,平台算力需求持续旺盛,头部基础大模型用户和场景应用用户增长尤为明显。特别是通过海淀弹性算力实验室与北京市“算力券”政策的结合,平台为小微企业和初创团队提供了动态小额算力资源服务,极大地降低了AI创新的门槛。
“以前初创团队可能买不起服务器,也租不到合适的卡,现在通过我们的平台,他们可以按需、用较低的成本验证想法、跑通模型。”正如田鹏伟所说,这种“滴灌式”的算力供给,正在滋养着北京庞大的AI创新生态,让无数从0到1的创意得以落地生根,转化为首都数字经济发展的强劲动能。