炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!
(来源:网易科技)
美东时间12月2日周二,亚马逊云计算部门AWS在年度云计算盛会re:Invent上推出新一代人工智能(AI)训练芯片Trainium 3,预告了下一代产品Trainium 4的开发计划,加大力度挑战英伟达和谷歌在AI芯片市场的主导地位,同时推出Nova 2系列模型和全新AI服务,试图在激烈的AI竞争中抢占更多市场份额。
AWS宣布,Trainium 3芯片已于近期部署至少数几个数据中心,并从本周二当天起向客户开放使用。AWS的副总裁Dave Brown表示:“进入明年初,我们将开始非常非常快速地扩大规模。”
这款芯片的推出速度超出业界常规。亚马逊在部署前一代加速器约一年后便发布了Trainium 3,与英伟达承诺的每年发布新芯片的快节奏相当。
亚马逊希望吸引寻求性价比的公司。公司宣称,Trainium芯片能以比英伟达市场领先的图形处理单元(GPU)更低廉和高效的方式,为AI模型背后的密集计算提供动力。Brown表示:"我们对Trainium实现正确的价格性能比的能力感到非常满意。"
亚马逊周二不仅发布了四款新模型,还推出了业内首创的"开放式训练"服务Nova Forge,并发布了专注于浏览器任务自动化的代理服务Nova Act。此次发布的Nova 2家族涵盖推理、多模态处理、对话式AI和代码生成等多个领域,主打价格性能比优势。
新AI芯片的消息公布后,亚马逊股价逼近239美元刷新日高,日内涨幅扩大到将近2.2%,而盘初曾涨3.2%的英伟达股价进一步收窄涨幅,美股早盘尾声时刷新日低,几乎抹平所有涨幅。其竞争对手AMD的股价跌幅扩大、日内跌近1.7%。到收盘,亚马逊涨逾0.2%,英伟达涨近0.9%,AMD跌近2.1%。
Trainium 3性能大幅跃升
AWS称,其第四代 AI 芯片Trainium 3是首款3纳米(nm)制程的AWS AI芯片,专为下一代智能体、推理和视频生成应用程序App提供最佳代币经济效益而打造。
据AWS官方数据,搭载Trainium 3芯片的Trn3 UltraServer系统在训练和推理性能上都实现了显著提升。相比第二代产品,新系统速度提升超过4倍,内存容量增加4倍。
每颗Trainium 3芯片提供2.52千万亿次浮点运算(PFLOPs)的FP8算力,内存容量较Trainium 2增加1.5倍至144GB HBM3e,内存带宽提升1.7倍至4.9TB/s。单台完整配置的Trn3 UltraServer可容纳144颗芯片,总算力达362 PFLOPs,并提供高达20.7TB的HBM3e内存和706TB/s的聚合内存带宽。
能效提升同样引人注目。AWS表示,Trn3 UltraServer的能效比前代产品提高40%,性能功耗比提升4倍。在Amazon Bedrock平台上,Trainium 3成为AWS最快的加速器,性能较Trainium 2提升3倍,每兆瓦输出token数量增加超过5倍,且延迟水平相当。
Brown在采访中表示:"我们对Trainium在价格性能方面的表现非常满意。"该系统还可在EC2 UltraClusters 3.0中扩展至数十万颗芯片,AWS称其目标是年底前为AI初创公司Anthropic提供100万颗芯片。
Trainium 4将支持英伟达互联技术
亚马逊在会上还预告了正在开发中的Trainium 4芯片。这款下一代产品将带来性能的重大跃升,并将支持英伟达的NVLink Fusion高速芯片互联技术。
这一技术兼容性意味着,搭载Trainium 4的AWS系统将能够与英伟达GPU互操作并扩展性能,同时仍使用亚马逊自研的低成本服务器机架技术。这可能帮助AWS吸引那些基于英伟达GPU开发的大型AI应用迁移至亚马逊云平台。
值得注意的是,英伟达的CUDA架构已成为所有主流AI应用支持的事实标准。Trainium 4对NVLink的支持或将降低这些应用转向AWS的技术门槛。
亚马逊未公布Trainium 4的具体发布时间表。按照以往发布节奏,外界预计将在明年的re:Invent大会上获得更多信息。
软件生态仍是短板
尽管硬件性能强劲,亚马逊芯片仍面临生态系统挑战。与英伟达相比,AWS芯片缺乏帮助客户快速部署的深度软件库。
建筑设备自动驾驶公司Bedrock Robotics的首席技术官Kevin Peterson表示,虽然该公司在AWS服务器上运行基础设施,但在构建指导挖掘机的模型时仍使用英伟达芯片。"我们需要它性能强大且易于使用,"Peterson说,"那就是英伟达。"
目前使用Trainium芯片的主要客户是Anthropic,这些芯片分布在印第安纳州、密西西比州和宾夕法尼亚州的数据中心。AWS今年早些时候表示,已将超过50万颗芯片串联起来帮助Anthropic训练最新模型,,并计划在年底前为这家OpenAI的劲敌提供100万颗芯片。
不过Anthropic同时也在使用谷歌的TPU(张量处理单元),并在今年早些时候与谷歌达成协议,获得价值数百亿美元的计算资源。
除Anthropic外,亚马逊公布的其他主要客户寥寥,令分析师难以评估Trainium的实际效果。AWS表示,日本的LLM Karakuri、Splashmusic和Decart等客户已在使用第三代Trainium芯片和系统,并显著降低了推理成本。
AWS承诺通过AWS Neuron SDK和原生PyTorch集成,让开发者无需更改任何模型代码即可进行训练和部署,试图以此缩小与英伟达的软件生态差距。
四款Nova 2模型各有侧重
亚马逊此次推出的四款Nova 2模型针对不同应用场景设计。Nova 2 Lite是一款快速、经济的推理模型,专为日常工作负载设计,可处理文本、图像和视频并生成文本。在与竞争对手的基准测试对比中,该模型在15项测试中有13项表现优于或持平Claude Haiku 4.5,在17项测试中有11项优于或持平GPT-5 Mini。
Nova 2 Pro是亚马逊最智能的推理模型,可处理文本、图像、视频和语音并生成文本,适用于代理编码、长期规划等高度复杂任务。该模型在与Claude Sonnet 4.5的16项基准测试中有10项表现更优或持平,与GPT-5.1的16项测试中有8项更优或持平,与Gemini 2.5 Pro的19项测试中有15项更优或持平。
Nova 2 Sonic是亚马逊的语音到语音模型,统一了文本和语音理解及生成功能,支持实时、类人对话式AI。该模型拥有100万个token的上下文窗口,支持扩展的多语言功能,并可与Amazon Connect、Vonage、Twilio等电话服务提供商无缝集成。
Nova 2 Omni是业内首款统一的多模态推理和生成模型,可处理文本、图像、视频和语音输入,同时生成文本和图像。该模型可同时处理多达75万个单词、数小时音频、长视频和数百页文档,一次性分析整个产品目录、客户评价、品牌指南和视频库。
Nova Forge开创"开放式训练"模式
Nova Forge是AWS推出的首创服务,让企业能够构建自己的Nova模型定制版本——亚马逊称之为"Novellas"。该服务开创了"开放式训练"模式,为客户提供对预训练、中期训练和后训练Nova模型检查点的独家访问权限,使客户能够在模型训练的每个阶段将专有数据与亚马逊Nova策划的数据集混合。
这一服务解决了企业在将专有知识嵌入AI应用时面临的三大难题:定制专有模型时整合深度有限、继续训练开源权重模型时缺乏原始训练数据访问权限,或从零开始构建模型成本高昂。
除了模型检查点和数据混合能力,Nova Forge还提供三项核心功能:使用客户自己的环境(称为强化学习"gyms")训练AI的能力,创建更小、更快模型的选项,以及实施安全控制的负责任AI工具包。
Reddit正在使用Nova Forge改进内容审核系统。Reddit首席技术官Chris Slowe表示:"我们正在用单一、更准确的解决方案替代多个不同的模型,使审核更加高效。用一种统一的方法替代多个专门的机器学习工作流程,标志着我们在Reddit上实施和扩展AI方式的转变。"
Booking.com、Cosine AI、Nimbus Therapeutics、野村综合研究所、OpenBabylon和索尼等公司也在使用Nova Forge构建自己的模型。客户使用Nova Forge创建的模型可以部署在Amazon Bedrock上,享有与其他Bedrock模型相同的企业级安全性、可扩展性和数据隐私保护。
Nova Act实现浏览器任务自动化突破
Nova Act是AWS推出的新服务,用于构建和部署能在网络浏览器中执行操作的高可靠性AI代理。该服务由定制的Nova 2 Lite模型驱动,为构建和管理自动化浏览器任务的代理提供最快、最简便的路径。Nova Act在早期客户工作流程中实现了90%的可靠性,并在相关基准测试中表现优于竞争模型。
Nova Act通过强化学习训练定制的Nova 2 Lite模型,在数百个模拟网络环境中运行数千项任务,从而实现突破性可靠性。这种训练方式使Nova Act在基于用户界面的工作流程中表现出色,例如更新客户关系管理系统中的数据、测试网站功能或提交健康保险索赔。
开发人员可以在几分钟内使用无代码平台通过自然语言提示开始原型设计,然后在VS Code等熟悉的集成开发环境中完善代理,最后部署到AWS。客户在本地构建和测试的内容可以在生产环境中扩展,并通过Nova Act AWS控制台获得全面的管理工具和监控。
亚马逊介绍,多家企业已经注意到Nova Act的成效。其中,初创公司Sola Systems集成Nova Act后,每月为客户自动化数十万个工作流程,涵盖对账支付、协调货运和更新医疗记录等关键业务任务。
1Password使用Nova Act减少用户访问登录信息的手动步骤,只需一个简单提示即可在数百个不同网站上自动工作。Hertz通过使用Nova Act自动化其租赁平台的端到端测试,将软件交付速度提高了5倍,消除了质量保证瓶颈,将原本需要数周的工作缩短至数小时。