中国企业深度求索(DeepSeek)公布数周前发布的实验性人工智能模型的两个新版本,增加了几处新功能,公司称它们将有助于结合推理并自主执行某些操作。
DeepSeek在9月发布的模型由于其实验性质被称为DeepSeek-V3.2-Exp,但最新版本则被简单地命名为 DeepSeek-V3.2。该初创公司表示,这项新服务在多项推理基准测试上的表现可与OpenAI的旗舰人工智能模型GPT-5相匹敌,表明中国的开源系统至少在某些指标方面仍能与硅谷最前沿的模型竞争。
DeepSeek还表示,V3.2版本将类似人类推理的能力与使用搜索引擎、计算器和代码执行器等工具的能力相结合。
公司在X上发帖称,DeepSeek-V3.2是首个将思考融入工具使用的模型,同时支持思考模式与非思考模式的工具调用。
DeepSeek在1月以一个突破性的AI模型震惊全球科技界,该公司将该模型的实验版本描述为迈向下一代人工智能的一步。
DeepSeek发布的第二个版本V3.2-Speciale专注于数学计算和其他长时推理能力。该初创公司表示,“DeepSeek-V3.2-Speciale的目标是将开源模型的推理能力推向极致,并探索模型能力的边界。”
DeepSeek 表示,DeepSeek-V3.2-Speciale在主流推理基准测试上的性能表现媲美Gemini-3.0-Pro,而且在国际数学奥林匹克竞赛和国际信息学奥林匹克竞赛等标准化测试中的表现能达到金牌水平。
DeepSeek称,公司提出了一种大规模Agent训练数据合成方法。
这是一个新的迹象,表明这家有影响力的人工智能实验室正在加力研发以使AI处理更快、更高效。上周DeepSeek发布了一个名为DeepSeekMath-V2的新开源模型,在数学定理证明方面展现出强大能力。
该初创公司在题为《DeepSeek-V3.2:推动开源大语言模型的前沿》的技术报告中表示:“DeepSeek-V3.2 在多个推理基准上实现了与Kimi-k2-thinking和GPT-5类似的性能。”编辑/陈佳靖