明略科技(2718.HK)获CICAS 2025特等奖:Mano与HMLLM双技术如何改写多模态大模型应用范式
创始人
2025-12-27 11:22:55
0

在多模态大模型技术快速演进的今天,一个关键问题始终困扰着业界:大模型应该向何处发展?是追求更大的参数规模,还是探索新的应用范式?北大系AI企业明略科技用实践给出了答案。

12月26日,在2025第三届全国人工智能应用场景创新挑战赛(CICAS)姑苏专项晋级赛中,明略科技(2718.HK)联合北京大学的参赛项目《基于多模态大模型的品牌出海创意生成与情感链接智能平台》从70余个参赛团队中脱颖而出,斩获“特等奖”殊荣,成功晋级全国总决赛。

明略科技不仅解决了具体应用问题,更重要的是,改写了多模态大模型的应用范式,为AI技术从"通用智能"走向"专业智能"、从"内容理解"走向"行为预测"提供了新的技术路径。

从对话助手到操作智能体:Mano的范式创新

传统大模型的定位,主要是"对话助手"——你问它答,它能理解你的问题,生成相应的回答。但在实际应用中,企业需要的往往不是"告诉我怎么做",而是"帮我做"。Mano灵巧手的创新,正是实现了从"对话助手"到"操作智能体"的范式转变。

这一转变的核心,是Mano突破了传统大模型"只能对话不能操作"的局限。通过视觉理解、任务拆解、代码生成、自主学习四大核心能力,Mano实现了VLA(视觉-语言-行动)模型的范式创新。

VLA模型的关键,在于将"视觉感知"、"语言理解"、"行动执行"三者深度融合。传统的多模态模型,通常只融合视觉和语言,输出仍然是文本或图像。VLA模型的突破在于,它的输出是"行动"——点击按钮、填写表单、提取数据等实际操作。

"这不仅是技术能力的扩展,更是应用范式的革命。"明略科技技术团队表示,"当大模型能够'操作'而不仅仅是'对话',它就从助手变成了智能体,能够真正替代人工完成复杂任务。"

Mano在OS-World评估基准中的表现,充分证明了这一范式的价值。OS-World测试的是模型在真实操作系统环境中完成复杂任务的能力,比如"在浏览器中搜索信息并整理成表格"、"从多个网站采集数据并进行对比"等。Mano以54.0%的任务成功率刷新纪录,在Special Model赛道排名第一,总榜仅次于Claude-Sonnet-4.5,位居第二。

这一成绩的意义在于,Mano用72B参数实现了与千亿级参数模型相当的操作能力。"我们不是追求最大的参数规模,而是在特定领域做深度优化。"明略科技技术团队解释,"通过模型压缩技术(荣获AAAI 2026 Oral),我们在保证性能的同时,将模型规模控制在可私有化部署的范围内。"

更重要的是,Mano的自主学习能力,使其能够持续进化。通过"探索→使用→自标注→再训练"的循环,Mano能够自主适应新网站、新系统,无需人工标注大量训练数据。这种自主学习机制,为操作智能体的规模化应用提供了可能。

从客观内容到主观感知:HMLLM的范式突破

如果说Mano改写了大模型的"输出范式"(从文本到行动),那么HMLLM则改写了大模型的"输入范式"(从客观内容到主观感知)。

传统的多模态模型,通常融合视觉、文本、音频等"客观内容"信号。比如,一个视频多模态模型,会分析画面中有什么物体、说了什么话、播放了什么音乐。但它无法回答一个关键问题:观众看到这个视频,会有什么感受?

HMLLM的突破,正是首次将脑电、眼动等"主观感知"信号纳入多模态建模,开创了"生理信号+内容信号"融合的新范式。

这一范式的创新性在于,它不仅分析"内容是什么",更预测"感受会如何"。通过采集1万+真实受试者的脑电与眼动信号,构建Video-SME与SPA-ADV两大原创数据集,HMLLM学会了将内容特征与生理反应关联起来。

当一个人看到某个画面时,瞳孔会放大、脑电波会出现特定模式,这些都是真实感受的直接反映。HMLLM通过超图结构,将视频帧、音频、人口特征与生理信号统一建模,实现了从“分析内容”到“预测感受”的跨越。

HMLLM在ACM MM2024(CCF-A类国际顶级会议)上获得最佳论文提名,提名率仅2%,充分证明了这一范式的学术价值。更重要的是,HMLLM的预测结果与真人主观感受的一致性(R²)超过89%,证明了这一范式的实用价值。"

双技术协同:从理解世界到操作世界和感知主观

Mano和HMLLM两项技术的价值,不仅在于各自的范式创新,更在于它们共同代表了多模态大模型发展的两个重要方向。

第一个方向,是从"理解世界"到"操作世界"。传统大模型擅长理解和生成内容,但缺乏实际操作能力。Mano的突破,让大模型能够真正"动手",从被动的知识库变成主动的执行者。这一方向的应用场景非常广泛:

在营销领域,Mano可以自动采集竞品数据、监测社媒舆情、分析广告效果;

在RPA(机器人流程自动化)领域,Mano可以自动处理订单、填写表单、生成报告;

在数据治理领域,Mano可以自动清洗数据、标注数据、验证数据质量。

Mano的价值在于,它让AI从告诉你怎么做变成帮你做,这是从工具到智能体的跨越。

第二个方向,是从"分析内容"到"预测感受"。传统多模态模型擅长分析客观内容,但无法预测主观感受。HMLLM的突破,让大模型能够"读心",从内容分析延伸到情感计算。这一方向的应用场景同样广泛:

在营销领域,HMLLM可以预测创意内容的情感效果,优化投放策略;

在情感计算领域,HMLLM可以分析用户情绪状态,提供个性化服务;

在神经科学研究领域,HMLLM可以辅助研究人员分析脑电数据,发现新的认知规律。

HMLLM的价值在于,它让AI从分析说了什么变成预测感受到什么,这是从客观分析到主观预测的跨越。

从通用智能到专业智能的技术路径

明略科技的双技术创新,为多模态大模型的发展提供了重要启示:在通用大模型领域难以超越国际巨头的情况下,专注垂直场景、做深度优化的专业化模型,可能是更具商业价值的发展方向。

这一路径的核心,是"从模态融合走向能力融合"。传统的多模态研究,主要关注如何融合不同模态的信息(视觉+文本+音频)。明略科技的创新在于,不仅融合模态,更融合能力:

Mano融合了"感知能力"(视觉理解)、"认知能力"(任务拆解)、"执行能力"(代码生成),实现了从理解到行动的完整闭环;

HMLLM融合了"内容分析能力"(多模态理解)、"生理信号解读能力"(脑电眼动分析)、"主观预测能力"(情感建模),实现了从客观到主观的完整闭环。

作为北大系AI企业,明略科技将学术研究的严谨性与产业应用的实战性深度融合。创始人吴明辉毕业于北京大学数学系,后保送本校攻读人工智能硕士,2006年在北大读硕士期间创办了秒针系统。从北大校园走出的明略科技,在负责人吴明辉的带领下,团队在国内外高水平期刊、会议发表论文20余篇。

这些学术成果不是"为发论文而发论文",而是技术创新的深度证明。Mano的模型压缩技术荣获AAAI 2026(CCF A类)Oral口头汇报,HMLLM在ACM MM2024(CCF-A类)获得最佳论文提名,这些成绩展现了明略科技在学术界的影响力。

同时,明略科技参与了科技创新2030"新一代人工智能"重大项目,在国家课题支撑下,将基础研究与产业需求深度结合,形成了"基础研究→技术创新→产品开发→市场验证→反哺研究"的完整闭环。

2019年,明略科技获批建设"营销智能"国家新一代人工智能开放创新平台,这一认定标志着其技术能力获得了国家层面的权威认可。2025年,明略科技成功签约为香港特区政府第五批重点企业伙伴,并担任中国商务广告协会AI营销应用工委会理事长兼秘书长单位。

对多模态大模型发展的启示

明略科技此次获得特等奖的Mano和HMLLM双技术,对多模态大模型的发展具有重要启示意义。

第一,专业化深度优化可以与参数规模竞赛形成差异化优势。Mano用72B参数实现了与千亿级参数模型相当的操作能力,证明了在垂直领域做深度优化的价值。这为中小企业和研究机构提供了新的发展路径:不必追求最大的参数规模,而是在特定领域做到最好。

第二,能力融合比模态融合更重要。多模态研究不应停留在"融合更多模态"的层面,而应关注"实现什么能力"。Mano融合了感知、认知、执行能力,HMLLM融合了内容分析、生理解读、主观预测能力,这些能力融合才是真正的价值所在。

第三,从"理解"到"行动"、从"客观"到"主观"是两个重要的发展方向。传统大模型主要关注"理解世界"和"分析客观内容",Mano和HMLLM分别在"操作世界"和"预测主观感受"两个方向实现了突破,为多模态大模型的发展开辟了新的空间。

第四,学术研究与产业应用的深度结合是技术创新的关键。明略科技既能在国际顶级学术会议上发表论文,又能在实际应用中创造商业价值,这种"产学研一体化"的模式,是技术创新的重要保障。

明略科技的特等奖,不仅是对其技术创新的认可,更是对多模态大模型应用范式创新的认可。Mano和HMLLM双技术,代表了多模态大模型从"通用智能"走向"专业智能"、从"内容理解"走向"行为预测"的重要方向,为AI技术的发展提供了新的技术路径。

在全球AI技术竞赛中,以明略科技为代表的北大系AI企业,正在用实力证明:中国AI技术不仅能跟上,更能在垂直领域实现领跑,为全球AI技术发展贡献中国智慧和中国方案。

相关内容

活动丨元旦去哪儿玩?百禧公...
(来源:上观新闻)这个冬天,来百禧公园赴一场“有味道”的年味之约!...
2025-12-27 13:17:51
从“满足需求”到“创造需求...
转自:大湾区之声2025年,粤港澳大湾区消费市场热潮涌动,焕发出多...
2025-12-27 13:12:58
前豆包PC端产品负责人齐俊...
  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力...
2025-12-27 13:12:53
电车通编辑买车记:研究半年...
  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力...
2025-12-27 13:12:49
泽连斯基称将与特朗普在美国...
中新社北京12月27日电 综合消息:乌克兰总统泽连斯基当地时间26...
2025-12-27 13:12:45
罕见!中国首次拍到虎虎虎虎...
(来源:环球时报)转自:环球时报 ...
2025-12-27 13:08:09
金正恩向普京致贺电:朝鲜将...
据新华社援引朝中社27日报道,朝鲜国务委员长金正恩当天向俄罗斯总统...
2025-12-27 13:08:05
尚福林:攻克结构性和机制性...
转自:北京日报客户端12月27日,中国财富管理50人论坛2025年...
2025-12-27 13:08:00
马斯克豪赌算力:xAI五年...
来源:环球网 【环球网科技综合报道】12月27日消息,据tomsh...
2025-12-27 13:07:54

热门资讯

活动丨元旦去哪儿玩?百禧公园“... (来源:上观新闻)这个冬天,来百禧公园赴一场“有味道”的年味之约!地道年货、非遗手作、有机农产、街头...
从“满足需求”到“创造需求”,... 转自:大湾区之声2025年,粤港澳大湾区消费市场热潮涌动,焕发出多元蓬勃的新活力:“国补+省补+市补...
前豆包PC端产品负责人齐俊元加...   炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会! (来源:三言科技)据...
电车通编辑买车记:研究半年选了...   炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会! (来源:网易科技)“...
泽连斯基称将与特朗普在美国举行... 中新社北京12月27日电 综合消息:乌克兰总统泽连斯基当地时间26日称,他将于本月28日在美国与美总...
罕见!中国首次拍到虎虎虎虎虎虎 (来源:环球时报)转自:环球时报 【罕见!#中国首次拍到...
金正恩向普京致贺电:朝鲜将永远... 据新华社援引朝中社27日报道,朝鲜国务委员长金正恩当天向俄罗斯总统普京致贺电表示,在2026年即将到...
尚福林:攻克结构性和机制性挑战... 转自:北京日报客户端12月27日,中国财富管理50人论坛2025年会在京举办。中国财富管理50人论坛...
马斯克豪赌算力:xAI五年欲超... 来源:环球网 【环球网科技综合报道】12月27日消息,据tomshardware报道称,马斯克旗下人...
美国加州撤诉美政府终止拨款加州... 美国加利福尼亚州高铁管理局当地时间12月26日证实,已撤销就“美国联邦政府取消对加州高铁联邦拨款”向...