上海顶尖医疗团队与大模型比拼“胃肠道疾病诊疗”,医学AI评测联盟成立
创始人
2025-11-21 21:52:01
0

(来源:上观新闻)

昨天,“智汇医学 AI无界”浦江医学人工智能大会暨首届上海市医学人工智能应用技能大赛总结会在上海举行,集中展示了“人工智能+医疗”进入标准化、体系化、全球化新阶段的实践成果。上海人工智能实验室发布了全新升级的中文医疗大模型评测平台MedBench 4.0,为衡量医学AI产品的性能与可靠性提供了科学标尺。

会上,上海人工智能实验室牵头的“医学人工智能评测联盟”正式成立。这个联盟将广泛汇聚国内顶尖医疗机构、权威行业组织和领先科技企业,致力于成为医疗人工智能测评与验证领域的核心力量,通过聚焦制定临床导向的评测标准、共建高质量标注数据集,以及探索多模态及智能体融合评测技术路线三大方向,搭建产学研用多方共建的交流合作平台。

医学人工智能评测联盟在上海成立。

《医疗大模型应用安全实施指南》标准草案在会上同步发布,填补了我国医疗大模型安全应用标准的空白,为技术创新划定安全边界,提供实践准则。复旦大学附属中山医院计算机网络中心副主任张俊钦结合《指南》中的规范条文,提出具体场景的操作要点与风险防控建议,为行业合规应用提供了实用参考。

会上,上海人工智能实验室发布了全新升级的中文医疗大模型权威评测平台MedBench 4.0。这是全国首个且唯一面向垂直模型、专业模型和应用场景的医疗大模型评测与验证体系。此次升级聚焦“实战化评测突破”与“生态化开放共建”两大核心方向,包含大语言模型、多模态大模型、智能体三大技术范式,深度对齐国家《卫生健康行业人工智能应用场景参考指引》,覆盖60个全自主构建评测集,共70万余专业评测题。

秉持开放合作的原则,上海人工智能实验室持续与医疗机构、科研院所和领军企业深化专科评测,并在MedBench 4.0中更新了4项挑战赛事,包括基于改良评分系统的临床多轮问诊能力自动化测评、中医临床科研综合能力深度测评、儿科真实场景综合能力和临床动态进展思维能力双轨测评、随机对照试验循证证据质量评估,优化了评测全场景覆盖能力。上海人工智能实验室还搭建了开源医疗大模型园区OpenMedZoo,已开放首个高可靠性医疗安全伦理推理模型SafeMed-R1、全科基层医生大模型Med-GO等多个项目。

在大会现场的“人机大战”实战演示环节,由顶尖医疗团队与AI大模型同台竞技。此次对决以“胃肠道疾病诊疗”为命题,由资深消化内、外科主任医师组成两支人类战队,两支AI战队分别是位列MedBench官方自建榜首的Claude模型,以及上海人工智能实验室联合上海交通大学医学院附属仁济医院、上海第九人民医院共同研发的胃肠疾病多模态辅助诊疗大模型。

比赛题目从31例真实案例中现场随机抽取,四组选手要为一名因食管占位及食管静脉曲张入院的73岁女性患者病例给出诊断和诊疗计划。

两个AI大模型均在2分钟内给出结果,两组人类医生的完成时间分别为12分01秒、13分50秒,AI大模型在响应速度上优势明显。

上海市卫生健康委副主任罗蒙点评“人机大战”。

上海市卫生健康委副主任罗蒙点评指出,在疾病诊断方面,胃肠大模型和人类医生均准确识别出核心问题,将食管肿瘤置于首要病因,病灶识别能力精准;通用模型Claude未能从胃镜图像中识别出肿瘤。在诊疗计划方面,胃肠大模型能提出内镜下检查与治疗等关键步骤,思路贴近三甲医生水平;两组医生团队的方案框架正确,但在针对早期癌症的进一步检查方面,可以进一步细化;通用模型Claude的诊疗方案则更偏向内科治疗,对外科手术干预等考量尚有欠缺。

“这场比赛印证了AI是医生的好助手,它能高效处理海量信息,提供循证参考,有效提升医生的诊断效率及诊疗技术。”罗蒙说,“未来,AI技术与医疗深度融合,必将实现更强大的医疗服务能力,实现‘1+1>2’的诊疗效能,为守护人民健康构筑起更坚实的防线。”

原标题:《上海顶尖医疗团队与大模型比拼“胃肠道疾病诊疗”,医学AI评测联盟成立》

栏目主编:黄海华

来源:作者:解放日报 俞陶然

相关内容

龙虎榜|岩山科技涨停,北向...
1月12日,岩山科技涨停,日振幅值达7.63%,日换手率达16.6...
2026-01-12 17:03:56
国家统计局任免一批司厅级干...
(来源:财闻) 伍茜任人事司副司长,周博...
2026-01-12 17:03:52
龙虎榜|巨力索具涨停,国泰...
1月12日,巨力索具涨停,日振幅值达0.00%,日换手率达1.70...
2026-01-12 17:03:47
龙虎榜|银河电子涨停,北向...
1月12日,银河电子涨停,日振幅值达2.40%,日换手率达3.89...
2026-01-12 17:03:42
龙虎榜|德龙汇能涨停,广发...
1月12日,德龙汇能涨停,日振幅值达11.09%,日换手率达9.5...
2026-01-12 17:03:38
吉峰科技1月12日现5笔大...
  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力...
2026-01-12 17:03:33
鼎捷数智1月12日现24笔...
  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力...
2026-01-12 17:03:28
U18女冰世锦赛甲级B组中...
北京时间1月12日,在波兰卡托维茨进行的2026年国际冰联U18女...
2026-01-12 17:03:24
园区“握手” 创新奔涌
  俯瞰深圳河,碧波蜿蜒,两岸风光无限。一边是广东深圳,一边是香港...
2026-01-12 17:03:19

热门资讯

龙虎榜|岩山科技涨停,北向资金... 1月12日,岩山科技涨停,日振幅值达7.63%,日换手率达16.63%,收盘价11.39元,成交额1...
国家统计局任免一批司厅级干部 (来源:财闻) 伍茜任人事司副司长,周博任机关纪委委员、副书记(副厅长级)...
龙虎榜|巨力索具涨停,国泰海通... 1月12日,巨力索具涨停,日振幅值达0.00%,日换手率达1.70%,收盘价12.08元,成交额1....
龙虎榜|银河电子涨停,北向资金... 1月12日,银河电子涨停,日振幅值达2.40%,日换手率达3.89%,收盘价11.47元,成交额4....
龙虎榜|德龙汇能涨停,广发证券... 1月12日,德龙汇能涨停,日振幅值达11.09%,日换手率达9.54%,收盘价14.39元,成交额4...
吉峰科技1月12日现5笔大宗交...   炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!   1月12日,吉峰...
鼎捷数智1月12日现24笔大宗...   炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!   1月12日,鼎捷...
U18女冰世锦赛甲级B组中国队... 北京时间1月12日,在波兰卡托维茨进行的2026年国际冰联U18女子冰球世锦赛甲级B组比赛结束了全部...
园区“握手” 创新奔涌   俯瞰深圳河,碧波蜿蜒,两岸风光无限。一边是广东深圳,一边是香港,在位于深港两地接壤处的河套深港科...
龙虎榜|海兰信涨14.59%,... 1月12日,海兰信涨14.59%,日振幅值达14.42%,日换手率达33.28%,收盘价26.39元...