上海顶尖医疗团队与大模型比拼“胃肠道疾病诊疗”,医学AI评测联盟成立
创始人
2025-11-21 21:52:01
0

(来源:上观新闻)

昨天,“智汇医学 AI无界”浦江医学人工智能大会暨首届上海市医学人工智能应用技能大赛总结会在上海举行,集中展示了“人工智能+医疗”进入标准化、体系化、全球化新阶段的实践成果。上海人工智能实验室发布了全新升级的中文医疗大模型评测平台MedBench 4.0,为衡量医学AI产品的性能与可靠性提供了科学标尺。

会上,上海人工智能实验室牵头的“医学人工智能评测联盟”正式成立。这个联盟将广泛汇聚国内顶尖医疗机构、权威行业组织和领先科技企业,致力于成为医疗人工智能测评与验证领域的核心力量,通过聚焦制定临床导向的评测标准、共建高质量标注数据集,以及探索多模态及智能体融合评测技术路线三大方向,搭建产学研用多方共建的交流合作平台。

医学人工智能评测联盟在上海成立。

《医疗大模型应用安全实施指南》标准草案在会上同步发布,填补了我国医疗大模型安全应用标准的空白,为技术创新划定安全边界,提供实践准则。复旦大学附属中山医院计算机网络中心副主任张俊钦结合《指南》中的规范条文,提出具体场景的操作要点与风险防控建议,为行业合规应用提供了实用参考。

会上,上海人工智能实验室发布了全新升级的中文医疗大模型权威评测平台MedBench 4.0。这是全国首个且唯一面向垂直模型、专业模型和应用场景的医疗大模型评测与验证体系。此次升级聚焦“实战化评测突破”与“生态化开放共建”两大核心方向,包含大语言模型、多模态大模型、智能体三大技术范式,深度对齐国家《卫生健康行业人工智能应用场景参考指引》,覆盖60个全自主构建评测集,共70万余专业评测题。

秉持开放合作的原则,上海人工智能实验室持续与医疗机构、科研院所和领军企业深化专科评测,并在MedBench 4.0中更新了4项挑战赛事,包括基于改良评分系统的临床多轮问诊能力自动化测评、中医临床科研综合能力深度测评、儿科真实场景综合能力和临床动态进展思维能力双轨测评、随机对照试验循证证据质量评估,优化了评测全场景覆盖能力。上海人工智能实验室还搭建了开源医疗大模型园区OpenMedZoo,已开放首个高可靠性医疗安全伦理推理模型SafeMed-R1、全科基层医生大模型Med-GO等多个项目。

在大会现场的“人机大战”实战演示环节,由顶尖医疗团队与AI大模型同台竞技。此次对决以“胃肠道疾病诊疗”为命题,由资深消化内、外科主任医师组成两支人类战队,两支AI战队分别是位列MedBench官方自建榜首的Claude模型,以及上海人工智能实验室联合上海交通大学医学院附属仁济医院、上海第九人民医院共同研发的胃肠疾病多模态辅助诊疗大模型。

比赛题目从31例真实案例中现场随机抽取,四组选手要为一名因食管占位及食管静脉曲张入院的73岁女性患者病例给出诊断和诊疗计划。

两个AI大模型均在2分钟内给出结果,两组人类医生的完成时间分别为12分01秒、13分50秒,AI大模型在响应速度上优势明显。

上海市卫生健康委副主任罗蒙点评“人机大战”。

上海市卫生健康委副主任罗蒙点评指出,在疾病诊断方面,胃肠大模型和人类医生均准确识别出核心问题,将食管肿瘤置于首要病因,病灶识别能力精准;通用模型Claude未能从胃镜图像中识别出肿瘤。在诊疗计划方面,胃肠大模型能提出内镜下检查与治疗等关键步骤,思路贴近三甲医生水平;两组医生团队的方案框架正确,但在针对早期癌症的进一步检查方面,可以进一步细化;通用模型Claude的诊疗方案则更偏向内科治疗,对外科手术干预等考量尚有欠缺。

“这场比赛印证了AI是医生的好助手,它能高效处理海量信息,提供循证参考,有效提升医生的诊断效率及诊疗技术。”罗蒙说,“未来,AI技术与医疗深度融合,必将实现更强大的医疗服务能力,实现‘1+1>2’的诊疗效能,为守护人民健康构筑起更坚实的防线。”

原标题:《上海顶尖医疗团队与大模型比拼“胃肠道疾病诊疗”,医学AI评测联盟成立》

栏目主编:黄海华

来源:作者:解放日报 俞陶然

相关内容

刘伟主持部党组理论学习中心...
刘伟在部党组理论学习中心组2025年第十次集体学习时强调认真学习贯...
2025-11-21 22:30:57
关于调整长沙市五一商圈周边...
转自:长沙发布关于调整长沙市五一商圈周边主要道路限制交通措施的通告...
2025-11-21 22:30:53
投资者提问:公司能否确保所...
投资者提问:公司能否确保所有潜在的重大信息在股东减持和复杂关联交易...
2025-11-21 22:30:49
投资者提问:公司举债并购的...
投资者提问:公司举债并购的核心资产新华三,在2025年上半年净利润...
2025-11-21 22:30:44
金价又跌了!瑞银却上调明年...
继前一日站上4100美元后,现货黄金价格又回归下跌通道。11月21...
2025-11-21 22:30:40
财政支出增速放缓,高基数、...
李超/文2025年10月财政支出速度放缓,收入增速保持一定强度,我...
2025-11-21 22:30:34
高市早苗向战死二战日军献花
据马来西亚本地媒体近日报道,日本首相高市早苗今年10月下旬赴马来西...
2025-11-21 22:30:31
BitMine 公布截至 ...
(来源:吴说)吴说获悉,BitMine Immersion(BMN...
2025-11-21 22:30:28
设研院A股股东户数减少89...
11月21日消息,数据显示,截至2025年11月20日,设研院A股...
2025-11-21 22:30:25

热门资讯

刘伟主持部党组理论学习中心组2... 刘伟在部党组理论学习中心组2025年第十次集体学习时强调认真学习贯彻党的二十届四中全会部署全力推动交...
关于调整长沙市五一商圈周边主要... 转自:长沙发布关于调整长沙市五一商圈周边主要道路限制交通措施的通告根据《中华人民共和国道路交通安全法...
投资者提问:公司能否确保所有潜... 投资者提问:公司能否确保所有潜在的重大信息在股东减持和复杂关联交易完成前已充分、公平地披露?董秘回答...
投资者提问:公司举债并购的核心... 投资者提问:公司举债并购的核心资产新华三,在2025年上半年净利润增速仅为1.72%,近乎零增长。这...
金价又跌了!瑞银却上调明年年中... 继前一日站上4100美元后,现货黄金价格又回归下跌通道。11月21日,伦敦现货黄金价格一度下跌1%,...
财政支出增速放缓,高基数、年内... 李超/文2025年10月财政支出速度放缓,收入增速保持一定强度,我们认为财政支出增速放缓较多的原因在...
高市早苗向战死二战日军献花 据马来西亚本地媒体近日报道,日本首相高市早苗今年10月下旬赴马来西亚出席东亚合作领导人系列会议期间,...
BitMine 公布截至 20... (来源:吴说)吴说获悉,BitMine Immersion(BMNR)公布截至 2025 年 8 月...
设研院A股股东户数减少899户... 11月21日消息,数据显示,截至2025年11月20日,设研院A股股东总户数为3.04万户,较上期(...
新闻|境外投资政策宣讲暨智能装... (来源:今飞控股集团)11月21日,由浙江省民营经济发展中心(浙江省“一带一路”综合服务中心)监办,...