每经记者 林姿辰 每经编辑 董兴生 “全靠大家支持,才能顺利迈出第一步,不过晨跑最难的就是早起上跑道迈出第一步。”2月20日晚,张少霆在朋友圈转发了一则消息,庆祝商汤医疗完成过亿元Pre-A轮融资。 作为国内AI(人工智能)龙头商汤科技的副总裁、研究院副院长、商汤医疗CEO,张少霆在2018年加入商汤时,就是以“智慧健康负责人”的身份亮相的。 去年夏天,国内首个AI病理大模型PathOrchestra就出自商汤科技、西京医院及清华大学的合作团队,号称“实现了全球最广泛的临床科研任务赋能,完成了人工智能病理研究领域从‘单模专病’到‘一模多病’的跨越式突破”。近日,国内通信技术龙头华为参与发布“瑞智病理大模型RuiPath”,让病理大模型再次受到公众关注。 作为AI医疗大模型领域最具挑战性的“明珠”,病理大模型为何让龙头频频驻足?近日,《每日经济新闻》记者(以下简称“NBD”)独家对话张少霆,了解到他的看法。 商汤科技副总裁、研究院副院长、商汤医疗CEO张少霆 图片来源:受访者供图 都知道DeepSeek,但什么是病理大模型?与DeepSeek等通用大模型不同,病理大模型专注于解决病理科医生面临的临床问题;但与宫颈癌筛查等专用模型也不同,病理大模型致力于解决多种临床任务。资料显示,PathOrchestra覆盖肺、乳腺、肝脏、食管等20余种器官,赋能百余项临床任务,是当时全球赋能临床任务最广的病理大模型。 AI病理诊断流程 图片来源:头豹研究院报告 NBD:病理大模型和DeepSeek的区别是什么? 张少霆:DeepSeek等属于语言大模型,病理大模型大多属于图像模型,也有部分是多模态模型,这是两种完全不同的模型。前者(语言大模型)通常拥有数百亿到数千亿级参数,使用不同的提示词就能胜任成百上千种不同的任务;后者(病理大模型)的参数规模则在亿到十亿级别,针对特定的下游任务,仍然需要再加入相关数据后进行微调训练,才能更好地适配这些任务。 所以,病理大模型并不是大家常说的“大模型”,它更接近传统的预训练模型(Pre-trained Model),还不能像语言大模型一样“大杀四方”,还需要往下游任务深化。 NBD:商汤医疗为什么选择做病理大模型? 张少霆:在做基于医疗图像的辅助诊断时,有一个概念叫“长尾问题”。例如,肺结节检测这类高频问题的数据丰富且容易获取,因此可以相对容易地收集到足够多的数据,来训练一个专才模型,这样的模型不需要特别庞大就能效率高且性能出色。然而,对于那些小众疾病,数据标注稀缺且难以获取。在这种情况下,传统的数据收集和标注方式就显得力不从心了。 病理大模型的优势在于,它可以在长尾问题上减少对传统数据收集和标注的需求,从而提高模型的训练效率,更好地适配并解决子问题。 回过头看,我们对病理领域的大模型研究是伴随着技术范式的变化自然而然地发生的,经历了三个阶段。2018年起,专注于胃肠和宫颈TCT(液基薄层细胞学检测)的单点应用;2021年起,与瑞金医院合作将下游任务拓展到9种不同的疾病,在迁移学习方面取得了一定的成果;2023年起,开始尝试训练病理大模型,来覆盖多达几十种“长尾”疾病。 NBD:资料显示,PathOrchestra可以赋能百余项临床任务,这能涵盖医院病理科接触到的所有疾病吗? 张少霆:这里需要定义“任务”。比如,针对病理图像进行细胞分割或细胞检测也属于不同的任务,因此我们说的100多种下游任务对应的不是100多种疾病,目前基本能覆盖二三十种疾病,像AI赋能最多的组织病理学中的胃肠小标本、宫颈TCT标本的辅助筛查,已经满足了病理科医生日常工作的大部分需求,但这些都是通过专才模型来实现的。 当下也还有很多病理切片需要医生亲自查看,例如肿瘤组织标本,需要根据病理切片进行十几种不同疾病亚型的分类和判别。目前,将这类任务完全交给病理大模型还为时尚早,因为大模型目前只具备通用的“排兵布阵式”的阵法知识,缺少逐个击破的作战能力,如果每个亚型都存在一定出错概率,十几种亚型都同时正确的概率就低很多。 ![]() 图片来源:每经记者 张韵 摄 |