【人物名片】张少霆,商汤科技副总裁、智慧医疗业务负责人。其本硕博分别毕业于浙江大学、上海交通大学、美国罗格斯大学,专注医学人工智能创新近20年,在《柳叶刀·数字健康》《自然·机器智能》《自然·通讯》等全球顶级期刊上以第一作者或通讯作者发表文章数十篇,总引用达1.8万余次,并入选美国斯坦福大学发布的全球前2%顶尖科学家“终身科学影响力排行榜”。

打开网易新闻 查看更多图片

张少霆的办公桌上,摆着作家马伯庸的《大医》。这一讲述医者寻觅救国之法的渐悟心路的长篇小说,倒和商汤医疗健康大模型“大医”的名字,异曲同工。

在商汤科技,人们喜欢称呼彼此“老师”。张少霆原本还真是一位教授,2018年加入商汤科技后,就一直耕耘智慧医疗领域。机器智慧与医者仁心的无缝交融,在他的带领下轮廓逐渐清晰。

“智慧医疗已经迈进了3.0时代,我们也在加速推进医疗大模型的研发和落地。”张少霆说,“国内通用大模型的发展短期内面临着算力等因素的挑战,但在垂直领域大模型的研发上还是有不错的机会。以医疗领域为例,我们有着丰富的医疗落地场景和海量的患者需求,通过与场景、需求的紧密结合,国内医疗大模型的发展有着广阔的前景。”

缓解医疗难题 AI尽其所能

计算机和医疗,单拎出任何一个,都需要等身的研究资料做支撑。两者的跨界融合,难度可想而知。

发展至今,智慧医疗主要经历了三个阶段。1.0时代以信息化建设为主,行业主要关注利用互联网、物联网技术,实现技术模块、服务流程从0到1的建设。随着人工智能技术的出现,智慧医疗也迈入2.0时代,医院开始将其应用于医学影像分析、临床辅助决策等领域,但此时AI赋能仍集中在“单点应用”上,还未实现“一盘棋”。

“生成式人工智能技术方兴未艾,智慧医疗走进3.0时代。更多的医疗机构开始思考,如何通过顶层设计,利用大模型对全流程提供全方位赋能,实现对整个医疗生态的革新重塑。”张少霆表示。

打开网易新闻 查看更多图片

图说:商汤科技展厅中,与智慧医疗相关部分 新民晚报记者 陶磊 摄(下同)

他告诉记者,商汤自2018年开始布局智慧医疗业务,深度参与了智慧医疗2.0时代的建设。过去几年间,利用AI技术赋能医学图像分析,推出了近30款AI辅助诊疗产品,帮助合作医院大幅提升了影像、病理诊疗效率。

在张少霆眼中,人工智能是能够比较快速解决优质医疗资源不足和分布不均衡的方法之一,“纵向上来说,优质医疗资源能够‘下得来’;横向层面,医疗资源的分布能够‘铺得开’。”

在ChatGPT还未问世之际,张少霆就带领团队一头扎进医疗垂类语言大模型的研发中,“大医”雏形渐显。“行业有观点认为,所有产品都该用大模型技术重做一遍。虽然有些绝对,但投射到医疗领域,大模型技术的确有望帮助海量的医疗场景实现智慧化升级。”他说。

应用铺天盖地 “大医”大展身手

“大医”,首先是位学富五车的“大先生”,研发团队用超过300亿tokens(词元)的高质量医学数据加以训练。商汤“日日新”大模型体系面世后,训练数据全面升级、训练方法有效提升,得益于此,“大医”也不断“上新”。

技术上“顶天立地”还不够,临床应用还得“铺天盖地”。据介绍,“大医”的能力已经覆盖了健康管理、患者服务、临床诊疗、医学科研四大领域超过20个细分医疗场景。

“‘大医’可以通过自然语言交互,高效准确地实现智能导诊、预问诊、云陪诊、诊后随访等工作,显著改善患者就医体验。”张少霆举例说,“临床诊疗环节,‘大医’也可以辅助医生开展临床决策,帮助医生提升诊疗效率和准确率。”

打开网易新闻 查看更多图片

图说:张少霆演示智慧医疗应用

在所有大模型赋能的垂直领域中,医疗可以算是最特殊的一个。其中一个原因就是容错率特别低——这不难理解。然而,这点对于不时“一本正经地胡说八道”的大模型来说,却是很大的挑战。为此,除了让“大医”尽可能多地“学”,商汤研发团队还自建了一套检索增强的生成框架,支持用户将自有知识库作为插件与“大医”系统集成,这一框架能利用外部知识库,在生成回答前先信息检索,显著提升了回答的准确度。

在临床中,存在大量长病程患者,在对这部分患者诊疗时,需要结合病史信息进行推理决策,这对模型的“记忆力”提出了高要求。而“大医”则具备了长程记忆存取能力,不受模型上下文长度限制,还支持接入外部插件补充记忆存储空间。有了这个能力,个性化诊疗不再是难事。

扩大能力半径 模型一展宏图

从去年10月面向产业端提供服务以来,“大医”已在国内包括新华医院、瑞金医院等三甲医院落地,其能力得到了一致认可。经过专业医学评测,“大医”在检验检查问答、电子病历生成、线上问诊、导诊、随访、辅助诊断决策等多项医疗任务上的表现已经超越了GPT-4。

毫无疑问,大模型技术是催生新质生产力的重要引擎。在医疗领域,它“新”在何方?在张少霆看来,一方面是借助大模型,革新过去已经用上AI的医疗场景,实现效率的进一步提升;另一方面则是利用大模型解决过去无法用AI解决的问题。

“医疗行业存在很多长尾疾病,发病量少、数据少,依靠之前大数据加精标注的传统AI研发范式,很难解决。有了医疗大模型就可以在预训练基础模型之上,用少量样本数据完成模型训练,能够让人工智能技术覆盖能广泛的疾病。”他解释。

“在垂类模型上,采用‘通专融合’的方法是国内大模型和国外竞争的重要路径。”张少霆说,“智慧医疗是一条挺‘卷’的赛道,但我们觉得医疗大模型的前景依然值得期待。短期来说,会紧跟国际前沿路径,在Agent(智能体)和多模态能力上力争突破。”

值得一提的是,患者数据隐私是人们长期关注的焦点,“医疗数据不出院”的需求强烈——这意味着云端调用的模式并不适合医院,本地私有化部署才是当下最符合医疗大模型的落地形式。“大医”研发之初就考虑到了院内应用的可及性,通过模型压缩技术实现了单卡运行,一些千亿参数的“大医”模型版本甚至可以直接部署在消费级显卡上,这让医疗机构不仅“用得上”,也“用得起”大模型。

他向记者强调,“大医”的服务范围不仅仅在医院,而是希望能覆盖整个医疗健康产业链。未来,医疗大模型有望“润物无声”地为百姓提供高质量的医疗健康服务。

新民晚报记者 郜阳

【行业链接】如今,越来越多AI大模型产品相继推出。除了通用大模型之外,针对细分行业的垂直大模型数量也日渐增多,医疗场景更是成为受到各方关注的重点领域。当前,除了商汤科技发布推出的医疗健康大语言模型“大医”外,国内还有京东健康面向医疗健康行业的大模型“京医千询”,百度发布了“产业级”医疗大模型“灵医大模型”等;国外,微软研究院等提出了首个全切片尺度的数字病理学模型GigaPath;谷歌发布了多模态医学大模型Med-Gemini。