据相关统计,已面世的医疗大模型数量已达三位数之多。然而,随着数量的增多,在业内引发讨论的是,医疗大模型目前真能赋能医疗机构吗?在临床一线应用时面临着哪些卡点?
医学具有极高的严谨性要求,任何细微的差错都可能导致严重的后果,这就意味着医疗大模型所输出的信息、给出的诊断建议、提供的治疗方案等必须精准无误,否则将引发不可估量的负面影响。
面临这样的情境,持续关注着医疗大模型发展动态的浙江大学医学院附属第二医院人工智能与信息化部主任相鹏以及华东某大三甲医院人工智能医学大模型发明人武东(化名),对于医疗大模型的院内应用给出了自己的见解。
卡点尚没有完全打通
「真正懂大模型技术的团队,和临床应用大模型的人目前是脱节的。」相鹏对健康界强调道,加强跨学科合作是推动大模型发展的关键。在顶尖的高等院校,包括大模型训练在内的这一批算法工程师,中国并不逊色于国外,但他们跟医疗几乎没有交叉。懂技术的往往不懂医学,懂医学并且能够提出医学科学问题的人,又没有接触过大模型技术、没有计算机基础或者说人工智能基础,不知道技术能给医学带来什么改变。
已于11月离职的百度集团原大健康事业群总裁何明科曾公开表示,医疗是少见的「三位分离」的行业,决策者、付费者和使用者是三个完全不同的主体,分别是医生医院,保险、医保,以及患者。
综上所述,医疗大模型的开发与应用并非简单地依靠跨学科合作就能实现,而是需要深度整合多个学科领域,如计算机科学、统计学等,不同学科背景的专业人才相互协作、知识互通,如此才能更好地推动医疗大模型从开发到应用的落地,使其切实服务于医疗行业。
但这并不是一件易事,核心还是技术逻辑和应用逻辑。相鹏认为,医疗领域的大模型还处在理解阶段,应用的人也只是摸索性尝试,底层的技术问题大家还没有理解透,何谈已经开始摸索了。
「摸索说白了其实是我已经知道了这个点的所有原理,就看我怎么去摸索技术把它做好。因此,目前设计开发出的应用都还比较肤浅。」相鹏说。在他看来,尽管市场上关于大模型的说法五花八门、各式各样,但实际上大模型的进展目前较为缓慢,「许多只是打着 AI 的旗号,套上大模型的外壳,故而不能对此盲目乐观、一片欢欣鼓舞」。
相鹏认为整个市场还是处在浮躁期,过于看重概念和商业回报。他表示,医疗大模型研发团队要非常懂技术、懂医疗、懂场景,而且这几个方向的人要高度契合,比如说研究方向正确、技术路径合理、最后效果良好,才有可能在医疗大模型方面取得成效。
当下最重要的是能够打通卡点吗,以及怎么把这些卡点挨个去打通?相鹏认为,业内并没有真正认识到国内和国际的差距。
回到如何定义大模型上,相鹏认为目前市面上没有什么模型可以严格意义上称之为医疗大模型,如果仅仅是辅助作用,那对技术的理解太过简单了。对于医疗大模型如何大规模地赋能医院,相鹏始终抱有着担忧。
对于医疗行业如何运用人工智能,众多医学专家仍处于探索阶段,尚未完全明晰,而另一边是未曾涉足医学领域的技术人员,已经开始说「大模型能够用在医院了」,所以这种隔阂导致了很多人的错误理解,「把它想的太简单了」。
百川智能创始人兼CEO王小川曾在2024年11月发表的一场以《大模型时代的AI医疗变革》为主题的演讲中提到,「上个时代互联网并没有在医疗行业带来任何改变,但这一次会有巨大的不同,因为今天的这样一个机器不仅仅是简单的工具,而是AI医生。我们称为它是能够像人一样的思考工作。」
或许,面对医疗大模型,行业需要的是一个强有力的应用,要让医务人员认可它的作用,还有很长的路要走。
医学与商业的交叉点上
尚有众多问题存在
医疗大模型应如何赋能医生、医院以及患者?相鹏认为,「在硬件‘卡着脖子’、软件也‘卡着脖子’的当下,我们该去思考的是好的芯片或者大量能够让大模型的技术跑起来的机房该如何设立起来。」
但在当下,拥有 GPU 卡、充足资源以及跨界人才的情况不多见。可以想象,在全国范围内,能够集齐这些资源开展相关事务的团队数量并不多。毕竟使用如此昂贵的 GPU 卡,若不关注产出效益,还愿意持续投入进行研究,这在很多人看来是难以理解的。
人们往往会有这样的疑问:有英伟达的 GPU 卡,为何不投身于更具盈利性的商业活动,而选择开展研究工作呢?有算力、有算法、有数据、有场景、有应用,能够整合以上资源的团队还是非常少的。「在这样的观念下,这个市场怎么起得来,科研市场怎么起得来?」相鹏说道。
值得注意的是,Anthropic创始人达里奥·阿莫迪(Dario Amodei)曾在播客里谈到,正在训练的一些模型的成本接近 10 亿美元,且这个数字未来还会上涨,未来三年可能会达到 100 亿美元至 1000 亿美元。
在高昂的成本和不确定的投入产出比下,越来越多公司开始衡量预训练的性价比,尤其在预训练有可能「撞墙」的趋势下。
另外一方面,相鹏也提到,在与医学的交叉领域,往往最难取得显著成效。就拿大模型来说,在手机端已经出现了一些收费软件,因为这些应用在商业方面更具盈利潜力。所以当前无论市场投入,还是整体的发展导向,都倾向于能够快速获得回报。然而,医学领域与之不同,在医学与商业的交叉点上,存在着诸多需要面对的冲突。
例如,如何在追求医学价值与实现商业利益之间找到平衡?怎样确保商业行为不会对医学研究和临床应用的严谨性、公正性产生负面影响?以及如何在商业驱动的大环境下,依然保障医学研究的深度和广度,使其能够真正推动医疗大模型在医学领域发挥实质性的、有益的作用,而不是仅仅沦为一种商业噱头或短期逐利的工具,这些都是亟待解决的问题。
相鹏补充道,只是头部医院在研发、在应用,不能大规模覆盖到医疗机构的话,大模型真的对医疗行业有帮助吗?
更新自己的世界观
扭转自己的认知
「大模型本身就是一种进步,除了生产力的提升,也改变着我们的世界观。」武东告诉健康界,这次技术革命不仅是提质增效的应用,也会改变世界观。首先,医务人员得更新自己的世界观,对世界的认知需要随着技术、人工智能迭代,从思维上去扭转自己的认知。
比如医疗大模型容错率极低这一问题,武东认为,目前市面上所有模型都存在幻觉、偏见与歧视现象,这属于正常的发展过程。面对大模型幻觉这一问题,难道极其离谱的幻觉就可以放任不管吗?当然不是,武东表示仍需加以管控,毕竟不同模型产生幻觉的程度存在差异。并且大模型并非承担主要工作的主体,当下的作用更多是辅助医生。不过,其最终会朝着越来越精准、越来越准确的方向发展,储备量也会越来越大。
北京大学第三医院一位副主任医师也对健康界提到,她很好看大模型的未来,作为医生需要不断的训练它,就像一个刚毕业的学生一样,刚开始肯定不够专业,但通过反复的训练,它还是能够帮助到医生,尤其是基层医生。
王小川对大模型则一直抱有极高的期待。他认为医疗大模型应该是一个具有充分密集知识的,帮助医生能够去做决策、做沟通或者做思考的引擎。因此,他认为社会更应该以造人的心思去看待大模型,它像医生、像药剂师、像临床实验设计员,甚至有沟通能力,很多应用场景它不应该是躲在背后处理数据,要能够去做沟通交流。在医生、医疗资源如此紧缺的现在,行业需要的不仅仅是一个提质增效的辅助工具,而是拥有巨大改变力量的存在。
2024年12月,首都医科大学宣武医院的颈动脉支架手术数据集(登记时包含2550条数据)在北京国际大数据交易所进行了资产确权登记,同时完成交易。
这是北京市史上第一笔公立医院健康数据交易。据宣武医院表示:该交易数据经过严格的匿名化、数据清洗、整合和标准化处理,严格保护患者隐私,确保了数据的准确性和可用性。未来,该数据集将应用于国产颈动脉支架产品的研发,助力医疗机构更加精准地理解中国人群的脑血管疾病。
首都医科大学宣武医院数据资产登记凭证
鉴于医疗数据具有隐私性高、数据处理难度大等特性,致使医疗大模型训练面临重重困难,而宣武医院此次健康数据交易的成功无疑是大模型发展历程中具有历史性意义的关键一步。
正如武东所言,不论市场如何,当下人们不应该一直将目光投向商业,厂商在研发的时候要具备这样的意识。还是要回归到技术本身,脚踏实地、一步一步把事情做好。
或许,无论对于医疗大模型持悲观还是乐观态度,亦或是大模型市场至今仍鱼龙混杂,若期望其能够在真正意义上实现大规模为医院赋能,人们首先应当秉持一种扎实深入钻研、稳步有序推进的开发理念,将关注点聚焦于技术层面的持续完善与优化升级,同时拥抱新技术的到来。坚决摒弃浮躁、短视的商业思维模式,而是凭借严谨细致且持之以恒的不懈努力,使医疗大模型能够切实贴合医疗场景并有效发挥其应有的价值与作用。
唯有如此,大模型方能在未来的发展道路上走得更为长远,进而真正为更多的医院提供有力的赋能支持,助推医疗行业的创新与变革。
健康界将持续关注报道医疗大模型的研究开发与应用推广,欢迎广大有识之士留言评论提供线索。