2017年07月13日 18:22
导读:
数据为医生探索未知打开一扇大门,让他们有机会探索医学领域大量未知的部分。如何发现医疗大数据金矿里的金子呢?医生需要一款更加高效的方式掘金医疗大数据——人工智能应需而至。其中,机器学习与数据挖掘技术更是实现人工智能的有效工具。专注于医学数据分析研究多年,康奈尔大学威尔医学院助理教授王飞希望通过机器学习与数据挖掘为医生诊疗提供帮助。
来源:HC3i中国数字医疗网/尹聪颖 石晨露
新英格兰医学杂志在2016年9月29日刊登的《Predictingthe Future — Big Data, Machine Learning, and Clinical Medicine》一文中,曾经集中分析了机器学习即将对临床医学发展带来的深远影响:相比于传统医学信息学中大多使用基于规则的分析工具,让医生像医学院的学生那样从书本上学习医学知识作为诊疗依据,如今智能医疗时代,让医生从海量医学数据中进行挖掘则更像是住院医从病例中进行学习,提炼“经验”、发现新的证据作为诊疗依据。
医生是一个“老来俏”的行业,对于临床医生来讲仅靠书本知识是远远不够的,经验和科研探索往往是成就实力的重要组成部分,在此过程中,数据为医生探索未知打开一扇大门,让他们有机会探索医学领域大量未知的部分。如何发现医疗大数据金矿里的金子呢?医生需要一款更加高效的方式掘金医疗大数据——人工智能应需而至。其中,机器学习与数据挖掘技术更是实现人工智能的有效工具。
专注于医学数据分析研究多年,康奈尔大学威尔医学院助理教授王飞希望通过机器学习与数据挖掘为医生诊疗提供帮助,他说,“以深度学习为代表的人工智能技术能够从客观世界的医疗数据中发现新的知识,帮助医生找到临床科研突破点。”
康奈尔大学威尔医学院助理教授王飞
国内外智能医疗应用发展各具特色
“医疗大数据是金矿,没有锄头挖不出金子,人工智能技术就是我们挖矿的锄头。”王飞教授说,目前国内外在智能医疗领域都取得了初步的进展,越来越多行业企业从不同维度尝试智能医疗应用的研发和落地。
国外最近有很多相关的进展。例如Google通过眼底影像分析识别糖尿病,这一研究成果发表在《JAMA》上,同时该应用已在印度开始临床测试。而斯坦福的研究员们也发现,用深度学习基于表皮病变图像判断皮肤癌变的准确率能够达到与皮肤科医生相当的水准,相关论文也发表于《Nature》的封面。此外还有IBM的沃森医生,能够查阅海量的医学文献并根据当前病人的描述推断病人可能的诊断。
国内智能医疗探索也在逐步实现落地,在智能语音病历录入、智能影像识别方面取得初步的进展,并在医院获得实践机会。王飞教授告诉记者,“机器学习在语音识别、图像分析、自然语言处理等领域已经实现了商用,因为商用的前提是需要有大量的高质量数据,而在上述领域数据量更大,数据质量更加可控。”
在国内外智能医疗的多方探索之中,机器学习作为当下最流行的人工智能技术之一,正在加速健康医疗大数据的价值挖掘。那么,机器学习技术如何从健康医疗大数据中挖掘价值呢?
机器学习,发现“相似病例”中的医学价值
临床医生诊疗水平很大程度取决于经验丰富性。高年资的医生看病的模式是:先判断是否曾经看过类似病情病人,以往这类病人的病情是如何发展的,哪些药曾经对哪些病人有用......这是一个相似病人检索与特征相似匹配的过程,这个过程的成熟度对应着医生“经验”丰富度。相比之下,低年资医生在这个阶段就会有所欠缺。由于看过的病人少,他们的判断大多是基于书本知识,单纯遵循书本提供的证据缺少对病人差异化因素的结合,无法实现个性化诊断。
“在人工智能技术支撑下,我们尝试模拟高年资医生比对病人的过程。”王飞教授说,用机器学习计算病人相似度并给出相似病人的处置经验,这种模式称为Patient Similarity Analytics病人相似度分析。实际应用中,对于每一个病人, 我们可以用算法找到与该病人类似的若干病人,并综合这些病人的用药方案、病情发展以可视化的形式展现给医生,同时基于相应的机器学习算法给出诊疗建议和发展预测。
“IBM的第一个医疗方面的商用软件,IBM PatientCare and Insights,其底层的支撑技术就是病人的相似性学习,我是该方法的主要设计者。”他说,病人相似性的研究可以应用于医学的方方面面,例如发现疾病亚型,这可以进一步帮助医生从病人的共性和差异中探索新的治疗突破点,对于精准医学研究十分重要。
开放的智能医疗探索中,CIO角色不可或缺
“机器学习离不开数据,而临床数据都在医院里。”在近几次的交流中王飞教授发现,国内很多医院的医生、院长观念比较开放,愿意把数据开放出来做研究,这让他十分欣喜。人工智能的训练离不开数据,因此对于计算专家们来说最需要的还是大量真实的病历数据去学习和验证。
目前,在精准医学、健康医疗大数据相关政策推进下,健康医疗产业各界利用数据的热情已经被激发,然而对于如何实现数据保护与数据开放共赢,如何实现科学的数据共享,谁来监管数据的调取方式与调取内容等即将在接下来具体的研究陆续浮现的问题,应该如何应对呢?
智能医疗研究体系由医生、计算专家、医院CIO等各方代表构成,其中:医生负责提供数据和问题,由计算专家通过机器学习探索现有数据分析能否解决问题及其解决方法,医院医院CIO作为中枢负责监控数据流向,当计算专家需要从科室或者医院数据库提取数据时需要通过医院CIO这一中枢,包括数据提取规则、数据安全机制、数据通信标准等都由医院CIO进行管控。
“每天接触医疗数据的医院CIO是最懂医疗数据的人,然而,迈向人工智能时代医院CIO面临新的挑战。”王飞教授说,一方面医院CIO需要实现内部系统互联互通,全面盘活数据;另一方面在数据价值不断提升的今天,医院CIO还要做好数据安保、理清数据管控及合理使用机制,为接下来的健康医疗大数据及智能分析铺平道路。因此,接下来医院CIO作为医疗数据守门人需要全能发展,才能助推医院借力人工智能快速发展,国外亦是如此。
大数据是金矿,需要AI这把锄头挖出金子
今天,健康医疗大数据金矿令无数人心动,我们需要更加强大的统筹能力、技术支撑“玩转”医疗数据。人工智能的兴起为我们带来新的机遇,让我们多了一种工具去发现数据驱动医疗进化的奥秘,探索如何运用好这种工具就是我们当下要努力的方向。
王飞
博士,康奈尔大学威尔医学院助理教授,IBM沃森研究中心顾问,法国液空集团研究顾问。曾任职于康涅狄格大学以及IBM沃森研究中心。主要研究方向包括数据挖掘,机器学习技术在医疗信息学中的应用。王飞博士已经在相关方向的顶级国际会议和杂志上发表了近190篇学术论文,引用超过5000次,H指数38。
2017年国际医学信息学大会(MedInfo)的分领域主席(track chair),2015国际健康信息学大会(ICHI)的程序委员会主席,AMIA知识发现与数据挖掘 (KDDM) 工作小组副主席。任杂志Artificial Intelligencein Medicine的编委(Associate Editor),Journal of Health Informatics Research的编委,SmartHealth的编委,Data Mining and Knowledge Discovery的执行编委(Action Editor),Pattern Recognition编委。已在美国申请相关专利40余项,授权15项。