——中美智能医疗大数据探秘系列采访:新任SNOMED International全球管理委员会董事弓孟春博士

  • 2017-05-19 11:44
  • 作者:尹聪颖
  • 来源:中国数字医疗网

医疗信息化发展到今天,已经完成了初级阶段的历史使命,能够实现患者诊疗数据的采集、存储、管理,并在部分医院院内、院间实现互联互通。目前,随着全球医疗信息化迎来新拐点,不同国家有了不同的探索:既有以英国为代表的全国深度互联互通模式,也有其他欧美国家积极倡导的医疗大数据应用。无数医疗产业创新领袖开始聚焦医疗大数据市场,希望从海量医疗数据中探索新的知识,造福病患。

当全球医疗信息化产业完成初期的历史使命,进入全新发展阶段,中国医疗信息化产业将如何实现转型升级?就当下国内医改整体发展状况来看,医疗信息化主要从两个方向提供支撑作用:一是积极推进全国范围内的互联互通支撑分级诊疗落地;二是从现有海量医疗数据中探索驱动医疗科研进步的途径。

随着越来越国内外医疗专家、企业投身医疗大数据蓝海,中国医疗大数据产业在政策东风吹拂下繁荣发展。

“中国医疗大数据发展紧跟国际领先水平。”SNOMED International全球管理委员会董事弓孟春博士说,“我们希望从应用角度理清对于大数据的需求和标准,集中释放产业集群实力,在全球医疗大数据市场奠定中国领先地位。”

打开网易新闻 查看更多图片

产业“早熟”,中国医疗大数据面临挑战

如今,中国医疗大数据市场早已拔地而起,众多医疗大数据项目喷薄而出。然而,过早进入市场的医疗大数据并未得到充分释放,“快餐式”项目分散了医疗大数据市场大量的资本、精力,致使一些更具价值空间的深度应用项目在艰难而又漫长的成长期里变得焦虑。

“医疗大数据深度应用对于数据、标准和分析方法都有更高要求,‘数据大’变成‘大数据’还有很长的路要走。”弓孟春说,比如:我们从各家医院收集到的数据表达差异大,没办法做初步分析;成熟的本体体系对于大数据分析结果呈现很重要,但中文本体体系严重缺乏;有些计算模型是有基础的,很多初创公司仍在进行重复开发。

中国医疗大数据市场需要厘清现有基础,共享优势,补齐短板,集中优势在各个应用方向纵深发展。要实现这一目标,从单一环节入手埋头苦干是远远不够的,需要医疗大数据价值转化链条各个环节协调发展,做好衔接与映射,实现产业联动。

图:医疗大数据知识挖掘链条

在完成初步的数据采集后,临床及科研工作者在应用中发现:中国医疗大数据在术语、组学融合、知识库等方面正面临严峻挑战。弓孟春博士表示,这些问题在国外医疗行业同样存在过,我们可以通过借荐他们的解决方法探索突围路径。

明晰数据归属

“不管数据归属于谁总会有其对应的解决办法,关键是一定要说清楚数据到底属于谁。”弓孟春博士说,数据是医疗大数据产业的根本,在进行数据研究前首先要明晰数据权限。如果不解决数据权限的归属,从资本投入、实业公司开展研发到患者参与等各个环节都会存在信心不足的问题。解决数据权限的问题,需要有非常严格的数据权限和知情管理同意。

据悉,国家现在正在起草新的《中国健康医疗大数据管理办法》。从之前的47号文件开始国家在此方面已经开始进行了规划,预计新的管理办法或将涉及操作层面。

建立知识库质控

经过大数据分析获得的知识,需要校验知识的准确性后再放到临床中应用。然而,当下很多测序公司并不清楚使用的知识库是否准确,研究方法和过程均无从查证,由此导致很多顶尖医疗机构在做病历分析时同一位点在不同测序公司的知识库搜索的结果可能会冲突。要获得更加可靠的结果就需要比较证据的可靠级别,依据样本量、研究方法、分析精度、临床风险和知识管理模式进行可靠性评级,级别高的数据医生可以放心使用,确保临床科研数据可靠性。此外,针对冲突的结果采用荟萃分析做高级别的统计学分析,尽管消耗时间但对临床科研很有必要,是循证医学和精准医学的一次完美结合。

规范术语

读懂医疗数据首先需要进行术语管理,只有真正懂得数据表达的意思才能实现医疗大数据的集成分析。然而,不同医生使用的医学用语都是不一样的,比如:30份病历都是针对Ⅱ型糖尿病开具的,实际呈现为“非胰岛素依赖性糖尿病”、“Type 2 diabetes”、“Ⅱ型糖尿病”各10份,对于临床研究来说30份病历的分析价值明显更高,因此统一表达方式非常关键。

中国医院缺乏标准术语语义管理体系,即便是相对成熟的检验语义管理在跨院交流时仍会遭遇标准不一的问题,如何破局?弓孟春说,“统一术语是影响全国医疗大数据整体发展的关键,而这需要自上而下去推动。从此前我国推动互联互通等标准落地的过程来看,一旦相关学术机构做好充分的标准化调研和设计工作,国内要推动术语标准化将会非常迅速。对于医疗大数据项目研究人员来说,基于标准术语的医疗数据其知识转化的含金量无疑会更高。”

突破组学融合

组学融合是医疗大数据知识挖掘流程中又一重要环节,是从数据中看懂知识的关键步骤。

“由于缺乏普适性组学融合算法,分析了海量数据的研究人员却搞不懂数据分析结果代表的意义。对于研究人员来说这无疑是盲人摸象,为了分析而分析不知前路几何。”弓孟春分析过西方国家的做法,比如:美国是每家医院自己做算法,跨院交互时需要做映射;欧洲引入国际统一标准下发到医院和研究结构,目前正在进行SNOMED CT与HPO对接,帮助研究人员寻找疾病与特定表型之间的关系。他建议我国自上而下制订统一算法,然后让各大医院在此基础上继续做深入研究,既可快速扫清算法障碍,又能获得更加广泛、先进的发展方向。

严把安全机制

全球数据泄露事件频发,医疗数据的泄漏影响尤为严重。精准医学涉及的组学信息泄露可能会引发基因歧视、医保及就业等各种问题。因此,发展中的中国医疗大数据市场亟需建立更高级别的安全机制,确保安全与发展同步成长。

30年数据研究,让中国医学“弯道超车”更可及

中国医疗信息化经过30年的发展,已经积累了大量的经验和方法。在精准医学引爆的医疗数据深海中,我们更加有信心去分析问题找到前进方向,让中国医学“弯道超车”的梦想早日成真。

参考:

【1】组学融合:随着科学研究的进展,人们发现单纯研究某一方向(如:基因组,蛋白质组或转录组)无法解释全部生物医学问题,科学家就提出从整体的角度出发去研究人类组织细胞结构、基因、蛋白及其分子间相互的作用,因此,将医疗领域每一个专业方向的数据都称为一个组,EMR临床信息称为表型组,此外还包括基因组学 (Genomics),蛋白组学(HYPERLINK "../../../Program
Files/Dict/7.1.0.0421/resultui/dict/"Proteomics),代谢组学 (Metabolomics),转录组学 (Transcriptomics)等,通过整体分析反映人体组织器官功能和代谢的状态,为探索人类疾病的发病机制提供新的思路。