四年前,还在南昌大学第二附属医院科教处任职的易应萍,一直希望能够找到一款能够帮助医生高效科研的信息化产品。

原因是,医院期望能利用过往数据做前瞻性和回顾性队列研究。然而,当时医院的过往数据质量不高,医生们普遍人工收集数据,效率较低,收集到的数据也十分有限。

基于此,医院科教处提出建立一个大数据科研平台。不过,在尝试过一家厂商的科研产品后,医生们发现系统运行非常慢,获取一次数据,通常需要两个礼拜的时间。数据的准确度方面,也仅有60%左右,难以满足实际的临床科研需求。

“大数据研究是真实世界的研究,我们要追求它的真实性和完整性。”带着明确的目标,在2018年的医疗信息化大会上,易应萍与科教团队开始寻找更为强大的科研工具。

打开网易新闻 查看更多图片

易应萍 南昌大学第二附属医院 信息处处长

研究员,硕士生导师

主要研究方向为医疗大数据的挖掘应用、医疗大数据与人工智能、队列研究模型、基于大数据的临床路径研究等。兼任江西省医疗大数据技术研究中心主任,江西省研究型医院学会科研管理与学科建设分会主委,江西省医学会第三届医学科研管理分会主委,江西省医学协会医学信息管理专业委员会副主委,中华医院管理学会信息管理专业委员会委员,中华医学会医学科学研究管理学分会委员。主持国家重点研发计划、国家自然基金及江西省重点研发计划等课题9项,发表论文20余篇,获著作权证书及专利7项。

找到最合适的科研产品

选择合适的科研产品并不是一件容易的事,打造研究型医院的任务更是需要突破和细心并举,每家公司的产品特点不一,挑选真正具备自然医学语言处理核心技术的公司成了此次医疗展会此行最大的目标。在医疗信息化大会上,森亿智能的展台并不算显眼,但“自然语言处理”几个大字,很快吸引了易应萍的目光。她发现,森亿的产品设计与医院诉求十分吻合。于是,她让工程师就医院的种种科研需求,在森亿的展台进行了详细的咨询。得到的信息是,森亿解决方案的准确率,明显要好于上一家。

当然,这只是初步判断。在接触森亿后的一个月里,易应萍带领团队前往森亿的上海总部考察。对于这次考察,她和团队做了充分的准备。

“经历了科研平台的初次碰壁后,我们在选择合作对象时无疑更为慎重,不希望盲目的引进一家,在后面又出现类似的问题。”来到森亿后,易应萍拿出早已准备好的两张调查表,并就表中的内容,对森亿的产品进行了详细考察。

这两张表里,有数十个项目进行对照评分,包含科研平台的种种关键要素,比如自然语言处理的技术方法、准确率、成功案例等。在与之前的方案做了详细的对比评估后,最终易应萍判断,森亿的产品要更加满足医院的实际需求。

经过慎重的考量和权衡之后,最终,南昌大学第二附属医院与森亿在科研项目上达成了合作。

部署、应用到推广

科研平台的部署并不简单,关键一步便在于前期的数据治理。

2006年至2016年十年间,南昌大学第二附属医院共更换了四套HIS系统,每一套HIS的表结构、数据存储方式差异性非常之大。并且,由于医院使用的东华电子病历采用M语言获取数据,导致医院的数据源十分复杂。对此,易应萍和森亿团队花了大量的时间来进行数据治理。

最终,医院完成了57个业务系统,总计11.4亿条数据治理,形成清晰后、结构化、标准化数据9.1亿条,为之后的科研数据采集工作打下了坚实的基础。

科研驾驶舱,是南昌大学第二附属医院科研平台中非常有特点的一项功能。它解决了临床科研的数据收集和检索的问题。在前瞻性研究方面,通常需要组织一个专门的人群才能建立队列。科研平台对原始数据的检索能力,可以让科研人员快速建立队列。

比如,科研人员要筛选医院的脑卒中患者,检索医院十年内的病人数、地区分布、重症程度等信息。通过科研平台,他可以在很短的时间内获取到满足上述条件的人群。这样一来,就可以节省大量的科研时间。

从效率上看,过去医院要做一个回顾性研究,耗时在数周到数月都有可能。医院在使用了大数据科研平台后,在十分钟之内就可以建立一个科研队列。前瞻性研究同样如此,借助CRF自动回填、智能随访等功能,可以减少60%左右的科研耗时。

由于森亿科研平台的好用、易用,南昌大学第二附属医院科教处、信息科更是主动调动人手,在医院临床科室一个个去推广系统。相比全院统一培训宣讲,这种方式无疑要更费精力。但这也恰恰体现了医院对科研平台的认可与重视。

截至目前,南昌大学第二附属医院创建的科研队列已经超过600个,依托科研平台发文近百篇,获相关著作权证书11项。

以科研带动医疗质量提升

“客观来讲,现在医院的数据质量并不是很高,缺失值较多。”易应萍表示,医务人员由于临床工作任务繁重,没有太多时间非常细致地录入每个环节的数据。另外,意识也亟待提升。很多时候,他们在不用数据时,不会觉得数据重要。而一旦要用了,数据的重要性才会体现。

因此,易应萍希望通过科研应用,促使医务人员及时地记录医学数据,通过科研来促进医疗数据质量的提升。这样一来,后续的研究数据质量就高了。数据质量高了,也就间接提升了医疗质量。

来源:中国数字医学