打开网易新闻 查看更多图片

结直肠癌是美国发病率和死亡率第二高的癌症,定期筛查并切除癌前病变是预防结直肠癌的关键。结肠镜检查是结直肠癌筛查的金标准,也是美国结直肠癌早筛200亿美金花费的主要组成部分[1]。

有研究表明,腺瘤检出率(ADR)每增加1.0%,间期结直肠癌的风险就降低3.0%[2]。然而,由于操作或诊断水平的不同,腺瘤检出率和漏诊率在医生之间存在显著差异,其中腺瘤漏检率浮动范围为6-41%[3,4]。

一项医疗AI的加入有望改变这个现状!

众所周知,随机对照试验(RCT)是检验所有医疗AI创新的金标准。在医疗AI不断涌现的今天,真正经过RCT检验且合格的创新AI医疗寥寥无几[5]。2021年1月Nature Review Cancer期刊上的一篇研究显示,在3578项与深度学习相关的癌症诊断技术的研究中,真正符合三期临床RCT标准的仅有3项[6]。虽已凤毛麟角,但相关泛化性和鲁棒性的验证却仍待考究。

近日,美国胃肠病学会官方期刊Clinical Gastroenterology & Hepatology【IF=11.382】发表了一篇由哈佛医学院Tyler M. Berzin教授领衔的美国多中心随机对照试验[7]研究成果。

这项研究成果证实:在临床实践环境中,结肠镜计算机辅助诊断系统能将腺瘤漏诊率(AMR)相对降低近36%,将每次肠镜平均腺瘤检出数(APC)相对增加近33%!

据了解,这是美国全医学领域首个关于人工智能辅助诊断(CADe)系统的随机对照试验,更是全球首个关于医疗人工智能技术的独立外部随机对照试验

AI软件在临床的广泛应用,终于完成关键一步。

论文首页截图

Berzin教授领衔的这项研究在哈佛医学院附属BIDMC医院、纽约大学朗格尼医学中心、贝勒医学院圣卢克医学中心和芝加哥大学附属医院进行。

共有232名受试者参与,他们被随机分为2组,一组先进行AI辅助结肠镜检查,然后立即进行常规结肠镜检查(AI-常规组,n=113);另一组进行相反顺序的两次检查(常规-AI组,n=110)。在检查过程中排除了9名患者。

在AI辅助检查过程中,结肠镜连接到AI系统,实时自动检测病变,并用蓝色空心框在显示器上标记出病变位置,同步发出警报声来提示和辅助内镜医生。由医生评估判断被标记位置是否有息肉,以及是否是腺瘤性息肉,并完成相关切除。

打开网易新闻 查看更多图片

AI系统发现息肉实例

在满足排纳标准的446次结肠镜检查中,共检出346个腺瘤和无蒂锯齿状病变(SSL)。

通过平行对照验证发现,AI的介入显著提升了每次肠镜平均腺瘤检出数 (0.900 vs. 1.195, p=0.032),相对增加了33%;通过交叉对照验证发现,AI的介入显著降低了每次肠镜腺瘤漏诊率 (31.3% vs. 20.1%, p=0.025),相对降低了36%。

尤其值得一提的是,由于AI的介入,SSL的漏诊率降幅更大(仅有对照组的六分之一),具有统计学意义(42.1% vs. 7.1%,p=0.048)。要知道,SSL比传统腺瘤更容易在结肠镜检查中被漏诊,而且锯齿状息肉发展为癌症的时间可能更短。

漏诊率结果

除此之外,还有10位高级内镜医生参与了本次研究。研究数据表明,这些医生的腺瘤检出率基线高达43.6%,远超美国消化内镜协会针对筛查人群要求的25%的腺瘤检出率。

在使用AI系统辅助后,这10位医生的腺瘤检出率达50.4%,没有发现任何天花板效应,这是美国国家标准的两倍。换言之,一个腺瘤检出率达标的美国医生,很可能漏掉了一半的腺瘤病人,由此可见,人工智能有发挥作用的巨大空间。

经过研究人员统计,CADe-常规组检查中共发现285个息肉,其中只有3个漏报

此外,在CADe辅助检查中总共有203 例误报(假阳性),平均每次结肠镜检查产生的假阳性少于1例,错误率还是比较低的,而且这些误报大多是肠壁皱缩造成的。总而言之,漏报和误报少之又少。

打开网易新闻 查看更多图片

肠壁皱缩(左)和气泡(右)造成的误报

据了解,这套人工智能系统(EndoScreener)是由位于上海的Wision A.I.微识医疗使用中国西部某医院的数据研发而成[8],并在中国完成了4项前瞻性随机临床试验[9-12]。

正如前文所言,经过RCT检验的医疗AI实属凤毛麟角,而且这些研究都是在AI原生的医疗机构主导或重度参与下完成的[13,14]。

值得一提的是,Berzin教授领衔的这项临床研究,从临床试验机构、医生、病人,到消化内镜都来自美国,为AI提供训练样本的医疗机构都没有参与本研究,保证了这项随机对照试验的独立性。也就是说,这项临床研究能够更严谨地检验医疗AI创新的有效性,泛化性和鲁棒性。总而言之,这项研究是医疗AI的一项巨大突破。

当然,研究结果没有让研究人员失望,这个AI系统的表现与此前在中国完成的串联随机对照试验结果高度一致[15]。鉴于这个AI系统高标准地完成了全球医疗AI领域的首个独立外部随机对照试验,因此它也真正达到了临床使用的标准

总而言之,这个前瞻的多中心外部独立随机对照试验表明,在AI的辅助下,结肠镜检查能够显著提高腺瘤的检出率,降低腺瘤和SSL等癌前病变的漏诊率,最终可能会降低肠癌的发病率。

参考文献:

[1] Corley D A, Jensen C D, Marks A R, et al. Adenoma detection rate and risk of colorectal cancer and death. N Engl J Med 2014; 370:1298–1306

[2] Kaminski MF, regula J, Kraszewska e, et al. Quality indicators for colonoscopy and the risk of interval cancer. N Engl J Med 2010;362:1795–803.

[3] Ahn SB, Han DS, Bae JH, et al. The Miss Rate for Colorectal Adenoma Determined by Quality-Adjusted, Back-to-Back Colonoscopies. Gut and liver. 2012;6(1):64-70. Epub 2012/03/01.

[4] Kudo T, Saito Y, Ikematsu H, et al. New-generation full-spectrum endoscopy versus standard forward-viewing colonoscopy: a multicenter, randomized, tandem colonoscopy trial (J-FUSE Study). Gastrointest Endosc. 2018;88(5):854-64. Epub 2018/06/17.

[5] Topol EJ. Welcoming new guidelines for AI clinical research. Nat Med. 2020;26(9):1318-1320. doi:10.1038/s41591-020-1042-x

[6] Kleppe A, Skrede OJ, De Raedt S, Liestøl K, Kerr DJ, Danielsen HE. Designing deep learning studies in cancer diagnostics. Nat Rev Cancer. 2021;21(3):199-211. doi:10.1038/s41568-020-00327-9

[7] Jeremy R. Glissen Brown, MD, Nabil M. Mansour, MD, et al. Deep Learning Computer-aided Polyp Detection Reduces Adenoma Miss Rate: A U.S. Multi-center Randomized Tandem Colonoscopy Study (CADeT-CS Trial). Clin Gastroenterol Hepatol. doi: 10.1016/j.cgh.2021.09.009

[8] Wang P, Xiao X, Glissen Brown JR, et al. Development and validation of a deep-learning algorithm for the detection of polyps during colonoscopy. Nat Biomed Eng. 2018;2(10):741-748. doi:10.1038/s41551-018-0301-3

[9] Wang P, Berzin TM, Glissen Brown JR, et al. Real-time automatic detection system increases colonoscopic polyp and adenoma detection rates: a prospective randomized controlled study. Gut. 2019;68(10):1813-9. Epub 2019/03/01

[10] Wang P, Liu X, Berzin TM, et al. Effect of a deep-learning computer-aided detection system on adenoma detection during colonoscopy (CADe-DB trial): a double-blind randomized study. Lancet Gastroenterol Hepatol. 2020;5(4):343-51. Epub 2020/01/26

[11] Liu P, Wang P, Glissen Brown JR, et al. The single-monitor trial: an embedded CADe system increased adenoma detection during colonoscopy: a prospective randomized study. Therapeutic Advances in Gastroenterology. 2020;13:1756284820979165.

[12] Wang P, Liu P, Glissen Brown JR, et al. Lower Adenoma Miss Rate of Computer-Aided Detection-Assisted Colonoscopy vs Routine White-Light Colonoscopy in a Prospective Tandem Study. Gastroenterology. 2020;159(4):1252-1261.e5. doi:10.1053/j.gastro.2020.06.023

[13] Yao X, Rushlow DR, Inselman JW, et al. Artificial intelligence-enabled electrocardiograms for identification of patients with low ejection fraction: a pragmatic, randomized clinical trial. Nat Med. 2021;27(5):815-819. doi:10.1038/s41591-021-01335-4

[14] Repici A, Badalamenti M, Maselli R, et al. Efficacy of Real-Time Computer-Aided Detection of Colorectal Neoplasia in a Randomized Trial. Gastroenterology. 2020;159(2):512-520.e7. doi:10.1053/j.gastro.2020.04.062

[15] Wang P, Liu P, Glissen Brown JR, et al. Lower Adenoma Miss Rate of Computer-Aided Detection-Assisted Colonoscopy vs Routine White-Light Colonoscopy in a Prospective Tandem Study. Gastroenterology. 2020;159(4):1252-1261.e5. doi:10.1053/j.gastro.2020.06.023

责任编辑丨BioTalker