*仅供医学专业人士阅读参考

肺癌预后模型的性能究竟如何?让我们一窥究竟吧!

随着“大数据”时代的到来,数据挖掘技术被应用到医学领域,可以通过机器学习的方法对医疗数据进行处理,建立模型进行研究。在肺癌领域,其诊断模型的研究已趋于成熟,准确率越来越高,而肺癌的预后模型相对而言还不够完善[1],在2023年由欧洲肿瘤内科学会(ESMO)主办的大会上,发布了几项关于肺癌预后模型的研究[2-4],其中有2篇[3-4]是由中国学者报道的研究,这些学者通过大数据构建模型,旨在找到影响肺癌患者术后复发、生存预后的重要特征,以帮助肺癌患者选择更好的治疗方案改善预后,下面让我们一起来看看这些学者开发的模型性能表现如何吧!

1. 一项基于NLST和欧洲医院数据进行的回顾性研究:预测肺癌术后复发的机器学习模型(摘要号:1269P)[2]

肺癌根治性手术切除后的复发率为30%—55%,这是患者管理的重大挑战。准确预测复发风险对于指导治疗决策至关重要,如(新)辅助化疗或免疫疗法的使用、肺切除范围和随访策略。本研究提出了一种术前机器学习模型,利用患者的计算机断层扫描(CT)图像和人口统计学特征来预测肺癌的复发。

研究者回顾性收集了588例接受手术治疗的I-IIIA期肺癌患者的CT图像及相关人口学和病理学数据,其中有147例患者在术后发生复发。本研究数据来源包括美国国家肺部筛查试验(NLST)和北爱沙尼亚医疗中心(NEMC)的筛查和临床病例。研究者对术前模型进行了训练,以根据一系列不同的特征预测复发的可能性,这些特征包括从CT图像中提取的影像学特征和相关临床变量。研究者采用了8折交叉验证法(8-fold cross validation strategy)将数据集划分成8个相同大小的子集,6个用于训练,1个用于模型调整,1个用于测试。研究者在基线将术前模型与临床分期进行了比较,通过受试者工作特征曲线(ROC曲线)下的面积(AUC)值(备:AUC值是机器学习中常用的模型评估指标之一,它可以帮助我们衡量分类模型的性能,AUC值越高通常表明模型的效果越好)来评估模型性能的灵敏性(Sen)和特异性。

肺癌复发的预测结果如下表所示(Table:1269P)。本研究结果显示,本模型的表现(AUC=61.4,Sen=18.2)明显优于单纯根据术前分期进行的预测(AUC=56.1,Sen=16.4,P值=0.035)。

打开网易新闻 查看更多图片

结论:根据这项回顾性分析,研究者发现本模型在术前对肺癌复发的预测表现出色,要优于基于临床分期的预测结果。随着进一步的发展,本模型的算法将成为辅助肺癌患者进行管理的重要工具。

2. 基于驱动基因类型对非小细胞肺癌患者的术后生存率进行预测(摘要号:1272P)[3]

非小细胞肺癌(NSCLC)是一种具有多种已知致癌驱动基因突变的异质性疾病。目前,不同基因突变类型患者术后生存率的差异仍是未知数。研究者曾构建一个临床列线图(基于临床风险因素的预测模型)(备:列线图又称诺莫图(Nomogram),简而言之列线图就是通过Logistic回归或Cox回归分析将多个预测指标进行整合,然后采用带有刻度的线段将结果进行可视化呈现,表达预测模型中各个变量之间的相互关系),它能有效预测NSCLC患者的术后生存率,其一致性指数(即C指数)为0.71,但基于基因突变类型的分类来进行整合预测,其有效性仍有待阐明。

本研究收集了来自广州医科大学附属第一医院的6种不同驱动基因类型的患者数据,包括临床特征和预后信息。研究者比较了不同基因类型患者的总生存期(OS)、无病生存期(DFS)和无复发生存期(RFS),利用上述数据对先前的预测模型进行了外部验证(备:外部验证能够提供模型在真实世界中的表现,而不仅仅是在训练数据上的表现。这有助于评估模型是否能够正确地推广到未知数据,从而避免过拟合问题),并在不同基因突变类型的患者中评估了其预测性能。此外,研究者还通过整合基因亚型构建了一个新的生存预测模型,并将其预测性能与先前的预测模型进行比较。

本研究结果显示,共有1397例患者的数据被纳入分析,不同驱动基因类型患者的OS(P<0.05),DFS(P<0.05)和RFS(P<0.05)均存在显著差异。先前的预测模型在本队列中显示出良好的普适性(C指数:0.71,95%CI:0.68—0.74)。然而,该模型在不同基因类型中的表现各不相同,在EGFR L858R突变、EGFR 19缺失突变和野生型患者中表现出良好的适用性,但在EGFR罕见突变、RAS/BRAF突变和融合突变的患者中却表现欠佳。整合基因类型的新预测模型略微提高了之前单纯基于临床风险因素的预测模型的性能(C指数:0.74 vs 0.71)。

结论:不同基因类型的患者显示出不同的预后结果。基于临床风险因素的预测模型在某些驱动基因亚型中能保持一定的预测性能。此外,将基因分型与临床风险因素进行整合,也能略微改善模型的预测性能。

3. 含有微乳头成分的肺腺癌基因组分析:鉴定微乳头相关亚型并开发预后模型(摘要号:1275P)[4]

微乳头型腺癌是肺腺癌中最具侵袭性的组织学亚型之一,甚至含有少量微乳头成分(MPC)的肺腺癌都可能导致不良预后。因此,对含有MPC的肺腺癌的遗传学特征进行全面分析,有助于更好地了解该肺腺癌亚型的肿瘤生物学特征并指导未来治疗方案的选择。

本研究团队在既往一个由超过1500例患者组成的国际队列中,识别出11个与肺腺癌预后显著相关的基因。在本研究中,研究者从癌症基因组图谱(TCGA)数据库中采集了1592个含有MPC的肺腺癌样本数据并分析11个基因的表达模式。本研究采用LASSO Cox回归分析法预测OS。根据风险评分的中位值,将患者分为低风险组和高风险组。随后,对评分系统的预测准确性进行了验证,并使用列线图来优化其临床适用范围。

结果通过无监督聚类分析法,根据预后基因将患者分为两个基因组(A和B),以进一步研究特殊调控机制。“卡普兰-梅尔” (Kaplan-Meier)生存曲线显示,与基因组B相比,基因组A患者的OS明显更长。使用LASSO Cox回归分析,建立了8个基因的预后特征。与低风险组相比,高风险组患者的OS较差(71.9个月 vs 118.5个月)。值得注意的是,有MPC的高风险组患者的OS显著差于中风险组[风险比(HR)=1.81,95%CI:1.13-2.88,P=0.013]和低风险组(HR=1.03,95%CI:0.63-1.70,P=0.910),而无MPC的患者与低风险组患者之间的OS则无统计学差异。

结论:本研究的发现为进一步了解这种侵袭性肺腺癌亚型的本质提供新的视角,为更好的疾病预后预测铺平了新道路,并有助于为肺腺癌患者制定个性化的治疗策略。

审稿专家简介

郭俊唐教授

  • 医院:中国人民解放军总医院

  • 职称:副主任医师 副教授

  • 科室:胸外科

  • 擅长:肺癌的微创手术及规范化治疗。特色为单孔胸腔镜肺叶切除术及精准肺段切除术。开展复杂肺叶切除及胸腔镜下支气管成形术。

  • 国际肺癌研究协会(IASLC)会员

  • 中国医药教育学会胸外科分会委员

  • 中国医学救援协会康复医学分会委员

  • 中国研究型医院学会胸外科分会青年委员会副主任委员

参考文献:

[1] 宋一鸣. 基于机器学习的肺癌患者预后模型的研究[D].哈尔滨工程大学,2017.

[2] A. Valter, T. Kordemets, A. Gasimova, et al. Machine learning model for predicting lung cancer recurrence after surgical treatment: A retrospective study using NLST and European hospital data. 2023 ESMO abstracts. 1269P

[3] H. Wang, C.C. Li, J. Li, et al. Postoperative survival prediction in non-small cell lung cancer patients based on driver genotypes. 2023 ESMO abstracts. 1272P

[4] Y. Lin, Y. Jiang, R. Zhong, et al. Genomic analysis of lung adenocarcinoma with micropapillary component: Identification of micropapillary related subtypes and development of a prognostic model. 2023 ESMO abstracts. 1275P

* 此文仅用于向医学人士提供科学信息,不代表本平台观点