随着多组学技术的发展,利用多种组学数据进行复杂疾病的早期诊断,已经成为一项十分重要且需求旺盛的研究方向。

对于多组学整合来说,它能捕捉到疾病在不同分子层面的互补信息,为更精确的疾病诊断和疾病分类提供了可能。

然而,现有的多组学研究主要集中在提高预测模型的准确性,往往忽视了去寻找具有生物学意义的标志物。

这一问题在生物医学领域尤为重要,因为分子之间一般通过相互作用来影响疾病的发生与发展,而不是单独地发挥作用。

已有研究大多采用人工神经网络来处理高维度的组学数据,并从中学习低维度的表示形式。

例如,自编码器、变分自编码器、生成对抗网络和图神经网络等方法,已被广泛用于这一领域。

特别是图神经网络方法,由于其在捕捉分子间交互信息方面的优势,让它显示出了极大的潜力。

然而,这些方法大多关注于构建样本间的相似性网络,未能充分捕捉分子本身所固有的交互信息。

除此之外,由于个体的特异性显著,每个个体的生物标志物可能存在显著差异。因此,疾病诊断和标志物的识别必须从个体层面重新考虑。

此前,领域内的相关研究主要采用全局或局部视角来解释疾病的预测机制,例如通过 SHAP(SHapley Additive exPlanations)方法,来量化每个基因在区分疾病亚群中的鉴别能力。

然而,这些方法往往侧重于识别单个生物标志物,忽略了多分子之间的共功能信息。

基于此,哈尔滨工程大学团队提出一款名为 GREMI(GRaph-based Explainable Multi-omics Integration)的框架,旨在解决多组学整合和解释中的几个关键问题。

打开网易新闻 查看更多图片

(来源:IEEE Journal of Biomedical and Health Informatics)

研究中,他们面临的核心问题是如何在提高预测性能的同时,保持模型的生物学解释性。这个难题一度让课题组陷入困境,因为采用传统的方法往往难以兼顾这两个方面。

经过多次的头脑风暴和深入讨论,基于团队成员对不同领域知识的融合,他们最终提出了一个创新型解决方案:即结合图神经网络和蒙特卡罗树搜索。

通过此,他们设计出一个特殊的图注意力机制,这不仅能显著提升模型的预测能力,还能保持高度的可解释性。

研究人员表示:GREMI 引入了图注意力网络,故能更好地捕捉组学内部的相互作用,从而能够生成样本级别的潜在特征表示。

同时,通过联合融合策略和真正类别概率的引入,GREMI 在预测过程中能够以自适应的方式,评估特征层次和组学层次的分类置信度,从而能够提高模型的学习能力和预测性能。

此外,GREMI 框架还引入了模块级别的解释机制,通过蒙特卡罗树搜索算法在局部视角下探讨子图,并从全局视角来识别在疾病表征中具有高度贡献的功能模块。

这一模块级别的策略更加直观,特别适用于解释复杂疾病的多分子共同作用机制。

总之,本次研究提出了一个新型多组学整合框架,既能提升疾病预测的准确性,又能有效识别具有生物学意义的功能模块,从而能为复杂疾病的早期诊断和机制研究提供新思路和新工具。

日前,相关论文以《GREMI:一个可解释的多组学集成框架,用于增强疾病预测和模块识别》(GREMI: an Explainable Multi-omics Integration Framework for Enhanced Disease Prediction and Module Identification)为题发在 IEEE Journal of Biomedical and Health Informatics[1]。

梁洪和罗昊燃是第一作者(并列),哈尔滨工程大学姚晓辉副教授担任通讯作者。

打开网易新闻 查看更多图片

图 | 相关论文(来源:IEEE Journal of Biomedical and Health Informatics)

对于本次论文,审稿人表示 GREMI 框架在处理复杂疾病的预测和解释方面取得了显著进展,并对 GREMI 框架的可解释性机制表示赞赏。

其认为这种机制不仅能提高模型的预测性能,还能通过识别与疾病相关的功能模块,为学界提供了更加直观的生物学解释。

这种模块级别的解释,非常有助于理解多分子如何通过协同作用来影响疾病结果,并具有广泛的应用前景:

首先,有望用于面向多种疾病的智能筛查。

GREMI 框架通过分析患者的多组学数据,可以快速识别多种疾病及其亚型的早期风险。这对于癌症、心血管疾病、神经退行性疾病等早期难以察觉的疾病尤其具有价值。

其次,有望用于个性化医疗。

GREMI 框架能够根据多组学数据更准确地进行疾病诊断和亚型分类,为个性化治疗方案的制定提供科学依据。

再次,有望用于生物标志物的发现。

通过模块级别的解释机制,GREMI 框架可以帮助研究人员识别出与疾病相关的功能模块,这些模块可能成为新药研发或治疗靶点的候选者。

最后,有望用于复杂疾病的机制研究。

GREMI 框架可以帮助揭示不同分子如何通过相互作用共同影响疾病的发生与发展。

而基于本次成果,课题组计划扩展 GREMI 框架,以纳入更多类型的组学数据,比如纳入代谢组学和表观基因组学,以便进一步提高疾病预测的准确性和模型的泛化能力。

此外,他们还计划将 GREMI 用于更多的疾病类型,以验证其在不同病理条件下的适用性,并探索其在疾病治疗靶点发现上的潜力。

相关代码以及详细的使用说明已经全部开源,欢迎对此项工作感兴趣的科研工作人员下载、使用,并反馈问题 [2]。

参考资料:

1.https://ieeexplore.ieee.org/document/10629044/authors

2.https://github.com/Yaolab-fantastic/GREMI

运营/排版:何晨龙

01/

02/

03/

04/

05/

打开网易新闻 查看更多图片