▎药明康德内容团队编辑

我们每个人的余生还有多久,“英年早逝”的风险有多大?不会时空穿越的我们自然很难给出答案,但如果说,有人工智能(AI)为我们预测这一切,你愿意相信吗?

这款听起来过于疯狂的AI模型的设计者,是一支由丹麦技术大学领导的研究团队。他们在一篇发表于《自然-计算科学》的近期论文中介绍道,名为life2vec的新工具可以根据健康史、受教育情况、职业、收入和工作时间等一系列事件,预测一个人的过早死亡风险、性格等结果,并且预测准确率高于此前的模型。

打开网易新闻 查看更多图片

在认同或者是质疑之前,让我们先来看看这款模型是如何工作的。

论文指出,life2vec是基于Transformer模型构建的,后者正是我们熟悉的ChatGPT等大语言模型的构架基础。为了训练这个模型,研究团队使用了整个丹麦600万人的数据集进行训练。

在预训练步骤中,life2vec利用生命序列中的重复模式将事件嵌入到高维向量空间中,能够对健康因素、教育等生活事件之间进行分类并建立联系。这样的“嵌入空间”构成了最终预测模型的基础。

▲life2vec创建了生命活动的嵌入空间(图片来源:参考资料[1])

在这项研究中,life2vec的第一项任务是预测过早死亡风险。研究团队选取了35岁至65岁之间的年轻队列,根据他们在2008-2015年间的各项数据来预测个体在2016-2020年内死亡的风险。如下图所示,life2vec预测过早死亡的准确性(这里用马修斯相关系数,即MCC来评估)显著高于其他模型。

打开网易新闻 查看更多图片

▲life2vec和其他模型预测死亡风险的表现对比,life2vec的准确性明显占优(图片来源:参考资料[1])

此外,论文还展示了life2vec模型能够预测个体在性格问卷中的答案,尤其是对外向性格的预测。

▲life2vec和其他模型对个体性格的预测(图片来源:参考资料[1])

在该论文的通讯作者Sune Lehmann教授看来,他们构建了一个用于预测人类生活的通用模型——只要有训练数据,就可以预测“任何事情”。“它可以预测健康结果,因此可以预测生育或肥胖,或者预测会不会患癌症。” Lehmann教授说道。

不过,正如Lehmann教授在research briefing中写的那样,这项工作确实引起了人们对隐私和个人数据的许诸多担忧。因此,此类模型需要在保护个人权利的前提下应用。此外,尽管该模型使用了海量数据进行训练,但这些数据均来自丹麦,因此很可能存在系统性的社会人口统计学偏差,论文中的预测也只是基于高度特定的文化和社会背景进行的。

作者也强调,该工具不应用于真正对个体的未来进行预测,它的真正应用应该仅仅是为未来的研究工作奠定基础,帮助人们了解这类工具的原理及能力。“目前,这只是一项研究项目,我们正在探索什么是可能的,什么是不可能的。” Lehmann教授说。

毕竟,无论预测结果如何,我们的人生还是要靠自己度过的。

封面图来源:123RF

参考资料:

[1] Germans Savcisens et al, Using sequences of life-events to predict human lives, Nature Computational Science (2023). DOI: 10.1038/s43588-023-00573-5

[2] A transformer method that predicts human lives from sequences of life events, Nature Computational Science (2023). DOI: 10.1038/s43588-023-00586-0

[2] New AI model can predict human lifespan, researchers say. They want to make sure it's used for good. Retrieved March 25, 2024 from https://phys.org/news/2023-12-ai-human-lifespan-good.html

本文来自药明康德内容微信团队,欢迎转发到朋友圈,谢绝转载到其他平台。如有开设白名单需求,请在“学术经纬”公众号主页回复“转载”获取转载须知。其他合作需求,请联系wuxi_media@wuxiapptec.com。

免责声明:药明康德内容团队专注介绍全球生物医药健康研究进展。本文仅作信息交流之目的,文中观点不代表药明康德立场,亦不代表药明康德支持或反对文中观点。本文也不是治疗方案推荐。如需获得治疗方案指导,请前往正规医院就诊。