《自然》子刊：AI预测我们能活多久，你相信吗？

▎药明康德内容团队编辑

我们每个人的余生还有多久，“英年早逝”的风险有多大？不会时空穿越的我们自然很难给出答案，但如果说，有人工智能（AI）为我们预测这一切，你愿意相信吗？

这款听起来过于疯狂的AI模型的设计者，是一支由丹麦技术大学领导的研究团队。他们在一篇发表于《自然-计算科学》的近期论文中介绍道，名为life2vec的新工具可以根据健康史、受教育情况、职业、收入和工作时间等一系列事件，预测一个人的过早死亡风险、性格等结果，并且预测准确率高于此前的模型。

在认同或者是质疑之前，让我们先来看看这款模型是如何工作的。

论文指出，life2vec是基于Transformer模型构建的，后者正是我们熟悉的ChatGPT等大语言模型的构架基础。为了训练这个模型，研究团队使用了整个丹麦600万人的数据集进行训练。

在预训练步骤中，life2vec利用生命序列中的重复模式将事件嵌入到高维向量空间中，能够对健康因素、教育等生活事件之间进行分类并建立联系。这样的“嵌入空间”构成了最终预测模型的基础。

▲life2vec创建了生命活动的嵌入空间（图片来源：参考资料[1]）

在这项研究中，life2vec的第一项任务是预测过早死亡风险。研究团队选取了35岁至65岁之间的年轻队列，根据他们在2008-2015年间的各项数据来预测个体在2016-2020年内死亡的风险。如下图所示，life2vec预测过早死亡的准确性（这里用马修斯相关系数，即MCC来评估）显著高于其他模型。

▲life2vec和其他模型预测死亡风险的表现对比，life2vec的准确性明显占优（图片来源：参考资料[1]）

此外，论文还展示了life2vec模型能够预测个体在性格问卷中的答案，尤其是对外向性格的预测。

▲life2vec和其他模型对个体性格的预测（图片来源：参考资料[1]）

在该论文的通讯作者Sune Lehmann教授看来，他们构建了一个用于预测人类生活的通用模型——只要有训练数据，就可以预测“任何事情”。“它可以预测健康结果，因此可以预测生育或肥胖，或者预测会不会患癌症。” Lehmann教授说道。

不过，正如Lehmann教授在research briefing中写的那样，这项工作确实引起了人们对隐私和个人数据的许诸多担忧。因此，此类模型需要在保护个人权利的前提下应用。此外，尽管该模型使用了海量数据进行训练，但这些数据均来自丹麦，因此很可能存在系统性的社会人口统计学偏差，论文中的预测也只是基于高度特定的文化和社会背景进行的。

作者也强调，该工具不应用于真正对个体的未来进行预测，它的真正应用应该仅仅是为未来的研究工作奠定基础，帮助人们了解这类工具的原理及能力。“目前，这只是一项研究项目，我们正在探索什么是可能的，什么是不可能的。” Lehmann教授说。

毕竟，无论预测结果如何，我们的人生还是要靠自己度过的。

封面图来源：123RF

参考资料：

[1] Germans Savcisens et al, Using sequences of life-events to predict human lives, Nature Computational Science (2023). DOI: 10.1038/s43588-023-00573-5

[2] A transformer method that predicts human lives from sequences of life events, Nature Computational Science (2023). DOI: 10.1038/s43588-023-00586-0

[2] New AI model can predict human lifespan, researchers say. They want to make sure it's used for good. Retrieved March 25, 2024 from https://phys.org/news/2023-12-ai-human-lifespan-good.html

本文来自药明康德内容微信团队，欢迎转发到朋友圈，谢绝转载到其他平台。如有开设白名单需求，请在“学术经纬”公众号主页回复“转载”获取转载须知。其他合作需求，请联系wuxi_media@wuxiapptec.com。

免责声明：药明康德内容团队专注介绍全球生物医药健康研究进展。本文仅作信息交流之目的，文中观点不代表药明康德立场，亦不代表药明康德支持或反对文中观点。本文也不是治疗方案推荐。如需获得治疗方案指导，请前往正规医院就诊。

《自然》子刊：AI预测我们能活多久，你相信吗？

普通人终于能感觉到大模型有啥用了

论文 Figure 不堪入目，句子啰嗦读不通……这几个在线科研工具可以免费用了

“离谱的AI扩图”火了！张张那叫一个出其不意

全世界机器人共用一个大脑，谷歌DeepMind已经完成了第一步

奥特曼：GPT5性能远超GPT4，OpenAI不怕copy

Deepfake假CFO骗走公司1.8个亿，员工：视频会议每个人都很真实啊

字节“开盒”OpenAI所有大模型，揭秘GPT-3到GPT-4进化路径

129家期刊，被剔除中文核心！包括发“师娘的优美感”论文那本

高人预测：若不出意外的话，明年2025年将会有以下10个社会现象

学术是个圈，妲己算个屁

小镇做题家，在中年均值回归

错误的实验数据也能发文章毕业？还是 Nature 和 Cell 的子刊

因图片疑似重复，承德医学院附属医院的论文被评议

麦当劳退款原因写“顾客是傻x”续：已与顾客达成谅解

曾在耶鲁授课，现任哥大教授！为想进名校的孩子提供7条建议，每一点都值得家长学习收藏！

国米vs都灵首发预测：轮休5人，弗拉泰西、布坎南、阿瑙出战

布林肯二度访华，望不虚此行！他能带回什么？

男子持木棒连续猛砸老汉头部围观者大喊"好了"阻止

米兰设计周落幕了，还有这么多设计节庆正席卷全球

美媒：美抗议学生享用免费咖啡背后"金主"是索罗斯

《自然》子刊：AI预测我们能活多久，你相信吗？

普通人终于能感觉到大模型有啥用了

论文 Figure 不堪入目，句子啰嗦读不通……这几个在线科研工具可以免费用了

“离谱的AI扩图”火了！张张那叫一个出其不意

全世界机器人共用一个大脑，谷歌DeepMind已经完成了第一步

奥特曼：GPT5性能远超GPT4，OpenAI不怕copy

Deepfake假CFO骗走公司1.8个亿，员工：视频会议每个人都很真实啊

字节“开盒”OpenAI所有大模型，揭秘GPT-3到GPT-4进化路径

129家期刊，被剔除中文核心！包括发“师娘的优美感”论文那本

高人预测：若不出意外的话，明年2025年将会有以下10个社会现象

学术是个圈，妲己算个屁

小镇做题家，在中年均值回归

错误的实验数据也能发文章毕业？还是 Nature 和 Cell 的子刊

因图片疑似重复，承德医学院附属医院的论文被评议

麦当劳退款原因写“顾客是傻x”续：已与顾客达成谅解

曾在耶鲁授课，现任哥大教授！为想进名校的孩子提供7条建议，每一点都值得家长学习收藏！

国米vs都灵首发预测：轮休5人，弗拉泰西、布坎南、阿瑙出战

布林肯二度访华，望不虚此行！他能带回什么？

男子持木棒连续猛砸老汉头部 围观者大喊"好了"阻止

米兰设计周落幕了，还有这么多设计节庆正席卷全球

美媒：美抗议学生享用免费咖啡 背后"金主"是索罗斯

男子持木棒连续猛砸老汉头部围观者大喊"好了"阻止

美媒：美抗议学生享用免费咖啡背后"金主"是索罗斯