打开网易新闻 查看更多图片

为了对抗冠状病毒的变种或其他流行病,人们需要加快速度确定变种,从而制造出相应的疫苗。面对如此多的可能性,数学模型可能会帮上很大的忙,如南加州大学研究员保罗-博格丹及其团队一起开发的模型。 他们的工作被刊登在《科学报告》的COVID-19专集上。

这项工作的起源来自于博格丹对核苷酸的思考:“我们如何能够学习DNA或RNA序列、打印机或计算机程序以及打印机如何编码背后的‘算法’。”

博格丹认为,这个数学模型能够利用算法信息理论,为破译病毒的内部工作规则打开分析路径。

这项工作与直接比较基因组序列的传统方法形成对比。相反,来自南加州大学和加州理工学院的研究团队提出了一种计算、机器学习的方法,确定RNA序列背后的生成器/程序的算法,并在这些生成器/程序之间进行比较。博格丹说,生成器类似于计算机程序,因为它们编码了隐藏的相似性、依赖性和规则,这些规则可能存在于RNA序列的两个RNA核苷酸之间。这个工具可以根据区域或长度以及可能进化的时间段来评估基因组序列和变异。这就像病毒的祖先网。

科学家表示,除了研究人类宿主之外,这种方法还可以用来追踪影响农作物的病原体,这样一来,受到影响的整个行业都会得到保护。

该研究论文题为"Generator based approach to analyze mutations in genomic datasets",已发表在《科学报告》期刊上。

前瞻经济学人APP资讯组

论文原文:https://www.nature.com/articles/s41598-021-00609-8?gclid=EAIaIQobChMIhcrZy8-c9QIVjuF3Ch2PgAUXEAAYASAAEgIZkPD_BwE