打开网易新闻 查看更多图片

撰文 | nagashi

进入21世纪以来,人类世界的数据信息增长速度急剧增快,随着数据量级越来越大,在可预见的未来,基于传统硅基储存介质的储存方式将不可避免地陷入资源枯竭的困境。于是乎,开发新的储存技术就显得尤为重要。

在数据储存的发展方向中,DNA存储技术是一个诱人且富有希望的选项。众所周知,DNA是自然生物储存遗传信息的载体——在细胞核尺度的空间里,就能储存一个物种所有的遗传信息。这是多么的令人难以想象!

近日,美国哥伦比亚大学的研究人员在Nature Chemical Biology杂志上发表题为:Robust direct digital-to-biological data storage in living cells 的研究论文。

这项研究向我们展示了一种新的DNA存储技术——通过结合CRISRP技术和重编程细菌,成功通过电刺激将二进制数据以3位单元编码到细菌的CRISPR阵列中,并实现了有意义的、72比特信息存储。

DNA以其高密度的信息储存特点有望成为下一代的数据存储介质,基于DNA存储开发的DNA计算机具有十分惊人的优点:1立方厘米的DNA存储的信息比一万亿张光盘存储的还多十几个小时的DNA计算,就相当于所有电子计算机问世以来的总运算量

打开网易新闻 查看更多图片

DNA存储技术的独特优势——具有极高密度的存储容量

当然,目前的DNA存储技术也存在一些亟待解决的难题,例如体外DNA合成速度慢错误率高以及合成费用昂贵等等。但值得注意的是,在活细胞中,这种情况是完全相反的,DNA合成速度不仅快而且突变率低,而成本更是不成问题。

由此可见,如果能将信息直接在活细胞中进行编码和储存,那将极大地促进DNA存储技术在现实中的应用进程!

因此,为了创造一种价格低廉且容易编码的活细胞DNA存储技术,哥伦比亚大学的Harris Wang教授所领导的研究团队一直致力于将信息数据直接写入生物体的活细胞DNA中。并且,这些DNA会通过复制将存储的信息传递下去,从而实现信息数据的长久保存

实际上,早在2017年,该研究团队就使用CRISPR基因编辑系统和基因编程菌识别生物信号——果糖,当研究人员将果糖添加到培养基中时,细菌中的质粒表达量就会增加。紧接着,CRISPR-Cas系统就会将过表达的质粒切成碎片,并将其中一部分插入到CRISPR阵列当中,这些被插入的DNA片段就会代表一个数字位。

如果果糖信号缺失,那么CRISPR-Cas系统就会随机储存一段DNA,这就代表一个数字零,然后研究人员对这些细菌的DNA进行测序,通过识别1还是0来揭示细菌是否接触了果糖。但可惜的是,这种装置只能存储很少的信息——几个比特的数据。

将3位二进制数据编码到细菌中

如今,Harris Wang教授及其同事开发一种更简便的、存储容量更大的活细胞DNA存储技术。他们使用一个可以编码更长信息串的系统,且区别于之前的果糖识别系统,采用了新的信息写入的诱导方式——电刺激

研究人员在细菌中插入了一系列的基因,使得这些基因编程菌能够对电压作出反应而增加质粒表达。与果糖识别系统类似,质粒表达量的增加通过CRISPR-Cas系统在细菌的DNA中写入一个数字位,最后通过DNA测序读出这些1和0。

通过电刺激和CIRSPR系统将数据信息直接写入活细胞的DNA中

通过这个新的方法,研究团队实现了对多达72位的数据进行了电子编码,并成功写入计算机领域的经典语句——Hello World!

不仅如此,Harris Wang教授还表示,他们可以将携带信息的基因编程菌混入正常的土壤微生物中,然后对混合物进行测序,仍能读取所存储的信息。

这意味着,一旦这项技术趋于成熟,我们或许可以在任何环境中随时随地读取我们想要的数据信息!

打开网易新闻 查看更多图片

72比特数据容量,并成功写入“Hello World!”

当然,这个系统依旧存在一定的弊端,比如:如何防止数据信息在细菌复制时发生突变和降解;72比特的信息存储容量相比于当前的硅基介质的硬盘存储技术仍差距甚远。对此,Harris Wang教授说道:“在生物体内储存数据还处于早期阶段,还无法与当前的存储系统竞争。”

总而言之,这项研究基于CRISRP技术和重编程细菌,成功实现了活细胞DNA的数据写入和读取,展现了DNA存储技术的全新发展方向。虽然距离实际应用还有很长的一段路要走,但不可否认,这是很好同时也是十分关键的一步!

参考资料:

https://www.nature.com/articles/s41589-020-00711-4

https://www.sciencemag.org/news/2021/01/scientists-program-living-bacteria-store-data