中文 英语

制造比特:4月13日

纠错储存DNA;纳米孔存储。

人气

纠错DNA存储
洛斯阿拉莫斯国家实验室有开发了一个关键技术这可能会在某一天为DNA存储铺平道路。

研究人员已经开发出一种被称为自适应DNA存储编解码器(ADS Codex)的技术。ADS Codex是一款软件,可以将二进制数字文件转换成存储DNA所需的四字母遗传字母表。

脱氧核糖核酸(DNA)是一种携带生物遗传指令的分子。一套完整的DNA叫做基因组。

DNA也是一种很有前途的档案存储技术。有几家公司正在运作在技术上,我们已经研发了多年。

在计算机中,离散单元存储为“0”和“1S”作为二进制代码。相比之下,DNA分子编码与离散单元的序列的信息。在DNA分子中,该单元涉及四个不同的核苷酸碱基:腺嘌呤(A),胞嘧啶(C),胞嘧啶(G)和胸腺嘧啶(T)。

资料来源:洛斯阿拉莫斯国家实验室

DNA不会随着时间的推移而降解,而且是紧凑的。因此,它可以在很长一段时间内将大量数据存储在一个很小的空间里。例如,国会图书馆大约有74tb的数据。洛斯阿拉莫斯国家实验室(Los Alamos National Lab)表示,一个罂粟种子大小的DNA档案库可以容纳大约6000个这样的图书馆。

但DNA存储并不是一项主流技术。它昂贵、缓慢而且容易出错。作为回应,洛斯阿拉莫斯正在开发新技术来克服其中一些问题。这是一个重大项目的一部分。洛斯阿拉莫斯的工作是情报高级研究项目活动(IARPA)分子信息存储(MIST)计划的一部分。

IARPA是一家为美国情报机构提供研发服务的美国政府机构。据洛斯阿拉莫斯说,MIST的目标是在24小时内以1000美元的价格写入1tb—一万亿字节—读取10tb字节。

这并不容易。根据洛斯阿拉莫斯的说法,将一个二进制文件编码成一个分子是通过DNA合成完成的。然后,ADS Codex将二进制数据转换为由A、C、G和t四个字母组合组成的序列。它还将解码返回为二进制。

然而,有时DNA合成容易出现编码错误。为了解决这个问题,ADS Codex增加了被称为错误检测代码的附加信息。这又可以用来验证数据。洛斯阿拉莫斯已经完成了广告法典的1.0版。

“在数字硬盘上,当0变成1时就会出现二进制错误,反之亦然,但在DNA上,插入和删除错误会带来更多问题,”洛斯阿拉莫斯的计算机科学家拉切萨·艾奥科夫(Latchesar Ionkov)说。“你在写A、C、G和T,但有时你试着写A,却什么也没出现,所以字母序列向左移动,或者输入AAA。正常的纠错代码不能很好地处理这种情况。”

“将单个核苷酸与DNA附加非常缓慢。需要一分钟。想象一下,将文件写入硬盘,超过十年。因此,通过大规模平行解决问题。Ionkov说,你同时写入数百万分子以加速它。““我们的软件,Adaptive DNA存储编解码器(ADS Codex),将数据文件转换为计算机理解生物学理解的内容。这就像从英语翻译到中文,只有更难。“

纳米孔的存储
不是DNA存储,École polytechnique fédérale de Lausanne (EPFL)开发了一种不同的生物储存数据的方法——细菌纳米孔。

EPFL开发了一种基于纳米孔的系统,可以读取编码到合成大分子的数据,具有准确性和分辨率。

纳米孔是一个微小的毛孔。孔可以在硅或生物实体等材料中产生,如蛋白质。在生物技术中,纳米孔可用于DNA测序或感测生物分子。

然而,纳米孔在决议方面受到限制。如果它们被用作存储介质,那就提出了一些挑战。

作为回应,EPFL基于一种叫做气溶素的致孔毒素,形成了纳米孔。利用气溶素纳米孔,研究人员证明了解码二进制信息的能力。根据EPFL的说法,他们“调整了气溶素来检测分子,这些分子是为这个小孔精确定制的。”

称为数字聚合物的分子在CNRS的Institut Charles Sadron的实验室中开发。“它们是DNA核苷酸和非生物单体的组合,所述非生物单体被设计为通过Acolysin Nanopores,并发出可以读出一点的电信号,”根据EPFL。

为了解码读数信号,研究人员使用深入学习。这反过来允许它们以高精度从聚合物中解码多达4位信息。

但是,与传统的纳米孔读数不同,该信号通过单比特分辨率提供数字读数,而不会损害信息密度,“EPFL的研究人员Chan Cao说。

EPFL的Matteo Dal Peraro表示:“我们正在进行几项改进,将这个仿生平台转变为数据存储和检索的实际产品。”“但这项工作清楚地表明,生物纳米孔可以读取杂交dna聚合物分析物。这为聚合物存储器开辟了新的前景,在超高密度、长期存储和设备便携性方面具有重要优势。”



留下一个回复


(注:此名称将公开显示)