DNA折纸纳米结构实现动态链接数据存储,突破传统DNA存储瓶颈
《Nature Communications》:Linked data storage using DNA origami nanostructures
【字体:
大
中
小
】
时间:2025年12月18日
来源:Nature Communications 15.7
编辑推荐:
为解决传统DNA存储技术无法实现热数据(频繁访问与修改)管理的难题,研究人员开展了基于DNA折纸纳米结构(DON)的链接数据存储(DONLDS)研究。该研究利用不同形状的DON作为存储节点,通过可逆的DNA链连接实现数据的动态插入与删除,无需全结构遍历,存储密度高达222.22 Gbit/cm2。这项技术为DNA存储从冷数据归档迈向热数据应用开辟了新路径。
在信息爆炸的时代,数据存储正面临前所未有的挑战。传统的硬盘和闪存技术虽然成熟,但其物理密度和长期稳定性已接近极限。此时,DNA(脱氧核糖核酸)作为一种天然的信息载体,以其极高的理论存储密度(理论上1克DNA可存储约2.15亿GB数据)、极长的半衰期(可达数百年甚至千年)和极低的能耗,被视为下一代海量数据存储的终极解决方案。
然而,当前的DNA存储技术主要依赖于将数据编码为DNA序列,通过化学合成“写入”,再通过测序技术“读取”。这种模式存在一个致命的缺陷:它本质上是一种“顺序存储”。就像一卷古老的磁带,要读取中间的数据,必须从头开始“播放”或“倒带”,无法实现快速的随机访问。此外,一旦数据写入,修改或删除特定部分的数据极为困难,通常需要重新合成整个DNA库。这使得现有的DNA存储技术仅适用于“冷数据”(Cold Data)的长期归档,即那些不常被访问、但需要永久保存的数据,如历史档案、科学数据备份等。
但数据世界的未来,不仅需要“冷”的仓库,更需要“热”的引擎。所谓“热数据”(Hot Data),是指需要频繁、快速访问和动态修改的数据,例如实时数据库、操作系统文件、用户交互数据等。如何让DNA存储技术从“冷库”走向“热盘”,实现像计算机内存一样的快速随机访问和高效数据修改,是DNA存储领域亟待攻克的核心难题。
为了回答这一挑战,来自南京邮电大学、上海交通大学等机构的研究团队在《Nature Communications》上发表了一项突破性研究。他们独辟蹊径,不再将DNA仅仅视为一串线性的编码序列,而是利用DNA纳米技术,将其折叠成具有特定形状和功能的“积木块”。他们开发了一种名为“DNA折纸纳米结构启用的链接数据存储(DONLDS)”系统,成功地在分子尺度上构建了一个类似于计算机内存中“链表(Linked List)”的数据结构,实现了数据的动态存储、快速访问和高效编辑。
研究人员主要运用了DNA折纸(DNA Origami)技术,通过一条长链DNA(M13mp18)和数百条短链DNA(Staple Strands)的自组装,构建了三角形(TDON)、矩形(RDON)和十字形(CDON)三种纳米结构作为数据存储的“节点(Node)”。数据写入通过链霉亲和素(Streptavidin, SA)与生物素(Biotin)的特异性结合,在节点表面进行二进制编码。节点间的连接(即“指针”)由设计在结构边缘的DNA单链实现,通过互补配对和链置换反应(Toehold-mediated Strand Displacement)完成数据的动态链接、插入和删除。最终,所有构建的纳米结构均通过原子力显微镜(AFM)进行成像和数据分析。
研究人员首先构建了系统的核心组件——存储节点。他们利用DNA折纸技术,成功制备了三角形(TDON)、矩形(RDON)和十字形(CDON)三种不同形状的纳米结构。每个节点都包含两个关键区域:数据域(Data Domain)和指针域(Pointer Domain)。数据域位于节点中心,用于存储二进制信息;指针域位于节点边缘,由一系列具有特定序列的DNA单链构成,用于定义数据的位置和连接方向。
为了精确控制节点间的连接,研究人员设计了“操作链(Operation Strands)”,其序列与指针链完全互补。通过引入不同的操作链,可以像下达指令一样,引导特定的节点相互连接,形成有序的链表结构。原子力显微镜(AFM)图像清晰地展示了不同形状的节点在操作链的引导下,能够实现精确、有序的连接,甚至可以实现不同类型节点(如三角形与十字形)之间的跨类型互联,证明了系统的灵活性和可扩展性。
为了在节点上存储信息,研究人员在节点表面设计了特定的“连接位点”。他们利用链霉亲和素(SA)与生物素(Biotin)之间的高亲和力结合,将SA分子作为二进制“1”的标记物,固定在节点表面的特定位置。通过精确控制SA分子的连接位置,实现了在纳米尺度上的二进制数据编码。
通过对三种不同形状节点的性能评估,研究人员发现矩形节点(RDON)具有最高的存储密度,达到222.22 Gbit/cm2,十字形(CDON)和三角形(TDON)节点也分别达到了177.76 Gbit/cm2和157.78 Gbit/cm2的密度,远高于传统存储介质。
为了验证系统的实用性,研究人员首先利用三角形节点(TDON)实现了英文字母的存储。他们设计了一套8位二进制编码方案,其中包含3位方向码和5位字母码,成功编码了26个英文字母。AFM图像显示,所有26个字母的存储节点均被成功构建,且存储准确率高达91.17%至95.64%。
更重要的是,他们成功演示了数据的动态连接。他们将“HELLO WORLD”这一短语分解为五个独立的字母对(如“HE”、“LL”等),并通过引入特定的操作链,成功地将这些独立的节点连接成五个二聚体结构,连接准确率超过90%。这证明了系统能够按照预设程序执行数据连接指令。
研究人员利用十字形节点(CDON)展示了数字信息的存储能力。他们设计了一个4位二进制编码方案,成功存储了0-9的数字,存储准确率在91.17%至95.94%之间。
为了展示更复杂的应用,研究人员构建了一个用于存储地理坐标的链表。他们设计了“头节点(Header Node)”来标识经纬度信息,以及“数据节点(Data Node)”来存储具体的度数、分度值。通过将多个CDON节点连接起来,他们成功存储了纽约、北京、巴西利亚和悉尼四个城市的地理坐标,展示了系统处理结构化数据的能力。
汉字信息量大、结构复杂,通常需要16位二进制编码。研究人员利用矩形节点(RDON)构建了汉字存储方案。由于单个RDON节点的容量有限,他们采用两个RDON节点作为一个存储单元来存储一个汉字。通过设计索引域、方向域和汉字域,他们成功编码并存储了“厚德”、“弘毅”、“求是”、“笃行”等八个汉字,展示了系统对复杂字符集的支持能力。
此外,他们还通过构建四聚体RDON结构,成功存储了《道德经》中的长句“道可道,非常道”,证明了系统在长文本存储方面的扩展潜力。
DONLDS系统的核心优势在于其动态数据操作能力。研究人员通过DNA链置换反应,实现了数据的插入和删除操作。他们首先构建了一个包含多个节点的链表,然后通过引入“解锁链(Unlocked Strands)”断开特定节点间的连接,再通过引入新的操作链将新节点插入链表,或直接连接被删除节点前后的节点,从而完成了数据的动态编辑。
为了全面展示系统的能力,研究人员构建了一个包含9个节点的复杂链表,其中包含了三角形、矩形和十字形三种不同类型的节点。他们在这个链表中存储了“DNA-HELIX-1953”这一混合了英文、中文和数字的信息。随后,他们通过删除和插入操作,将链表中的“HELIX-1953”替换为“STORAGE-1988”,最终形成了新的链表,存储了“DNA-STORAGE-1988”信息。AFM图像清晰地展示了这一动态编辑过程,证明了系统在管理复杂、异构数据集方面的强大能力。
这项研究成功开发了一种基于DNA折纸纳米结构的链接数据存储(DONLDS)系统,将计算机科学中的“链表”数据结构引入到分子尺度。该系统利用不同形状的DNA折纸作为存储节点,通过可逆的DNA链连接机制,实现了数据的动态插入、删除和随机访问,彻底改变了传统DNA存储只能顺序读写的模式。
DONLDS系统的核心创新在于其“指针”和“操作”机制。通过设计在节点边缘的DNA单链(指针)和可逆结合的操作链,系统能够像计算机程序一样,精确地控制数据的连接与分离。这种设计使得数据修改不再需要重新合成整个DNA库,而只需通过简单的链置换反应即可完成,极大地降低了数据处理的复杂度和成本。
在存储性能方面,该系统实现了高达222.22 Gbit/cm2的存储密度,并成功演示了对英文、数字、中文等多种类型信息的混合存储与动态编辑。实验结果表明,单节点的数据存储准确率超过91%,通过引入冗余编码和纠错码(ECC),系统级的可靠性可以得到进一步提升。
尽管目前DONLDS系统在读写速度、成本和单节点容量方面仍面临挑战,但它为DNA存储技术从“冷数据”归档迈向“热数据”应用开辟了一条全新的道路。随着DNA合成技术、酶促合成和高密度芯片技术的不断发展,以及原子力显微镜(AFM)等读
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号