存储新图谱:DNA 存储的边界与天地

js 原创
2022-02-23 电脑百科网

数字信息时代,无论是出产数据的各大视频网站、使用平台等,仍是顾客们运用的各类电子设备,都无不在时时刻刻发生数据。

拿自动驾驶举例来说,平均每辆自动驾驶车每天发生的数据量高达 10TB。根据 IDC 机构的猜测,2020 年到 2025 年间,全球生成的数据 (包括新数据和副本数据) 量预计复合年增长率为 23%,到 2025 年达到 180ZB,每天简直发生 490EB 的数据。

数据也成为继土地、劳动力、本钱、技能之后的第五种出产要素,一切根据数据的发掘和增值都离不开存储。存储成为数据使用的根底,其存储方法也跟着数据量的激增与需求不断发生变化。在信息与技能的不断开展演进中,存储开端面对不少的挑战。

存储设备、介质(磁性材料和半导体材料)随时间的老化与更新不及时,存储保护本钱高,存储密度的局限以及动力功耗大等。这些现实的窘境驱动业界开端寻觅更好的替代方案,满意不断增高的性能、低功耗、稳定性等需求。

DNA 存储成为根底的新存储技能被作为优先的研讨方向,以解决数据存储中存在的负荷与问题。咱们经常会在新闻中看到,考古学家经过什么 DNA 测定,了解到几百年、几千年的信息。据悉,在合适的条件下,DNA 能够继续存在数十万年,甚至几百万年。

不考虑 DNA 的其他存储特性,只是凭借着恒久的保存时间,咱们的数据也有或许成为和“化石”一样的存在,这个特性就十分值得咱们长久地下功夫去研讨与出资。当然,DNA 存储的优势不止如此。

存储功率的千倍进步

简略来说,DNA 存储原理便是将 DNA 分子中的碱基序列与存储信息编码一一对应,将文字、图片、声音等信息转化为 DNA 序列进行存储。这是一门需求多学科穿插的高精尖技能,触及生物、核算机、化学等学科。

在生物分子中贮存信息,非常杂乱。科学家们将目光与精力投入到 DNA 存储的范畴,最根本的原因是垂青其极高的存储密度特性。据悉,1 克 DNA 即可贮存 215PB 的信息,而硬盘的存储量不过几 TB。要知道,1PB=1024TB=1024X1024GB,依照高清电影每部 10GB 算,1 克 DNA 能够存储 2.2 亿部电影。与此同时 DNA 存储的保护本钱也相较数据中心低许多。在能耗方面,1GB 的数据硬盘存储能耗约为 0.04W,而 DNA 存储的能耗则远远小于硬盘存储能耗,可忽略不计。

在数据量日渐激增的信息时代,高存储密度,低本钱保护与低能耗贮存信息的方法,使得科研机构与本钱都将精力与金钱押码在这个或许成为未来干流存储方法。不过尽管有资金与科研的投入,但其开展仍较为缓慢。咱们能在公开途径中看到的效果都是实验室的最佳成绩。例如 2012 年,哈佛大学研讨人员用 DNA 贮存了一本五万字的图书。欧洲生物信息研讨所在 DNA 贮存了莎士比亚的十四行诗以及马丁・路德・金的演讲《我有一个梦想》的录音带。

从上世纪 50 时代提出,DNA 的数据存储研讨的开展一向缓慢,没有什么较为重大的变化。不过在近两年,DNA 存储的技能开端有了一些新的开展。近来微软研讨院对外声称,研讨出新的分子控制器,使得 DNA 的存储写入的速度相较以往进步了 1000 倍。微软研讨院作为 DNA 数据存储的早期入局者,2015 年开端进行相关研讨,直到 2019 年才有研发开展,到如今速率千倍的晋级,仍是着实下了一番功夫。

与此同时,国内的东南大学生物科学与医学工程的刘宏团队也完成了 DNA 存储的新打破:安身自主开发完成了 DNA 组成与测序环节的一体化,仪器设备也完成了小型化。DNA 存储在国外的技能道路大都是存储的组成与测序环节分隔进行,需求大型的仪器设备,操作也相对杂乱一些。刘宏团队将仪器设备等朝着便携式改进了许多。

佐治亚理工学院 (GTRI) 近期也公布了新开展,他们的团队规划了一种微芯片,能够明显进步以 DNA 方式写入数据的速度。该团队预计将比当前的 DNA 存储技能进步 100 倍。

研讨机构的各种开展也使得嗅觉灵敏的出资机构风闻而来,中科碳元(深圳)、密码子(杭州)等创业公司取得数千万的天使轮融资。

而方针方面,DNA 存储已经成为国家层面布置的要点开展方向。国家“十四五”规划中说到要加快布局量子核算、量子通讯、神经芯片、DNA 存储等前沿技能。咱们能够看到,DNA 存储在方针、本钱与技能的集中发力中开端蓄势待发,不过关于这类高精尖的技能来说,距离其真实的商业化落地进程还尚早。

难以打破的结构性障碍

尽管 DNA 存储具有较为明显杰出的优势,方针、本钱等也在全方位的支撑,使用的远景宽广,但商业化的开展仍然十分缓慢。其最大屏障来自于其存储技能自身。

为了便于了解 DNA 存储的面对的技能窘境,咱们简略介绍一下 DNA 存储数据的进程。主要分为以下五个进程:编码 —— 将数字信息编码为 DNA 序列;组成 —— 将序列融入实际的 DNA 分子;存储 —— 将组成的 DNA 片段保存在载体或细胞中;访问 —— 检索和选择性读取序列信息;解码 —— 将测定的序列信息转换回数字信息。

在整个存储的进程中,编码与组成是 DNA 存储中较为要害和困难的环节。尤其是 DNA 的组成进程最为艰苦,在碱基序列融入 DNA 分子的进程中,很容易随机损失掉组成的 DNA。

而编码是 DNA 存储中本钱与难度较大的环节,不过跟着 AI、纳米微孔等技能的开展,编码环节的难度与本钱都开端逐渐降低。

DNA 存储的组成进程使得数据输入和读取的功率无法提上去,花费的时间较长、本钱较高。据佐治亚理工学院 2021 年 12 月发表的信息称,DNA 存储速度进步到了每天写入 20GB 数据,这是现在已知 DNA 存储最快的写入速度,而现在固态硬盘的读写速度最快大约为每秒 500MB。

本钱方面,2017 年哥伦比亚大学的实验显现,组成 2MB 的 DNA 数据需求 7000 美元,而读取数据需求 2000 美元,假如用户需求以 DNA 方式贮存 1GB 的电影,编码大约需求花费 358 万美元,而读取数据还需求 102 万美元。DNA 存储技能的读写速度与本钱,大大约束了其规划商业化的开展。

另外一个较大的影响因素跟科研人才相关,由于 DNA 存储技能范畴的强学科穿插性,必须依靠核算机、生物、化学、数学等多个相关学科的协同,这也就对科研人才的复合能力水平要求较高。

当然除了技能的进阶、人才的需求以外,存储的便携式要求也是其较为重要的开展方向需求。关于这类高精尖技能的设备,传统的设备都较为笨重,便携式的优化也困难重重。总的来说,DNA 存储的各个环节都有较多的难关需求克服,DNA 存储真实意义上的走入商业市场,进一步开展成为干流的存储设备,还需求长时间的沉积,才能让 DNA 存储技能有本质的进阶。

终极存储:深空与亘古

关于数据的存储来说,多元化、智能化、绿色化是其主要的开展风向标,尤其是绿色的数据中心是主推的开展方向。

据研讨机构猜测,若动力利用功率得不到继续进步,数据存储用电量到 2030 年或许增长到全球用电总量的 3% 至 13%。数据存储的动力功耗令人担忧,降低能耗将成为数据中心建造的首要方针,存储设备作为数据中心中最为耗能的设备,成为改造的排头兵。

现在改进常见的思路是从存储设备的硬件层面进行考量,如架构规划、芯片、硬盘介质等。而 DNA 存储可谓是存储的终极进化方向。据悉,麻省理工学院生物工程教授 MarkBathe 称,理论上,一个装满 DNA 的咖啡杯就能够存储世界上一切的数据。假如未来能够完成,DNA 存储一定会改造存储范畴的格式。

在生物科技范畴,近年来由于人工智能技能的飞速开展,一些生物科技和人工智能融合的方面,例如蛋白质的结构猜测、新药的研发、制备都有了质的飞跃。DNA 存储在 AI 技能的加持下,其编码的环节功率也取得了极大地进步。未来跟着纳米技能与 AI 技能的加持,DNA 存储的技能也会一步步免除智识的约束禁锢,逐渐晋级,为存储范畴带来质的飞跃。

当然 DNA 存储除了数据的存储外,也有一些新使用方向的或许。比方,能够把个人健康历史数据存储进 DNA,这种存储方法与人体更兼容,医师能够随时的调用参阅这些病例数据,愈加精准全面地进行医治,改进病患的健康情况,甚至促进寿命的增加。

未来人类深空宇航飞翔的时分,能够用 DNA 存储信息,只要制备适宜的保存条件,这些消息就会留存,向世界深处传播;也或许存在这种景象,新人类在考古的时分,发掘出咱们存储在 DNA 的彩蛋,DNA 的数据展开是一部前辈留存的文明与技能消息,诉说着咱们的辉煌与经历,感觉有种终极的浪漫。咱们最终要留下什么传承,怎么完成这个技能,这个终极的存储进化值得咱们去研讨与等候。

华为电子阅读器(墨水屏)平板即将到来:支持鸿蒙,现开始招募测试用户 中国生物:新冠特异性免疫球蛋白已开展临床试验,效果不受病毒变异影响 中航锂电董事长回应与宁德时代专利纠纷:不存在恶意侵权动机 消息称百度首个元宇宙“希壤”选定英伟达为合作伙伴,双方将共建“AI 元宇宙” 科技投资人米克斯:缺芯或持续至 2023 年,不看好苹果和其他 FAANG 公司 荣耀 60/Pro 系列预热:支持手势拍照,采用四曲屏 + 双环后摄设计
热门文章
为你推荐