档案数字资源长期存储介质
随着新一代信息技术广泛应用,档案工作进入“大数据”时代。目前,馆藏纸质档案数字化工作和电子文件归档工作不断推进,数字档案存储量呈指数级增长。档案部门承担着“为党管档、为国守史、为民服务”的职责使命,应以此为导向,主动开展数字档案存储介质研究,制定完善档案存储介质、设备的检测和选择标准,确保数字档案长期安全完整保存。

1.磁带 磁带在1951年首次被应用于信息数据存储。它是一种涂有磁层的带状材料,通过改变涂覆在上面的磁性材料排列来记录声音、图像、数字等信息。磁带记录、读取数据都是采用顺序方式,需要使用专用磁带机读取。磁带技术经过70余年不断突破创新,已跨过手动操作、自动近线、大容量联线等3个发展时期。磁带存储安全、防病毒强、纠错能力高、能耗低,保存年限一般在30-50年。它适用于存储数据利用率较低的离线数据,非常适合档案资料的备份存储。现阶段,磁带具有高速度、高密度、低费用、大容量、文件系统独立等特点,磁带以其独有的优势仍然在存储备份容灾中具有明显的优势。

2.磁盘 磁盘也是一种常见的磁性介质,通常分为软盘和硬盘。软盘由于容量小、速度慢,基本已被淘汰。硬盘(HDD)一般指的是传统机械硬盘,由多片覆盖磁性材料的盘片组成,通过磁头从旋转的盘片上读写数据。硬盘1956年首次出现,到现在已有60多年的历史,存储密度、容量和可靠性得到了极大提高。单盘容量从最初的MB级到现在TB级。同时,体积和重量不断缩小,从重达上百公斤的庞然大物,变成了数百克的2.5/3.5英寸盘。硬盘已经成为计算机主要存储设备,也是数字档案生成和处理的首要存储介质。它比较适合存储那些需要经常访问的信息。硬盘寿命相对较短,必须定期对数据进行备份。在传统硬盘的基础上产生了移动硬盘和磁盘阵列,提高了磁盘使用的便利性和安全性。
3.光盘 光盘是继胶片、磁性载体之后又出现的一种信息存储介质。它是以光信息存储数据的载体,利用激光束投射在光盘记录层上读写信息。光盘从1987年进入市场,虽然单位存储量低,但凭借稳定性较好、成本低廉、适用范围广等特点,成为重要信息载体被广泛使用。30多年来,光盘发展过程中出现CD、DVD、HD-DVD、BD (蓝光)等多种标准,波长从CD的780mm到DND的650m再到BD的405nm,存储容量不断刷新。光盘寿命受光盘质量及保存条件的影响,寿命一般为10-20年。光盘也是仅有国际标准的存储载体。我国在2008年出台的档案行业标准《电子文件归档光盘技术要求和应用规范》,对档案管理部门使用光盘作出了明确规定。光盘也是档案部门常用的备份存储介质之一。

4.半导体 半导体材料的大规模应用带来人类历史上的第三次产业革命,半导体为计算机存储提供了新的载体。1989年世界上出现了第一款使用半导体材料制作的固态硬盘,经过不断发展,基于3DNAND Flash非易失闪存芯片的固态硬盘(SSD)得到大规模应用。SSD无机械设备,具有存储读取速度快、体积小、无噪音、功耗低等优点,可以 解决磁存储随机访问差的痼疾。SSD初期单位造价为机械硬盘的几十倍,随着闪存芯片工艺制程的转换,其容量不断提升,成本持续走低,大幅度提升计算机系统的整体性能,该技术逐渐取代传统硬盘。
为实现大容量、高密度、长寿命的目标,存储行业经过不断探索,使用多种技术方案,在原有基础上研发了一些新型存储介质。

1.数字胶片 挪威Piq1公司开发出一种新型纳米胶片,用于数字资源存储。传统缩微胶片是种间接存储方式,主要存储模拟图像,通过照相获取图像文件,处理电子数据容易造成损失并破坏数字档案的原始性,对部分特殊数字档案无法记录。而Piql胶片除了能够把可视化的图像存储在胶片上,还可以不经过数模转换来存储数字数据它直接把原来数字信息转换成超高分辨率的QR码( Quick Response,一种二维码),将这种二维码信息打印在特殊胶片上,可以避免对数字档案原始性的破坏并能存储大部分类型的数字档案。这种技术将感光胶片转变成数字存储介质,具有存储密度高、容错能力强、存储数据全面保存寿命长等优点,是一种新型的电子档案长期保存解决方案。
2.全息光盘 传统光盘由于自身物理特点限制,难以提高分辨率或减小波长,而且光盘“多层技术"不能一味增加层数,光盘容量已经接近极限。1963年全息存储概念出现,而后随着更多全息材料的问世,全息存储技术得以发展。它突破传统的二维存储,采用超高分辨率三维光存储技术。激光经分光镜分为物光和参考光,两束光相遇发生干涉,使得数据信息以全息图的方式被记录下来由于参考光入射方向不同,这就将不同的信息重复存储在全息介质的相同位置上增加了存储容量。读取时,利用相同参数的参考光照射存储介质,将再现出的信号光转变成电信号,以数据页为单位进行读写,有极高的数据传输速率。全息光存储技术被认为是很有前景的一种光存储技术。

3.玻璃类光存储 玻璃具有透光性好、化学稳定性好等特点,其使用寿命可达千年。目前,已有多种基于玻璃类光存储研制成功。超短脉冲激光是研究物质微观体系的重要工具,飞秒激光就是其中的代表。2012-2020年,英国南安普顿大学的科学家持续开展玻璃存储研究,使用飞秒激光聚焦到玻璃内部,诱导出结构形态变化,形成“纳米光栅”的双折射结构来保存信息、该玻璃存储读取光包含了纳米格栅的方向、激光折射的强度,加上玻璃的三维空间,一共5个维度,这一技术也被称作“五维数据存储”。利用双折射显微镜,可以读取存储信息。“五维数据存储”具有更大的数据存储密度,存储数据量可达360TB,耐热温度更是可以达到000,存 储寿命极其稳定。科学家不断推动这项技术的优化发展,这一技术可以在不久的将来得到商用,对存储数字档案极具潜力。

4.DNA存储技术 生物技术与信息技术的融合,给数字存储带来了新思路,出现了利用分子结构进行编码的生物存储技术一一DNA存储技术。该技术利用DNA中的4种碱基组合代表二进制数据,通过人工合成长链DNA来实现数据的存储,读取时将DNA信息逆转换成二进制来进行。DNA存储技术存储密度高,可实现较短段时间复制大量数据,存储在DNA中的数据还可利用DNA杂交对其进行相似性搜索,在合适的条件下保存时间可达几百年到上千年。总体来看, DNA存储技术的优点为容量大、存储时间长、能耗低、运营成本低等,但其初期研发投入较大。
5.蚕丝生物技术 2020年,中科院上海微系统与信息技术研究所,融合生物技术与半导体技术,选择蚕丝蛋白作为存储介质,首次开发出了蚕丝存储技术。通过纳米针尖使用红外光对蚕丝蛋白进行操纵,蚕丝蛋白吸收能量后转变成凸起的纳米柱,以达到数字信息的写入。用同一套系统则可实现数字信息的读取。蚕丝存储不会受到强磁场、强辐射、微波辐照等干扰。目前,该团队已用这种技术实现了图像、音频等文件的存储和读取。蚕丝存储不仅可以存储数字信息,还可以存储生物信息,如存储人体DNA和血液样本。
传统的数字档案保存介质已渐渐无法满足现今的存储要求,档案部门必须适应形势主动求变,积极开展相关研究,在管理体制与业务实施方面,做出相应的调整。

1.使用现状 为了保证数字档案的长期安全,档案部门大多采用多套多介质载体备份的方式,从而保证了数字档案长期保存的可靠性。各档案保管部门条件和情况不同,选择存储介质和技术也不尽相同。存储数字档案资源的介质主要是光盘、磁带、磁盘、半导体四大类,在这些介质的基础上组成光盘库、磁带库、磁盘阵列、混合存储等存储设备。
长期存储、备份需要存储设备具有良好的稳定性,能够保证数据长期存储的安全性。从整体上看,数字档案在线存储设备以磁盘阵列、混合存储为主,磁盘阵列、光盘库、磁带库更多地作为离线数据备份使用。长期存储设备使用率由高到低依次是:磁盘阵列、磁带库、光盘库,很少使用移动硬盘和固态硬盘作为存储载体。部分档案部门还将一些重要的电子档案纸质化或以缩微胶片的方式进行备份。而考虑到数据安全,除少数单位将数字档案存储在政务云上,其他以云存储为代表的新存储方式则使用的较少。

2.面临问题 数字档案安全面临着人为因素和载体本身因素两方面风险。人为因素通过加强管理基本是可控的,而载体本身因素比较复杂,除了不同介质由于本身形成原理机制、物理特性造成保存难题外,关键是目前这些载体研发与制造的核心技术被国外厂商所控制。
载体本身存在以下问题:载体的寿命大大短于数字档案的生命周期,磁盘、光盘、磁带的平均寿命分别为3~5年、1020年、30~50年,这就需要投入巨大的人力、资金定期进行数据迁移;存储载体的损坏不易被发现,从外表无法确定载体是否存在问题,只能使用IT设备来检验;数字档案所依赖的计算机软、硬件技术更新快,这导致数字档案即使保存完整,若干年后,很可能找不到可用系统来读取;随着数字档案资源建设的推进,电子文件数量激增,需要更多形式和数量的存储设备。

目前在用的数字档案存储介质和设备国产品牌较少,其核心技术均为国外垄断。蓝光光盘和磁带的相关组织和标准,也由国外行业牵头成立与制定。面对“卡脖子”威胁和可能出现的信息技术全方位危机,为确保数字档案的长期安全保存,有关部门需要早日采取应对措施。
2020年中央经济工作会议明确要求,针对产业薄弱环节,实施好关键核心技术攻关工程,尽快解决一批“卡脖子”问题,在产业优势领域精耕细作,搞出更多独门绝技。因此,我们应尽快规划自主可控的信息技术研究,同国内对电子文件存储有迫切需求的行业合作。统一组织全国档案数字资源存储介质科研攻关工作,同时完善档案存储设备的检测标准、介质选择标准,为档案部门合理选择、使用电子档案存储介质提供依据。
|