编辑|冷猫
人类有一种执念,就是将我们引以为傲的文明数据永远的保留下去。从旅行者一号的金唱片开始,这一切都被附上了一层浪漫色彩。
![]()
这张金唱片以声音和图像的形式描绘地球生命。在发射时,制作人萨根博士表示:「只有在星际空间中存在先进的太空文明时,太空船才会被发现,唱片才会播放,但将这个瓶子发射到宇宙海洋中,表明了这个星球上的生命非常有希望。」
在旅行者探测器离开地球的那一刻起,就意味着这张记载人类文明信息的唱片将在宇宙中无尽地漂流,遇到另一个行星系统还有 40000 年的时间。而这张唱片的设计保存时长有十亿年。
众所周知,磁盘硬盘为主的数字存储介质虽然能够保存海量的数据,但是寿命和稳定性却不尽如人意。而用传统的模拟信号,几乎等同于将信息雕刻在物理介质上,搭载的信息又极其受限。就像这张金唱片,只能搭载少量的音频和图像信息。
有没有一种办法,能够用物理介质搭载模拟信息的办法,来保存更多的数字信息呢?
微软主导的研究项目 Project Silica 给出了一个非常出色的答案。他们将目光投向了一个全新的存储介质:玻璃。

将数据存储在玻璃上听起来很未来,很浪漫。但其实这个概念可以追溯到 19 世纪,将摄影负片保存在玻璃板上的技术。不过,在光学技术极其发达的今天,一块玻璃板已经能够存储令人惊讶的数据量。
根据微软研究团队的信息,Project Silica 已经实现了在一块120 毫米见方、2 毫米厚的玻璃中存储了301 层的数据数据密度为1.59 Gbit・mm⁻³容量达到了惊人的 4.8 TB
写入模式实现了每束光 25.6 Mbit・s⁻¹ 的写入吞吐量,受激光重复频率限制,能量效率为每比特 10.1 nJ。 此外,研究团队将存储能力扩展到硼硅酸盐玻璃,提供了一种成本更低的中介材料,并降低了写入和读取的复杂性。
对硼硅酸盐中写入的体素进行的加速老化测试表明,数据寿命超过 10,000 年
Project Silica 是第一种满足生产存储系统所有要求的基于玻璃的数据存储技术。该研究已经在 Nature 发布。
![]()
论文标题:Laser writing in glass for dense, fast and efficient archival data storage论文地址:https://www.nature.com/articles/s41586-025-10042-w
玻璃是三维的
为什么玻璃能够作为数据存储介质?
首先,现代光学技术已经能够实现十分精细的能量控制,同时玻璃具有热稳定性和化学稳定性,能够抵抗湿气侵入、温度波动和电磁干扰。并且,其熔融特性能够实现局部光学性质的改变。
和传统物理介质最大的不同在于,玻璃是三维的
相比于我们最熟悉的物理介质存储的最原始形态,也就是石碑,只能在一个表面雕刻信息,玻璃能够实现多层的数据存储,将三维空间中的体积全都利用起来。
由像素向体素的飞跃,在数据存储领域是质的变化。
![]()
系统架构示意图: a, 数据由用户接收。这些数据被准备为比特流,例如,使用压缩、加密和 FEC。b, 比特被编码为符号。一个符号对应于调制器配置。c,d, 玻璃样品被加载到写入子系统中,随着激光束相对于玻璃移动,调制器设置随时间变化。符号逐层写入,从下往上,填充玻璃的整个厚度。e, 数据可以安全地存储在玻璃中超过 10,000 年。f, 为了读取,我们使用带有相机的自动化显微镜来捕获每个体素二维层的图像。g, 图像被传递到解码器以恢复用户数据。
过去,玻璃存储依赖的是双折射体素(birefringent voxel)通过超短激光改变熔融石英内部的偏振结构,把信息编码进材料。问题在于,形成一个体素往往需要多次脉冲叠加,工艺复杂,效率受限。
微软团队首先在飞秒激光写入系统上动刀:研究者把形成体素所需的脉冲数压缩到两次,并证明第一次脉冲的偏振方向并不会决定最终体素的偏振结果。这个看似细节的发现,其实释放了巨大的工程空间。
在此基础上,他们进一步提出「伪单脉冲写入」—— 将一个已经设定好偏振的激光脉冲分裂成两束,使其同时充当一个体素的关键脉冲和另一个体素的辅助脉冲。配合光束扫描系统,写入过程从精细雕刻式的点状加工,演化为可以高速连续推进的工业级流程。玻璃存储第一次在写入效率上显露出规模化潜力。
这一方法运用于高纯石英玻璃,对材料的要求更高,成本更高。
![]()
一种用于将数据高速写入玻璃的科研级写入设备,创下了记录。
但更具突破性的,是他们提出了一种全新的存储形态:相位体素(phase voxel)
与依赖偏振变化的双折射体素不同,相位体素通过改变玻璃内部的相位结构来编码信息,而且只需单个激光脉冲即可形成。这不仅进一步简化了写入流程,还拓宽了材料边界。研究团队证明,相位体素不仅能在熔融石英中生成,也能在更常见的硼硅酸盐玻璃中实现。
同时,他们设计了新的光学读取方案,用以解析嵌入材料内部的相位信息。需要指出的是,相位体素在三维空间中会产生更强的符号间干扰,这是高密度三维存储不可避免的副作用。为此,研究者引入机器学习分类模型,对读出信号进行判别和纠错,把原本的物理串扰问题转化为可被算法消化的信号处理问题。材料科学与人工智能在这里真正发生了耦合。
![]()
一种用于从玻璃中读取数据的科研级读取设备。
当写入机制与存储形态得到革新之后,论文将重点转向规模化能力。玻璃内部在激光作用下会经历复杂的预热与后热过程,这种热场相互影响长期限制了体素的邻近写入。
研究团队构建了相应的数学模型,并在此基础上发明多光束传输系统,使多个数据体素能够在空间上相邻、时间上同步地写入,从而显著提升整体吞吐速度。更有意思的是,他们利用体素形成时产生的光发射现象,作为写入过程的实时反馈信号,实现静态校准与动态控制。这意味着系统不再只是「盲写」,而是具备自我监测与自动调节能力,向真正的自动化写入系统迈进。
利用双折射体素,在石英玻璃中,研究团队实现了 1.59 Gbit・mm⁻³ 的数据密度(每片盘的可用容量为 4.84 TB,体素间距为 0.500 μm × 0.485 μm,层间距为 6 μm,301 层,8 个方位级别,0.85 品质因数),写入吞吐量为 25.6 Mbit・s⁻¹,写入效率为每比特 10.1 nJ。
利用相位体素,在硼硅酸盐玻璃中,研究团队实现了 0.678 Gbit・mm⁻³ 的数据密度(可用容量每盘 2.02 TB,体素间距 0.5 μm × 0.7 μm,层间距 7 μm,258 层,4 个能量级别,0.92 品质因子),写入吞吐量为 18.4 Mbit・s⁻¹ ,写入效率为每比特 8.85 nJ。此外,多束系统通过四束并行写入实现了 65.9 Mbit・s⁻¹ 的吞吐量,且不会引起热损伤。
![]()
写入设备特写,展示激光脉冲的高速多束数据编码。
最后,我们把视角拉回数字存储系统本身。
研究者提出了一种基于机器学习的符号编码优化方法,用以系统性地权衡错误率、错误保护强度与恢复能力之间的关系。更关键的是,他们开发了一种新的非破坏性光学检测手段,用于识别玻璃内部体素的老化状态,并结合加速老化实验,给出了支持数据保存 10,000 年的实证依据。
封存在玻璃中的文明
「仅五千年前,我们才开始使用文字。如果你思考一下将数据存储一万年的意义,那简直是一个极其漫长的时间。」微软杰出工程师 Ant Rowstron 如此评价团队的工作。
在保存人类文明这样浪漫的事上,研究团队已经开始了他们的尝试。微软 Project Silica 团队与一家创业公司合作,将这项技术应用于他们在挪威斯瓦尔巴群岛的全球音乐宝库。
![]()
他们使用基于二氧化硅的玻璃板,创建一个耐用的档案库,不仅能够抵抗电磁脉冲和极端温度,而且相当环保。这个宝库将补充像全球种子宝库和北极世界档案馆这样的存储设施,为音乐遗产提供一个全面的庇护所 —— 从古典歌剧到现代热门歌曲和原住民作品。
Project Silica 的目标,是把数据写入一块玻璃,然后像档案一样放在架子上,直到真正需要时再取出读取。一旦写入完成,玻璃内部的数据将无法被篡改
玻璃存储技术最突出的特点之一,是极高的空间效率。如今的数据中心往往是庞大的基础设施集群,而玻璃存储所需的物理空间却只是其中的一小部分。Richard Black 表示:「我们在 Project Silica 开发的技术,可以在极其紧凑的形态中存储海量数据。这是一种全新的效率与可持续性范式。」相比需要持续供电、冷却和维护的大型存储阵列,玻璃板更像是高密度、低运维成本的长期档案介质。
目前,玻璃存储技术已经能够在一块玻璃板上存储数 TB 数据,并实现长达 10,000 年的保存时间。这在超长期存储介质中是难以想象的。
或许,用一个玻璃数据库来封装人类文明的全部精华,已经不是遥不可及的梦想。





京公网安备 11011402013531号