OpenAI 联手长寿生物科技公司 Retro Biosciences 研发了一个专门用于蛋白质工程的模型------GPT‑4b micro,用来设计全新的蛋白质,结果直接让一项诺奖级的细胞再生技术效率飙升了整整 50倍
简单来说,就是把人体内的普通细胞,比如皮肤细胞,变回功能强大的万能干细胞,这个过程被称为细胞重编程
而现在,AI 不仅让这个过程变得前所未有的高效,设计出的新蛋白质甚至还附带了更强的 DNA 损伤修复 功能,堪称物理意义上的返老还童,更重要的是,这些结果在多个供体、细胞类型和不同递送方式中都得到了验证
一个诺奖级的超级难题
故事还要从山中伸弥的诺贝尔奖说起。
他发现,只要用四种特殊的蛋白质,也就是山中因子,就能像施展魔法一样,把一个已经分化成熟的成年细胞,逆转回 pluripotent(多能性) 状态,也就是啥都能变的诱导多能干细胞 iPSC。
这项技术的前景无比广阔,治疗失明、逆转糖尿病、甚至培养新器官,iPS细胞几乎可以无限增殖,能用来培养包括神经、肌肉、骨骼等人类所有的器官和皮肤等的细胞,为再生医疗开辟了全新道路
但这个成功率低得令人发指,通常不到 0.1%,而且过程极其漫长,动辄三四周。对于来自老年人或病人的细胞,成功率更是惨不忍睹
几十年来,全世界的科学家都在想办法优化这个过程,但进展缓慢。
OpenAI 的研究人员没有走传统的老路,而是直接训练了一个全新的模型:GPT-4b micro
你可以把它理解成一个生物学博士版本的 GPT-4,它的训练数据不仅有海量的生物学文献,更核心的是无数的蛋白质序列和三维结构数据
它学会了蛋白质世界的语言
更关键的是,这个模型特别擅长处理那些没有固定形状、非常灵活的蛋白质,比如这次的主角山中因子。
科学家们要做的,就是给 GPT-4b micro 下达指令:
给我设计一些新的 SOX2 和 KLF4 蛋白质,目标是最大化细胞重编程的效率。
在传统的筛选方法中,科学家手动修改蛋白质,命中率通常低于 10%
而 GPT-4b micro 设计的第一批蛋白质 RetroSOX,命中率直接超过 30%。要知道,AI 设计的蛋白质序列和原始版本平均有超过 100 个氨基酸的差异,这完全是重新创作,而不是小修小补
接下来挑战更难的 KLF4 蛋白。这次,AI 设计的 RetroKLF 命中率更是飙升到接近 50%。
当研究人员把 AI 设计的最优蛋白质组合在一起使用时,奇迹发生了
仅仅 10 天,实验皿中就出现了大量表达成熟干细胞标记物的细胞集落。而在同样的时间点,使用传统方法的对照组里,几乎什么都看不到
如果说效率提升是意料之中,那接下来的发现就是意外之喜了。
团队发现,经过 AI 设计的蛋白质组合处理过的细胞,其 DNA 损伤水平显著降低
DNA 损伤,是衡量细胞衰老的核心指标之一。这意味着,AI 设计的这套方案,不仅能让细胞的身份重置,还能在重置过程中,顺手修复掉许多岁月留下的痕迹。
这为未来开发更高效、更安全的细胞疗法和抗衰老技术,打开了全新的想象空间。
正如 OpenAI 研究合作负责人 Boris Power 所说:
当研究人员将深厚的领域洞察力带给我们的语言模型工具时,那些曾经需要耗费数年时间的问题,现在可能在几天内就能发生转变。
AI 加生命科学的奇点,或许比我们想象的来得更快
参考:
https://openai.com/index/accelerating-life-sciences-research-with-retro-biosciences/