当前位置: 首页 » 资讯 » 新科技 » 正文

95后科学家开发抗衰大模型,揭示数千种可逆转生物年龄的干预措施

IP属地 中国·北京 DeepTech深科技 时间:2025-11-26 18:14:38

如果有一天,AI 不仅能写代码、做分析,还能从过去几十年的真实生物实验中主动找出能让身体“变年轻”的方法,会是怎样的景象?

我们身体里有一个“时钟”,随着年龄的增长,这个时钟会记录我们身体的衰老程度。科学家们发现,通过分析大量的生物数据,能够找到相关方法来“调慢”甚至让这个时钟“倒退”,以实现延缓衰老。

近期,一支来自美国哈佛大学和美国斯坦福大学等联合团队真的做到了——他们集成 40 余种衰老时钟模型开发了一个名为 Clockbase Agent 的平台,让 AI 在 200 万份人类和小鼠的分子组学数据里“挖宝”,并找出了超过 500 种可能让生物年龄倒退的干预措施。

“这是首次从生物衰老线索的角度,系统性分析过去数十年产生的海量分子组学数据,意味着我们的平台能够重新利用已有的真实动物实验数据,帮助药企和医学研究领域节省在细胞实验上的数十亿美元研究投入和数百万样本,进而加速推动整个流程。”应可钧对 DeepTech 表示。

他是美国哈佛大学博士毕业生,目前在斯坦福大学托尼·维斯-科雷(Tony Wyss-Coray)实验室和美国华盛顿大学大卫·贝克(David Baker)实验室担任博士后研究员,也是这项研究的第一作者兼共同通讯作者。


图丨应可钧(应可钧)

值得关注的是,基于该平台新发现了一种抗衰老化合物 Ouabain,为开发延长健康寿命的干预策略奠定了基础。实验结果显示,Ouabain 显著延缓了老年小鼠的虚弱进程,不仅改善了其心脏功能还减轻了神经炎症。


(bioRxiv)

Clockbase Agent 的意义不仅限于衰老研究:

首先,这一研究范式改变了以往依赖预设假说和手动分析的模式,将过去数十年积累、原本用于其他研究目标的海量分子数据,转变为一个强大的衰老干预措施“发现引擎”。并且,显著降低了衰老生物标志物分析的门槛,使全球研究者均可基于数百万样本快速验证假设,极大提高了科学数据的再利用价值。

其次,该方法具有可迁移性,可将系统中的衰老时钟换成任何分子层面的生物标志物,从而以极低成本发现能够影响疾病相关分子指标的干预措施,例如癌症、免疫学、神经科学和代谢疾病等。

从“手动挖掘”到“自主智能”的范式革命

衰老是慢性疾病和死亡的首要风险因素,但长期以来,系统性识别能够改变衰老轨迹的干预措施面临挑战。过去几十年,尽管该领域积累了海量分子数据,但最大的局限性在于,相关研究的时间和研发成本都非常高,因此衰老相关论文多数是在小范围内,由领域专家挖掘过去某个细分方向的数据集。


图丨 Clockbase Agent 平台架构与工作流(bioRxiv)

Clockbase Agent 平台能够自主生成解析数据和假说、执行统计分析、进行文献综述,并自动生成科学报告,为研究人员提供有潜力且可靠的衰老干预措施。在严格专家验证下,分析准确率达 99%。

其主要由以下三个核心 Agent 构成:

·Coding Agent:主要功能是写代码。通过代码探索数据的分布来理解数据,进而设计并提供统计分析结果。

·Reviewer Agent:从样本量、实验模式生物、整个实验的设置等多个维度对实验质量进行评估,并基于对衰老模型的适用程度给实验打分。

·Report Agent:通过整合 Coding Agent 和 Reviewer Agent 的结果,生成人类可读性高的科学报告。

与此同时,研究团队还整理了一个包含近年来数千篇衰老领域的论文数据集,构建了迄今为止最全面的生物年龄图谱。并且,Reviewer Agent 和 Coding Agent 可随时访问该数据集,来寻找支撑相关理论或判断的参考文献。


图丨基于人类与小鼠分子特征的综合生物年龄图谱(bioRxiv)

尽管目前已有不少 AI 驱动药物发现方面的研究,但一个不容忽视的问题是:其通常基于药物与靶点的相互作用,在强假设基础上构建数学模型,来预测可能具有抗衰老作用的药物。

而这项研究与传统范式最大的区别是,研究人员使用的数据大部分来自体内(in vivo)小鼠实验。这意味着该平台的筛选结果基于真实的实验数据,即有科学家将相关药物用于小鼠实验,具有真实的测试效果和分子数据。

应可钧进一步说道:“我们发现,通过这些分子数据预测样本的衰老药物确实能够减少动物的衰老状态或生物学年龄。所以,我们的结果相对于纯计算和仅靠 AI 推导出来的结果更可靠。”


图丨AI 智能体操作工作流与多维评分系统(bioRxiv)

Clockbase Agent 平台分析了来自 13,211 项小鼠 RNA 测序研究的 43,529 份干预对照比较,涵盖了遗传扰动、药物治疗、环境暴露和疾病模型等多种类型。为了验证 AI 发现的可靠性,研究团队还将高置信度的干预措施与权威的长寿基因和药物数据库进行比对。

结果显示,在匹配的条目中,方向一致性具有统计学显著性,进一步证实了 AI 智能体分析结果的生物学合理性。该平台综合筛选出有潜力的衰老候选药物包括:Ouabain、KMO 抑制剂、降脂药非诺贝特等。

突破数据孤岛:AI 智能体如何攻克实验数据理解难题

该研究的合作单位超过 20 家,包括斯坦福大学、哈佛大学、华盛顿大学等高校,以及基因泰克和英矽智能等公司。该研究始于 2022 年,研究团队旨在将人类收集到的海量组学数据,都用衰老的形式进行分析。

彼时,大语言模型开始逐渐爆发,他们在研究初期最大的瓶颈是来自不同实验室的数据。最初使用的是传统生物信息学的方式,但在实际操作过程中,由于实验设计的复杂性,研究人员很快发现,依靠自然语言处理方法很难精准识别对照组和实验组的相关样本。

甚至有些情况下,如果实验中使用的小鼠都是同年龄或同性别,这些信息可能根本不会标注在数据文件里,而是直接放在论文或摘要中。如果 AI 不能阅读或理解实验设计,就无法提取这些信息。


(bioRxiv)

研究团队也尝试过用大模型来标准化这些数据,但由于数据量过多很容易超出大模型的上下文容量。直到 2024 年,研究人员意识到可以用 AI 智能体来做这项研究。其优势在于,它像人类科学家一样能够通过交互式的方式探索数据。比如,AI 智能体会先查看数据的前几列,根据初步结果判断数据的结构,然后再编写代码去验证它对数据的假设是否正确,再继续分析。

最终,相关论文以《自主 AI 智能体从数百万分子档案中发现抗衰老干预措施》(Autonomous AI Agents Discover Aging Interventions from Millions of Molecular Profiles)为题发表在预印本网站 bioRxiv[1]。据悉,所有数据与分析结果已在 www.clockbase.org 公开。

斯坦福大学博士后研究员应可钧是第一作者兼共同通讯作者,哈佛医学院亚历山大・泰什科夫斯基(Alexander Tyshkovskiy)博士、加拿大麦吉尔大学博士生阿利别克・莫尔达科扎耶夫(Alibek Moldakozhayev)以及斯坦福大学和基因泰克公司博士后研究员王瀚宸是共同第一作者,布莱根妇女医院与哈佛医学院瓦迪姆·N·格拉迪舍夫(Vadim N. Gladyshev)教授担任共同通讯作者。


图丨相关论文(bioRxiv)

“AI 智能体+多组学数据”的范式不仅为筛选衰老药物提供了一种快速、可靠且无偏见的手段,还为传统假设驱动的研究提供了良好的补充方案。通过这种全面的、基于数据的筛选,有望在不同领域的孤岛之间架起一座桥梁,进而发现更多隐藏在整个科学历史数据中的“珠宝”——那些通常被遗漏的、非传统已知却很有潜在价值的抗衰药物。

在未来的研究阶段中,研究团队希望继续筛选出排名前 50 的潜在抗衰老药物。无论是遗传学还是药理学的干预措施,他们都计划通过在实验中重复验证,来确认其中真正可逆转衰老的药物。

此外,他们将平台筛选的药物与美国食品药品监督管理局(FDA)批准药物进行重叠分析,并发现筛选出的抗衰老药物中,有一部分已获得 FDA 批准。“如果这些药物在动物实验中重复验证有效,它们有望作为一种适合某种适应症的、逆转衰老的药物被使用。”应可钧表示。

95 后科学家的下一步:用蛋白质设计“重写”衰老密码

应可钧是一名 95 后,他本科毕业于中山大学,硕士和博士均毕业于哈佛大学,博士导师为瓦迪姆·格拉迪舍夫(Vadim Gladyshev)教授。目前他在斯坦福托尼·维斯-科雷(Tony Wyss-Coray)实验室和华盛顿大学大卫·贝克(David Baker)实验室从事博士后研究工作。

他的研究融合了衰老生物学和蛋白质设计,旨在解决神经退行性疾病,重点关注衰老的原因、表观遗传学、代谢和多组学。


图丨应可钧与导师大卫·贝克(David Baker)教授(应可钧)

据应可钧透露,他在本科期间就确定了衰老的研究方向,并去了七八个不同的实验室学习和体验。他发现,每个实验室都在做衰老的某个细分方向,并且他们都有一个非常强的假设——某个通路或小分子至关重要。

“去过不同的实验室了解和体验后,我有一个初步的想法:衰老可能是一个系统性的问题,它可能不是某个通路或某个生物学现象主导的机制。”应可钧说。后来他与博士导师瓦迪姆·格拉迪舍夫教授交流时,二人的想法“不谋而合”,他们都认为衰老是随着年龄产生的各种损伤累积的体现。

博士期间,他与所在团队以封面论文的形式在 Nature Aging 报道了首个基于因果推断的衰老时钟 [3]。此外,他还开发了首批 DNA 甲基化组基础模型之一 MethylGPT[4]。


图丨 Nature Aging 当期封面(Nature Aging)

随着研究的深入,应可钧意识到现阶段衰老领域的主要问题并不是没有更好的筛选手段,而是没有更好的干预措施。“无论是药物干预还是基因干预,干预尺度都太小了。它们要么只针对一个通路,要么只针对一个基因,很难对系统性的衰老症状进行全面干预。”他说。

跨物种的相关研究为应可钧带来很大启发:到目前为止,科学家还没有找到任何干预措施能够超过小鼠 20% 的寿命提升,但自然界却可以非常轻松地实现 100 倍以上的寿命差异。

因此,最大的差异在于它们的基因调控和蛋白本身的序列。现在,人们已经可以通过基因疗法过表达/敲除基因,或用药物降低或升高蛋白的活性来解决基因调控相关问题,但是对蛋白序列本身的优化还极为有限。

应可钧认为,要解决衰老这种复杂的生物学问题需要突破基因疗法的单一维度。“更根本的方式可能是重新设计或部分重新设计这些蛋白,让它们不仅能调控已有蛋白质的功能,还能实现新的生物学功能或整合新的生物学通路,以更好地支持更长的寿命或干预其他疾病。”

基于此,他正在利用机器学习和蛋白质设计开发下一代疗法。据了解,应可钧正在寻找教职工作,并计划在 2026 年成为独立 PI,继续该方向的深入研究。

参考资料:

1.https://www.biorxiv.org/content/10.1101/2023.02.28.530532v2

2.Clockbase Agent 平台 www.clockbase.org

3.https://www.nature.com/articles/s43587-023-00557-0

4.https://www.biorxiv.org/content/10.1101/2024.10.30.621013v2

运营/排版:何晨龙

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新