你知道自己的生物学年龄和各个器官的专属年龄吗?近日,清华大学万科公共卫生与健康学院底骞副教授及其团队在国际期刊《自然·医学》上发表了一项令人瞩目的研究成果,提出了一种基于大语言模型(LLM)的衰老评估框架。
衰老是导致许多慢性疾病和死亡的主要风险因素之一,如能准确且便捷地评估人体的衰老程度,将有助于提前发现健康隐患并预防衰老相关疾病。然而,一个人的实际年龄往往无法充分反应人体的生物学年龄和衰老情况。衰老是一个复杂且多维度的过程,在身体、器官、分子等层面表现出显著的异质性,受到环境和遗传等多种因素的影响。
目前常用的衰老评估工具,如衰弱指数和衰老时钟,存在诸多局限。例如,监督式模型依赖于将日历年龄作为标签,可能削弱对实际生物衰老信息的捕捉能力。这些工具与不良健康结局的关联性较弱,往往只能捕捉衰老的特定方面。此外,它们的泛化性不足,难以在不同人群中广泛应用。还有一些工具,如表观遗传时钟,依赖于甲基化检测,成本高昂,不适用于大规模筛查。
本次清华大学研究团队提出的框架仅通过常规体检报告,就能精准预测一个人的整体生物年龄及器官特异性衰老程度,为健康管理带来了新的突破。
精准评估,AI成“健康侦探”
研究团队将参与者的常规健康指标转化为文本报告,输入到8个大语言模型中。这些模型会综合分析上百项指标,评估个体的整体生物学年龄以及心脏、肝脏、肺、肾脏、代谢系统和骨骼肌肉六大器官的专属年龄。这些大语言模型并非依赖预设公式,而是基于预训练的医学知识库,类似于“阅读”了海量医学文献后,结合个人健康细节进行智能推演。
该研究整合了全球六大数据库,对超过1000万人的数据进行验证。结果显示,在全因死亡率方面,大语言模型预测的整体年龄的一致性指数达75.7%,显著优于端粒长度、衰弱指数、8种表观遗传年龄以及4种机器学习模型的预测结果;在预测冠心病风险方面,其准确率为70.9%,比其他机器学习模型高出8%;在预测肝硬化风险方面,其准确率达到了81.2%,也表现出更优的预测性能。
从预警到干预的全链条应用
这项研究的临床价值不仅在于精准评估衰老,更在于其从疾病预警到干预的全链条应用能力。首先,研究对46万人进行了追踪,发现大语言模型预测的年龄差(预测年龄与实际年龄的差值)每增加1岁,全因死亡风险上升5.5%。心血管年龄差每增大1单位,冠心病的风险比(HR)为1.045,这为疾病预警提供了有力支持。
同时,研究还发现了新型“衰老加速器”,识别出多个与加速衰老相关的新型蛋白质组生物标志物,锁定了322个关键蛋白,其中56.7%为未被报道的新蛋白,55%与死亡率显著相关。例如,携带特定蛋白组合IGFBP4的人群,死亡风险比普通人高出68%。这些发现为疾病的早期干预提供了新的靶点。
此外,大语言模型还具备动态评估能力。通过整合历史健康数据,可以有效提升预测的准确率。输入连续3年的体检数据,大语言模型能够生成个性化的衰老速率曲线,其准确率比单次体检提升了3倍。
基于这些成果,研究团队进一步开发了针对270种疾病的患病风险预测模型,为大规模人群的衰老评估和健康管理提供了一种精准且低成本的新方法。