IT之家 1 月 6 日消息,一晚的睡眠状态中,或许潜藏着能提前数年预测重大疾病发生的线索。
![]()
糟糕的睡眠质量通常会导致次日昏沉困倦,但它也可能在严重健康问题显现前数年就发出预警信号。斯坦福大学医学院的研究人员开发出一套全新的人工智能系统,该系统能够通过分析单晚睡眠产生的详细人体信号,评估一个人患上百余种不同疾病的风险概率。
据IT之家了解,这套名为 SleepFM 的系统,其训练数据源自约 6.5 万人的近 60 万小时睡眠监测记录。这些记录均来自多导睡眠监测技术 —— 这是一种深度睡眠检测手段,会通过传感器整夜追踪受试者的脑电波活动、心律变化、呼吸模式、眼球运动、腿部动作以及其他多项生理信号。
睡眠研究:潜藏的海量数据宝库
多导睡眠监测技术被公认为研究睡眠机制最可靠的方法,通常需在专业实验室中进行整夜监测。研究人员发现,除了用于诊断睡眠障碍外,这类监测还能捕捉到人体在数小时连续状态下的大量机能运转信息。
“我们在开展睡眠研究时,会记录数量惊人的生理信号。”医学博士、哲学博士埃马纽埃尔・米格诺特表示。他是克雷格・雷诺兹睡眠医学讲席教授,同时也是这项新研究的共同资深作者。该研究成果于今日(1 月 6 日)发表在《自然 - 医学》期刊上。“这相当于让受试者在完全受控的状态下,接受长达 8 小时的全身生理机能检测。其数据量极为庞大,而传统睡眠研究仅聚焦于其中一小部分信号,绝大部分数据的价值尚未被挖掘。人工智能技术的进步,首次让全面分析这些完整数据流成为可能。研究人员指出,这是全球首例如此大规模地将人工智能应用于睡眠数据的研究。”
“从人工智能的研究视角来看,睡眠领域的探索相对匮乏。目前已有大量人工智能研究投入到病理学、心脏病学等领域,但尽管睡眠是人类生命中至关重要的一环,针对它的人工智能研究却寥寥无几。”生物医学数据科学副教授、该研究共同资深作者邹嘉彦(James Zou,音译)博士说道。
训练人工智能“读懂”睡眠信号
为了挖掘这些数据的潜在价值,研究团队构建了一个基础模型 —— 这是一种能从海量数据集中学习通用规律,并适配多种不同任务的人工智能类型。以 ChatGPT 为代表的大型语言模型,采用的正是与之相同的技术原理,区别仅在于后者的训练对象是文本数据,而非人体生理信号。
SleepFM 的训练数据,是从多家睡眠诊所患者处采集的 58.5 万小时多导睡眠监测数据。研究人员将每段监测记录切分为 5 秒的片段,这种处理方式与用词汇训练语言模型的思路十分相似。
“SleepFM 本质上是在学习‘睡眠的语言’。”邹嘉彦解释道。
该模型可同时分析多维度数据流,包括脑电波、心脏信号、肌肉活动、脉搏数据以及呼吸气流,并从中学习这些信号之间的联动规律。为实现这一目标,研究人员设计了一种全新的训练方法,名为留一法对比学习。这种方法会暂时剔除某一类信号,然后让模型仅依靠剩余的其他信号,尝试还原被剔除的信号数据。
“我们在这项研究中取得的一项技术突破,是找到了整合这些不同类型数据模态的方法,让它们能够协同作用,共同‘解读’睡眠的语言。”邹嘉彦说。
从睡眠模式到疾病风险预测
模型训练完成后,研究人员首先在一些常见的睡眠相关任务中对 SleepFM 进行了测试。结果显示,该模型在睡眠阶段划分和睡眠呼吸暂停严重程度评估方面的表现,达到甚至超越了目前临床应用的主流检测系统。
随后,研究团队开展了一项更具挑战性的测试:仅依靠睡眠数据,预测受试者未来可能患上的疾病。为实现这一目标,他们将睡眠监测记录与对应患者的长期病历数据进行了关联匹配。其中一家合作诊所提供了长达数十年的患者记录,这为研究长期健康预后提供了难得的宝贵数据。
斯坦福睡眠医学中心由已故的威廉・迪蒙特医学博士、哲学博士于 1970 年创立,迪蒙特被誉为“睡眠医学之父”。用于训练 SleepFM(SleepFM)的最大患者群体包含约 3.5 万名受试者,年龄跨度从 2 岁到 96 岁不等。他们的睡眠监测数据采集于 1999 年至 2024 年间,并与部分患者长达 25 年的电子健康档案进行了匹配。
借助这套整合后的数据集,SleepFM 对超过 1000 种疾病类别进行了分析,最终识别出 130 种仅通过睡眠数据就能实现较高准确率预测的疾病。其中,对癌症、妊娠并发症、循环系统疾病和精神疾病的预测效果最为显著,预测性能指标一致性指数(C-index)均超过 0.8。
预测准确率的衡量标准
一致性指数(C-index)用于衡量模型对个体患病风险的排序能力,具体体现为模型能否准确预测两名受试者中哪一位会更早出现特定健康问题。
“对于任意两名受试者的组合,该模型都能对谁会更早患上某种疾病(例如心脏病发作)进行风险排序。一致性指数达到 0.8,意味着该模型的预测结果与实际情况的吻合度高达 80%。”邹嘉彦解释道。
在针对具体疾病的预测中,SleepFM 表现尤为突出:帕金森病(一致性指数 0.89)、痴呆症(0.85)、高血压性心脏病(0.84)、心脏病发作(0.81)、前列腺癌(0.89)、乳腺癌(0.87)以及全因死亡风险(0.84)。
“令我们惊喜的是,该模型针对多种不同类型的疾病,都能做出具有参考价值的预测。”邹嘉彦表示。
他还补充说,目前临床上已经在使用一些预测准确率相对更低的模型 —— 其一致性指数通常在 0.7 左右,例如用于预测患者对特定癌症治疗方案反应的系统。
解读预测背后的逻辑
目前,研究团队正致力于进一步提升 SleepFM 的预测准确率,并深入探究模型做出疾病预测的内在机制。未来的模型版本可能会整合可穿戴设备采集的数据,以获取更多关于受试者日常生活习惯与睡眠模式的信息。
“模型并不会用人类语言向我们解释它的预测逻辑。”邹嘉彦说,“但我们已经开发出多种解读技术,能够探究模型在针对某种特定疾病做出预测时,究竟参考了哪些关键信号。”
研究人员发现,尽管心脏相关信号在心血管疾病预测中发挥了更大作用,脑电波信号对精神疾病预测的影响更为显著,但单一信号的作用始终有限。只有整合所有数据源,才能实现最高的预测准确率。
“通过对比不同监测通道的数据,我们才能获取预测疾病的最关键信息。”米格诺特表示。当人体不同系统的信号出现“不同步”状态时 —— 例如大脑呈现睡眠状态,而心脏却处于类似清醒时的活跃状态 —— 往往预示着健康风险。




京公网安备 11011402013531号