
由斯坦福医学院(Stanford Medicine)研究人员及其同事开发的一种新型人工智能模型,可以通过一夜睡眠的生理记录,预测一个人患上 100 多种健康状况的风险。这个名为 SleepFM 的模型是在从 65,000 名参与者中收集的近 60 万小时睡眠数据的基础上训练而成的。
睡眠数据来自多导睡眠图(polysomnography),这是一种综合睡眠评估,使用各种传感器记录大脑活动、心脏活动、呼吸信号、腿部运动、眼球运动等。多导睡眠图是实验室过夜监测患者睡眠研究的“金标准”。研究人员意识到,它同时也是一个尚未被开发的生理数据“金矿”。“我们在研究睡眠时记录了惊人数量的信号,”睡眠医学教授、该研究的共同资深作者 Emmanuel Mignot 医学博士说。“当被试者完全处于受控的 8 小时睡眠中时,我们研究的是一种通用生理学。它的数据非常丰富。”
目前在睡眠研究和睡眠医学中,仅使用了这些数据的一小部分。随着人工智能的发展,现在有可能理解其中更多的信息。这项新研究是首次使用 AI 分析如此大规模的睡眠数据。“从 AI 的角度来看,睡眠相对未被充分研究。有很多 AI 工作在研究病理学或心脏病学,但研究睡眠的相对较少,尽管睡眠是生活中如此重要的一部分,”生物医学数据科学副教授 James Zou 博士说。
学习睡眠的“语言”为了利用睡眠数据宝库,研究人员构建了一个基石模型(foundation model)——这是一种可以通过海量数据进行自我训练,并将其学到的知识应用于广泛任务的 AI 模型。
像 ChatGPT 这样基于海量文本训练的大语言模型就是基石模型的例子。SleepFM 训练所用的 58.5 万小时多导睡眠图数据来自在各睡眠诊所进行过评估的患者。睡眠数据被切分为 5 秒长的片段,类似于大语言模型训练时使用的单词。“SleepFM 本质上是在学习睡眠的语言,”Zou 博士说。
该模型能够整合多种数据流——例如脑电图、心电图、肌电图、脉搏读取和呼吸气流——并推断它们之间的相互关系。为了实现这一目标,研究人员开发了一种新的训练技术,称为“留一对比学习”(leave-one-out contrastive learning),它本质上是隐藏一种数据模态,并挑战模型根据其他信号重建缺失的部分。
“我们在工作中取得的技术进展之一,是弄清楚了如何协调所有这些不同的数据模态,使它们能够融合在一起学习同一种语言,”Zou 博士说。预测疾病在训练阶段结束后,研究人员可以针对不同的任务对模型进行微调。
首先,他们在标准的睡眠分析任务上测试了模型,例如对不同的睡眠阶段进行分类和诊断睡眠呼吸暂停的严重程度。SleepFM 的表现与目前使用的最先进模型相当甚至更好。然后,研究人员挑战了一个更宏大的目标:从睡眠数据中预测未来疾病的发生。为了确定哪些病症可以被预测,他们需要将训练用的多导睡眠图数据与同一参与者的长期健康结果配对。
幸运的是,他们获得了某睡眠诊所长达半个多世纪的健康记录。斯坦福睡眠医学中心由被广泛认为“睡眠医学之父”的已故医学博士 William Dement 于 1970 年创立。用于训练 SleepFM 的最大规模患者队列(约 3.5 万名患者,年龄从 2 岁到 96 岁不等)在 1999 年至 2024 年期间在该诊所记录了多导睡眠图数据。
研究人员将这些患者的睡眠数据与其电子健康记录配对,部分患者提供了长达 25 年的随访数据。SleepFM 分析了健康记录中的 1000 多个疾病类别,发现有 130 种疾病可以通过患者的睡眠数据进行较为准确的预测。该模型在预测癌症、妊娠并发症、循环系统疾病和精神障碍方面的表现尤为出色,其 C指数(C-index,一致性指数) 高于 0.8。
C指数是衡量模型预测性能的常用指标,指其预测一组人中任意两人谁会先发生某事件的能力。“对于所有可能的个人对,模型会给出谁更有可能更早发生某种事件(例如心脏病发作)的排名。
0.8 的 C指数意味着在 80% 的情况下,模型的预测与实际发生的情况是一致的,”Zou 博士解释道。
SleepFM 在预测以下疾病方面表现卓越:帕金森病(C指数 0.89)、痴呆症(0.85)、高血压性心脏病(0.84)、心脏病发作(0.81)、前列腺癌(0.89)、乳腺癌(0.87)和死亡风险(0.84)。“令我们惊喜的是,对于如此多样化的一系列病症,该模型能够做出极具参考价值的预测,”Zou 博士说。
他补充道,准确度较低的模型(C指数在 0.7 左右)在临床环境中已被证明是有用的。解释模型团队正在研究进一步改进 SleepFM 预测的方法,例如加入来自可穿戴设备的数据,并试图理解模型解释的具体内容。“它不会用英语向我们解释,”Zou 博士说。
“但我们开发了不同的解释技术,以弄清模型在进行特定疾病预测时关注的是什么。”研究人员注意到,虽然心脏信号在心脏病预测中更为突出,大脑信号在心理健康预测中更为突出,但正是所有数据模态的结合才实现了最准确的预测。
“我们获得信息最多的方式是对比不同的频道,”Mignot 教授说。身体各组成部分表现出的“不同步”——例如,大脑看起来在睡觉,但心脏看起来是清醒的——似乎预示着麻烦。
机构小课堂:这项研究是一个典型的多学科交叉(Interdisciplinary)项目,结合了最前沿的计算机科学、生物医学工程和人类生理学。如果你想在斯坦福大学读本科,以下专业(Majors)与这项研究最为相关:
1. 计算机科学 (Computer Science, CS)
这是最直接相关的专业。SleepFM 模型的核心架构(基石模型、对比学习、Transformer)完全属于 AI 和机器学习领域。
相关方向 (Tracks):人工智能 (Artificial Intelligence)或生物计算 (Biocomputation)方向。在该研究中,如何处理 60 万小时的大规模数据并进行模型训练,是 CS 专业的核心课题。
2. 生物工程 (Bioengineering, BioE)
生物工程处于工程学和医学的交汇点。
该研究处理的是多导睡眠图(PSG)信号,涉及各种传感器(EEG, ECG, 呼吸传感器等)。生物工程专业的学生学习如何获取、处理和解释这些生物生理信号,并将工程手段应用于临床诊断。
3. 生物医学计算 (Biomedical Computation, BMC)
这是斯坦福一个非常独特的跨学科专业。
它的设计初衷就是为了连接计算机科学与生物医学。该专业的学生会同时学习高级编程、算法以及深度的人体生理学知识。这项研究中的共同资深作者 James Zou 教授就来自生物医学数据科学系。
4. 符号系统 (Symbolic Systems, SymSys)
这是斯坦福名气极大的交叉学科,曾培养出许多科技大佬。
该专业结合了计算机科学、心理学、语言学和哲学。SleepFM 研究的一个核心理念是“学习睡眠的语言” (Learning the language of sleep),这种将非语言信号转化为语言序列的处理逻辑,与符号系统专业探讨的“信息表达与智能”高度契合。
5. 人类生物学 (Human Biology, HumBio)
这是斯坦福最受本科生(尤其是预科医生)欢迎的专业之一。
该研究不仅仅是关于 AI,更关乎疾病的预测(如帕金森、癌症等)。HumBio 专业的学生专注于人体生理、病理以及健康风险评估,他们能提供模型背后的医学逻辑——为什么某种睡眠模式预示着某种疾病。
6. 数学与计算科学 (Mathematical and Computational Science, MCS)
研究中提到的C-index(一致性指数)和复杂的概率模型属于高级统计学和计算数学。对于需要处理 500 万样本量、进行风险评估的研究来说,深厚的数学建模能力是基础。
7. 数据科学与社会系统 (Data Science & Social Systems)
这是斯坦福较新的专业。
侧重于如何利用大规模数据解决实际问题。该研究利用 25 年的随访数据(电子健康记录)与睡眠数据进行配对,涉及大规模社会/医疗数据的清洗、匹配和分析。

