Garmin Health 发布睡眠研究结果

Garmin 发布了‌进阶睡眠监测‌功能,这是一项增强型功能,可更准确地识别各睡眠阶段。该功能基于临床设备生成的“真实数据”开发,是 Garmin Health 在堪萨斯大学医学中心(KUMC)睡眠医学诊所主任 Suzanne Stevens 博士监督下开展的睡眠研究成果。Stevens 博士拥有美国精神病学与神经病学委员会及美国睡眠医学委员会认证。 

Stevens 博士曾经在美国神经病学学会年会上展示了该研究的详细内容。海报展示涵盖了研究设计、结果及结论:‌支持进阶睡眠监测的 Garmin 可穿戴设备,是一种估算睡眠阶段的有效方法‌。对消费者而言,这为了解自身睡眠卫生及其对整体健康的影响提供了宝贵洞察;对研究人员来说,结果表明 Garmin 睡眠追踪可穿戴设备可能适用于以监测参与者活动与睡眠模式为目标的纵向研究。 

类似研究不同,Garmin Health 与 KUMC 的研究在睡眠诊所之外、典型用户的实际生活环境中进行。研究参与者在自家床上使用临床参考设备,提供了代表其正常睡眠模式的数据。仅排除了使用 CPAP 呼吸机或手腕有纹身的参与者,这意味着数据收集自具有各种已知或未知睡眠状况的参与者,这与消费级可穿戴设备用户的普遍情况一致。 

在研究之外,团队通过 Beta 测试期间在生产环境中收集的 ‌3,200 个睡眠夜晚数据‌,将算法性能与按年龄组划分的睡眠阶段平均分布的临床参考数据进行了交叉验证。结果符合预期,包括深度睡眠和总睡眠时长随年龄增长而减少的趋势。 

Garmin Health 提供企业解决方案,利用 Garmin 可穿戴设备及其产生的高质量传感器数据,应用于企业健康、人群健康和患者监测市场。请联系我们以获取更多信息,了解如何构建您自己的创新体验或研究项目。 

(以下为报告部分内容译文) 

商用可穿戴设备提供有效的睡眠阶段估算‌ 

引言‌ 

过去几年,能够测量步数、活动、心率和其他生物特征数据的智能可穿戴设备呈现爆炸式增长。多年来,活动记录一直是使用可穿戴设备估算睡眠阶段的黄金标准。活动记录利用加速度计信息估算用户的清醒/睡眠时段。许多可穿戴设备还通过光学光电容积描记法(PPG)测量心率和心率变异性。PPG 通过向皮肤发射光线,观察脉搏压力波通过传感器视野时毛细血管血容量变化引起的反射光强度微小变化来测量脉搏率。结合使用活动记录、心率和心率变异性,不仅能够估算清醒/睡眠,还能估算浅睡(N1 和 N2)、深睡和快速眼动睡眠阶段。 

尽管许多可穿戴设备声称能准确区分浅睡和深睡,但关于以这种方式使用可穿戴设备的有效性信息很少。Fitbit 先前的一项研究描述了一种非生产方法,使用可穿戴设备中的 PPG 和活动记录来估算健康成年人群的睡眠阶段。本研究描述了在 Garmin 某种可穿戴设备使用光学 PPG 和活动记录来估算成年人群睡眠阶段的方法和结果。 

方法‌ 

本研究招募受试者佩戴 Garmin 手表和参考设备,以评估 Garmin 手表估算睡眠阶段的准确性。确定睡眠阶段更准确的方法是使用实验室多导睡眠图(PSG),包括 EEG、EOG 和 EMG 传感器。然而,实验室 PSG 对受试者来说很麻烦,且很多时候无法获得与受试者在熟悉环境中的床上睡眠相同质量和数量的睡眠。已开发出如 Sleep Profiler 这样的家用 EEG 系统,其睡眠结构估算结果与 PSG 相当。在本研究中,Sleep Profiler 被用作参考设备,减少了研究参与者的负担,并允许在与 Garmin 可穿戴设备生产使用相同的环境中收集数据。Sleep Profiler 的准确性被认为与实验室 PSG 相当。研究中的个体接受了 Sleep Profiler 设备使用培训,并被指导在非优势手腕上佩戴 Garmin 设备。Sleep Profiler 设备记录三通道 EEG 用于睡眠分期(以及心率等其他测量)。Garmin 设备与 Sleep Profiler 同时记录数据。记录了加速度计的 x、y 和 z 通道以及宽带宽 PPG 信号。本研究仅使用绿色通道。 

通过将两台设备的内部时钟设置为相同时间,然后比较 Garmin 设备的心率输出与 Sleep Profiler 的心率输出,将数据时间对齐到一秒以内,因为这两种测量结果非常相似,高度相关,且时间对齐优于一秒。随后,由注册多导睡眠技师使用 AASM 指南 审查 Sleep Profiler 输出数据(包括自动睡眠分期输出),以提供参考睡眠阶段。评分在 30 秒时段水平进行。在本研究中,N1 和 N2 睡眠阶段合并为浅睡类别。然后对清醒、浅睡、深睡(N3)和快速眼动阶段进行评分。评分后的数据用于训练神经网络执行睡眠阶段分类。 

选择神经网络架构时考虑了其可在生产系统中实现,包括计算资源有限的可穿戴设备以及具有广泛计算资源的 Garmin 云。最终采用了两阶段方法:在可穿戴设备上进行数据预处理,将宽带宽传感器数据分割并压缩为可通过低功耗蓝牙(BLE)和 Garmin Connect Mobile 应用程序同步到 Garmin 云进行进一步处理的可管理负载。云中使用的神经网络是对 Zhao 架构的改编和简化。在设备上计算了 60 多个特征。在整个夜晚的数据上,在云端计算了另外 7 个特征。 

使用 k 折交叉验证重采样程序训练网络,k 值为 5 。在此方法中,数据随机抽样分为五个大小相等的组。网络在四个组(80%)上训练,并在剩余组(20%)上评分。训练集随机细分为训练集和验证集,用于确定何时停止训练网络。使用的停止标准是 中给出标准的变体。此过程重复五次,使得每个受试者在训练集中使用四次,在测试集中使用一次。 

结果 

招募了 55 名个体参与研究。唯一的排除标准是手腕背侧有纹身可能干扰光学心率读数。在这 55 名个体中,14 人表示有睡眠障碍或服用可能影响睡眠结构的药物。这些个体被记录在案,但其数据仍包含在研究中以代表一般人群以及部分已知或未知睡眠障碍的真实世界用户。 

在 55 名参与者中,31%(17 人)为女性,69%(38 人)为男性。年龄分布为 35.5 ± 8.7 岁,BMI 分布为 26.3 ± 6.4。 

针对此真实世界数据,算法的总体准确率为 ‌69.7%‌,检测睡眠的灵敏度为 ‌95.8%‌,检测清醒的特异性为 ‌73.4%‌(表 1)。Cohen’s kappa (k) 值为 ‌0.54 ± 0.12‌。评估这些结果时应考虑到,两名训练有素的人工评分员使用 PSG 的评分者间一致性约为 83% ,Cohen’s kappa 约为 0.78 。 

‌表 1. 可穿戴睡眠阶段分类器的灵敏度、特异性、准确率和 Cohen’s Kappa‌ 系数 

灵敏度 95.8%
特异性 73.4%
总体准确率(正确分类睡眠阶段) 69.7%
Cohen’s kappa 系数 0.54 +/- 0.12

睡眠阶段分类器的完整混淆矩阵见表 2。矩阵显示分类器预测深睡、浅睡和快速眼动睡眠阶段的准确率大致相同,约为 69%。清醒的准确率略高,为 73%。最常见的错误分类是将真实的深睡分类为浅睡,以及将真实的快速眼动睡眠分类为浅睡。 

‌表 2. 所有参与者的混淆矩阵‌ 

预测阶段\真实阶段真实深睡真实浅睡真实快速眼动真实清醒
预测深睡68.9%12.0%1.4%1.9%
预测浅睡29.1%68.6%26.4%14.9%
预测快速眼动0.9%13.7%69.8%9.7%
预测清醒1.1%5.7%2.3%73.4%

表 3 给出了所有 55 名参与者参考设备与可穿戴设备在整体睡眠结构上的比较。 

表 3. 所有参与者的睡眠结构‌ 

设备深睡比例浅睡比例快速眼动比例清醒比例
Garmin 可穿戴设备15.5%46.0%21.6%16.9%
Sleep Profiler12.7%50.7%18.3%18.3%

需要指出的是,本文描述的算法已部署到多款 Garmin 可穿戴设备的生产环境中。在可穿戴睡眠阶段分类器生产实施的 Beta 测试期间,额外分析了 ‌3,200 晚的数据‌并进行审查,以确保结果与 55 人研究的结果一致。这 3,200 晚数据没有伴随的参考设备数据 —— 仅使用了基于活动记录和光学心率的生产实施。在这个更大的队列中,使用睡眠阶段随年龄分布的规律来评估算法性能。快速眼动睡眠分布随年龄保持相对稳定,深睡随年龄显著减少,总睡眠时间通常随年龄减少 —— 符合预期 。 

‌表 1. 生产系统中按年龄组的平均睡眠时长‌ 

最后,下面展示了 55 名受试者队列中的一些代表性结果。在以下图表中,清醒表示为阶段 3,快速眼动为阶段 2,浅睡(N1 和 N2)为阶段 1,深睡为阶段 0。表 2 显示了中位数结果(按准确率排序的 55 个数据集中的第 27 个),准确率为 ‌71.5%‌。 

表 3 显示了队列中的最佳结果(55 个中的第 1 个),准确率为‌ 80.1%‌。 

图 3. 最佳结果,准确率 80.1%,Cohen’s Kappa 系数 0.70

表 4 显示了队列中的最差结果(55 个中的第 55 个),准确率为‌ 49.9%‌。请注意,该用户自我报告有睡眠障碍。 

图 4. 最差结果,准确率 49.9%,Cohen’s Kappa 系数 0.18(自我报告有睡眠障碍)

讨论‌ 

这项工作证明,仅使用活动记录和光学心率传感器的可穿戴设备可以将用户的睡眠阶段估算到接近‌ 70% 的准确率‌,Cohen’s kappa 为‌ 0.54±0.12‌,表现良好。尽管生产系统和真实世界数据收集面临更大挑战,但这与预期结果非常接近。与基于 EEG 的睡眠阶段测量设备相比,虽然未达到相同水平的准确率,但结果仍具优势,后者的评分者间准确率水平为 82%。 

使用腕戴式可穿戴设备估算睡眠阶段的主要好处是用户摩擦非常低 —— 用户只需在睡眠时将设备戴在手腕上,无需繁琐的特殊设备。使用可穿戴设备准确估算睡眠阶段,允许在设备白天保持充电的情况下,几乎无限晚地监测睡眠,为用户提供有关睡眠卫生和睡眠结构的有用数据。