中科院2区｜“我要我觉得”：患者个性化数据在临床结局预测中意义凸显-新闻中心-世界生命科学大会

中科院2区｜“我要我觉得”：患者个性化数据在临床结局预测中意义凸显

世界生命科学大会 2024-07-10 14:09:25 发表于北京

中科院 2 区文献独家解读

一个预测术后恢复的模型

Field Introduction

•

✦

领域导读

✦

•

临床预测模型是医学版的“算命”。患者、医生都是模型构建者。患者自我评估越来越重要。

临床预测模型就是一种统计模型，可以是传统的统计学，也可以是人工智能（包括机器学习）。

无论哪种模型，本质是根据一系列患者特征估算某种临床结果的概率，在临床实践中可用于对疾病严重程度进行分层，并描述疾病风险或疾病预后。

除了临床和生物数据，患者自我评估相关数据已成为重要角色，也主导着一些临床预测模型（如本文）。

在缺乏优质数据的现实环境下，该文献亮点是借用了既往的随机对照临床试验（RCT）数据，并充分利用了数据特征带来的优势，进行了规范的建模。下面给出解读。

Paper Content

•

✦

内容提要

✦

•

摘要

（翻译+原文）

（点击查看大图）

Key Concepts

•

✦

概念清障

✦

•

QoR-40: Quality of Recovery，恢复质量评分-40。基于患者自我评估，含两大类 40 个问题，评估身体舒适度、情绪状态、身体独立性、心理逻辑支持和疼痛。具有良好的心理测量特性、效度、重测可靠性和内部一致性。患者自主完成问卷只需约 7 分钟。

ASA 分级：指的是美国麻醉医师协会（ASA）于麻醉前根据病人体质状况和对手术危险性进行分类，将病人分成的六级。该指标在各医院围手术期均常规采集。是外科建模的利器。

HADS: Hospital Anxiety and Depression Scale 医院焦虑和抑郁量表，基于患者主观感受。

Take-away Messages

•

✦

关键启示

✦

•

1. 研究亮点：数据来源

本文作者“一鱼两吃”，用两个既往随机对照临床试验（RCT）数据开发了模型。是不是为大家提供了新思路呢？

这两个麻醉药物的 RCT（编号NCT01441843；NCT01993459）本身并不是用来建立预测模型的，甚至两个研究对象都不同：一个是咪达唑仑，一个是劳拉西泮，但都是苯二氮卓类，也都采集了 QoR-40 问卷。

图释：两个 RCT 一个被当作训练集，用于建模；一个被当作验证集，验证模型表现（点击可放大）

2. 如何选择和对待患者数据：模型的“变量”处理

作者通过评价既往文献，筛选出如下变量以供选择：年龄、性别、既往手术情况、体重指数（BMI）、ASA 分级、手术持续时间、医院焦虑抑郁量表（HADS）和 QoR-40。

以上这种通过文献查找循证医学证据的方法，就是基于专家意见 (theory-based) 的变量筛选，这是目前最提倡的首要方法，可见临床建模需要与临床意见全程紧密结合，医生远不只是提供数据。

相比之下另一种变量筛选方法是单纯的数据驱动 (data-driven), 是指不考虑真实临床意义，只计算数值上的显著性，更适合样本量大、变量多的情况，常见于机器学习乃至人工智能。

基本模型最终选用变量：年龄、性别、至少做过一次手术、体重指数、ASA 评分和手术持续时间，共 6 个。

复杂模型最终选用变量：年龄、性别、既往手术、BMI、ASA、手术持续时间、HADS 和术前 QoR-40 评分，共 8 个。

特别指出，年龄、性别一般是放之四海皆有用的指标。

在对变量的处理上，作者保持数值变量不变，而非转化为等级变量（比如，将某项检验指标数值转变为“高、中、低”这样的等级变量），这种转化是一种最常见的数据处理错误。推荐参考一个科普视频：数据处理最常见的错误（没有之一）（https://www.bilibili.com/video/BV1tDTceqEmJ/）。

3. 临床预测模型常见难点/争议点：样本量

本研究容易被质疑样本量小。作者给出的解释是，虽然样本少，但因为来自 RCT，所以数据质量好，数据缺失少。

最关键的是，按照每个变量最少 10 个事件（Event per variable, EPV. 即：如果 8 个变量，则阳性结局至少需要达到 80 例）的经验法则，开发和外部验证的有效样本量是足够的。

图释：除了EPV，其他样本决定因素如图（翻译+原文）
（点击可放大）

4. 外科天然优势：术前术后对比数据

得益于较为严格的流程化诊疗，外科围手术期的指标较为全面，且时效性好。有想法的外科同道可以结合自己的兴趣点，探索课题。

5. 提倡：更新模型，而非重建模型

前人设计的临床量表（量表本质上就是预测模型）在后人的临床预测模型上体现价值。

同样地，本研究的作者也提出，后人可以在此模型基础上更新：

“可能有一些（目前未知的）变量会改善当前模型的表现。
因为新的研究（如 Enhanced Recovery After Surgery，ERAS，加速康复外科）指出，术前体力活动、营养状况、微创手术技术或麻醉方案以及术后可能需要入住重症监护室，都是值得关注的预后变量。扩大患者范围将有助于研究这些相关变量，从而更新我们的模型。”

再推荐一篇 2022 年发表的高被引文献，解答如何评估并更新模型，也是本公众号文章笔者的偶像 E. W. Steyerberg 作为通讯作者发表的：Methodological guidance for the evaluation and updating of clinical prediction models: a systematic review （参考文献 2）

6. 借鉴：“优点和不足”部分

本研究从几个常见的角度，即样本量、偏倚、模型普适性（泛化性）等来讨论，可以借鉴。

图释：文章“优势和不足”（原文+翻译）

（点击可放大）

Methodology

•

✦

方法论总结

✦

•

本研究较严格地遵循了系统化方法：临床模型建立七步骤（见下图）

图释：Clinical Prediction Models (书, 作者 Ewout W. Steyerberg) 总结的建模关键步骤清单

（点击可放大）

然而对于新的模型（如本例），需要在新的时间和应用场景继续验证，这也是大多数临床预测模型研究本身最具独特性之处。对于经受住考验的，可能被写进临床诊疗指南，例如预测深静脉血栓的 Wells 评分，有兴趣的读者可以查看本文参考文献 3。

参考文献

[1] van Beek, Stefan, et al. "Development and external validation of a clinical prediction model for predicting quality of recovery up to 1 week after surgery." Scientific Reports 14.1 (2024): 387.

[2] Binuya, M. A. E., et al. "Methodological guidance for the evaluation and updating of clinical prediction models: a systematic review." BMC Medical Research Methodology 22.1 (2022): 316.

[3] Wells, PhilipS, et al. "Accuracy of clinical assessment of deep-vein thrombosis." The Lancet 345.8961 (1995): 1326-1330.

[4] 视频：数据处理最常见的错误（没有之一）（https://www.bilibili.com/video/BV1tDTceqEmJ/）

END

文案 | 孙梦妍

排版 | 孙梦妍

审核 | 孙梦妍

发布｜姜笑南

世界生命科学大会

RECRUIT

关注我们，获取生命科学

学界前沿｜促进更多的学术交流与合作

业界前沿｜促进更快的产品创新与应用

政策前沿｜促进更好的治理实践与发展