随机试验样本少、入组慢或受伦理约束时,外部患者数据看起来像一批“便宜样本”。但它们没有参与当前试验的同期随机分配,不能直接并入对照组。人群基线不同会造成协变量偏移;时间或环境改变结局机制,则会带来结局漂移。处理不好,效率没换来,偏差反而进入了结果。
Zhu 等人的教程围绕混合对照试验——把试验内部对照与外部对照结合估计处理效应——给出一套实操流程:先明确估计目标和识别假设,再对齐入选条件、匹配数据,并比较完全借用与选择性借用。后者会按可比程度决定借哪些观测、赋多大权重。教程还覆盖渐近推断与随机化检验,并用 SelectiveIntegrative 和 intFRT 逐步演示;示例是 intFRT 内置的合成肺癌数据,模拟 CALGB 9633 试验及 National Cancer Database 外部对照。作者称,这套流程旨在兼顾效率与有效推断;摘要未披露具体效率增益或误差指标。