论文复现:基于组级纵向数据评估政策的试验模拟方法
(2023-02-04 16:31:00)
标签:
论文复现纵向数据试验模拟 |
分类: Stata推文 |
目录
1. 引言
为了限制新冠肺炎疫情的传播,世界各国政府实施了许多非医药相关的干预政策,如停止居民的非必要活动、设置隔离期等。聚焦到美国,各州之间制定的政策及推动其落实的力度差别很大。因此,研究这些政策的效果对未来具有重要的借鉴意义。
学界已经有成熟的流行病学方法来测定在单一地点和单一时间起作用的干预措施的影响,这可以追溯到约翰·斯诺对伦敦 1854 年霍乱爆发的研究。双重差分 (DID) 方法通过利用政策实施前后以及地区实施政策与否对比得到的组级纵向数据来构建反事实结果。它有一支变体称为面板数据方法 (panel data methods),包括事件分析法 (event studies) 和比较中断时间序列 (comparative interrupted time series) 模型。
但是,流行病学领域对于如何推动地方政策持续实施 (有时也称为交错实施,staggered adoption) 并没有达成明确共识。幸运的是,在数十年非实验性研究设计的基础上,研究人员已经掌握很多方法用于解决个体间干预政策的混淆问题和时变问题,能够在个人层面干预的研究中熟练地处理类似的难题。目标试验模拟 (Target trial emulation) 就是这样一种非实验性研究方法,它对纳入和排除标准、协变量、风险敞口、政策效果测定以及这些变量的时变特征的设定要求都很高。
原文指出使用组级纵向/面板 (panel) 数据测定政策效果也需要进行类似严谨的设计 (尤其是各州司法流程不同导致最终确定的干预时间也互不相同的情况下),并将该方法定义为政策试验模拟 (policy trial emulation)。其核心思路是对同时实施干预政策的各个州 (treatment cohort) 分别设定试验目标,再将结果加总。
原文基于新冠肺炎确诊总数对各州居家令的影响作了典型事实分析。作者认为在研究方法中纳入试验模拟是概念上一个重要的进步,尽管早有文献确立了基本统计方法并有许多衍生观点。原文认为在数据准确、模型设计和诊断分析都严谨的前提下,基于面板方法的效果测定能够更好地解释很多政策。但符合新冠肺炎疫情的潜在假设不能随意简化,而且抗击新冠肺炎疫情传播的政策实施过程也是充满变数的。