作为一种统计技术,匹配 Matching通过在观察研究 Observational Study准实验研究 Quasi-experiment(即 处理 Treatment 是非随机分配的)中比较已处理和未处理的单元,以评估处理的效果。匹配的目标是,对于每个处理单元,找到一个(或多个)具有相似可观察特征的未处理单元,以评估处理效果。通过处理单元与相似未处理单元的匹配,匹配技术可以比较处理单元与未处理单元的不同结果,从而评估处理效应,减少混杂效应带来的偏差。[1][2][3] 倾向值匹配 Propensity Score Matching,一种早期的匹配技术,是作为鲁宾因果模型 Rubin Causal Model[4]的一部分发展起来的,但已被证明会增加模型依赖性、偏差、无效性和 计算量 power ,与其他匹配方法相比不再推荐使用。[5]

匹配由 唐纳德•鲁宾 Donald Rubin [4]推动,在经济学中主要受到LaLonde[6]的批评。LaLonde比较了一个实验中的处理效果估计和运用匹配方法产生的可比估计,表明匹配方法是有偏的。Dehejia和Wahba重新评估了LaLonde的批评,并指出匹配是一个很好的解决方案。[7]政治学[8]和社会学期刊[9]上也提出了类似的批评。


当感兴趣的结果是二元变量时,分析匹配数据最常用的工具是条件Logistic回归模型,因为它可以处理 任意大小的层次和连续或二元处理变量(自变量)strata of arbitrary size and continuous or binary treatments (predictors) ,并且可以控制协变量。在特定情况下,可以使用 配对差异检验 paired difference test、 McNemar 检验和 Cochran-Mantel-Haenzel 检验等更简单的检验。

当感兴趣的结果是连续的,对平均处理效应 Average Treatment Effect 进行估计。








