倾向值匹配(propensity score matching,PSM)
一、为什么需要匹配?
随机实验很好,但成本高,做起来有时无法落地,不切实际。比如为了研究大学教育对收入的影响,不可能找一批已经考上大学的学生,随机分为两组,一组是上大学,一组不去上大学,然后等毕业再来看两组的收入差异吧。
在多数情况下,研究者只有观测数据,没有实验数据,处理组和控制组的成员不是由随机分配产生,而是可以自由选择参与其中。正是由于选择效应的存在,并非随机分组,倾向值匹配(propensity score matching,PSM)就有用武之地啦。
二、匹配的思路是什么?
针对非随机分组的个体,匹配估计量的基本思路是:找到属于控制组的某个个体j,使其与属于处理组的个体i在可测变量的取值上尽可能的相似(“匹配”),即Xi = Xj
又由于给定Xi,Y0i,Y1i对立于Di ,因此个体i与j进入处理组的概率详尽,具有可比性。
因此可以将Yj作为Y0i的估计量;进一步,可以将Y1i-Yj作为对个体i的处理效应。
什么是匹配?
匹配是一种非实验方法,是对于一些没有采用或不方便采用实验方法区分处理组和控制组的数据采用的一种近似实验的方法。
匹配方法假定,控制协变量之后,具有相同特征的个体对政策具有相同的反应。 换句话说,不可观测因素不影响个体是否接受政策干预的决策,选择仅仅发生在可观测变量上。
因此,对每一个实验组个体而言,可以根据可观测特征为其选择一个控制组个体构成反事实。
匹配的目的在于确保干预效应估计,是建立在可比个体之间的不同结果基础上。最简单的匹配方式是将处理组和控制组中协变量值相同的两个个体进行配对分析。
举个栗子
例子
对于控制组的个体1,由于X1 = X5 =2 ,因此个体1与处理组的个体5匹配。Y01的估计量为7,Y11的估计量为8;
对于控制组的个体2,没有相同的匹配,只有近似的匹配X4 = X6 =3。Y02的估计量为8,而Y12的估计量为(Y4 + Y6)/2 = 7.5
对于整个样本的匹配结果,此时需要计算平均处理效应(又称“平均因果效应ACE”):
ATE = E(Y1i-Y0i) =((8-7)+(7.5-8)+(7.5-6)+(9-7.5)+(8-7)+(6-7.5)+(7-5))/7 = 0.143
关于平均处理效应ATE
但我们更关心参加培训的匹配结果,即只需要计算参与者平均处理效应(又叫“参与者处理效应TOT”)
ATT = E(Y1i-Y0i|Di=1)=((9-7.5)+(8-7)+(6-7.5)+(7-5))/4=0.25
但如果协变量不是某一个变量,而是一组变量时,这种简单的匹配方式就不再适用。
在现实生活中,数据偏差和混杂变量比较多。由于存在很多其他变量混淆自变量和因变量之间的关系,研究者很难直接探索二者间的净效果。这些混淆变量的影响通常被称为选择性误差,需要通过倾向值匹配的方法来控制和消除。 |