三、什么是倾向值?
倾向值指的是,被研究个体在控制可观察到的混杂变量的情况下,接受某种干预的条件概率。
给定Xi,个体i的倾向值(倾向得分)为个体i进入处理组的条件概率,即P(Xi) = P(Di=1|X=Xi)
以Di={0,1}表示个体i是否参加培训
四、什么是倾向值匹配?
PSM的实质就是把许多可观察到的混杂变量整合成一个变量:倾向值。
由于具有相同或相近倾向值的个体的其他变量在分布上具有相同的特征,故将处理组和控制组的个体根据倾向值进行匹配,从而平衡两组样本的基线数据,达到类似随机分组的效果。
由于混杂变量在倾向值匹配的过程中被控制起来,两组个体在结果上的差异就只能归因于有无干预措施。
回到大学教育对收入影响的例子,PSM想要解决的问题就是,由于A同学已经读了大学,如何估计出A要是不读大学,A的收入会是多少?**
倾向值匹配能从样本中,对每个人读大学的概率进行估计。然后选出与 A 同学有相似念大学的概率,却没有去读的同学 B 作为 A 同学的对照,然后再来看他们的区别。当样本中的每位“大学生 A” 都找到了匹配的“非大学生 B” ,就能对这两组样本进行比较研究了。
关于stata操作放在下一篇推文
参考资料:
PSM与政策评估(附Stata实现)阿虎定量笔记
应用计量经济学讲稿 许文立 |