摘 要: | 采用CGSS数据,根据样本出生年份划分为20世纪50年代60年代70年代和80年代四个群体,为减少模型选择过程中个人主观因素影响,采用回归树中的条件推断树、条件推断森林算法,得到事前法视角下各个群体机会不平等绝对和相对程度。研究显示:各个年代机会树终端节点数目分别为23、33、35、23,环境变量与个体收入之间均存在复杂非线性关系;户口类型是影响50年代机会不平等最主要环境变量,60年代是性别,70、80年代是居住地,且户口类型重要性持续下降,而居住地重要性持续上升;比较不同模型的样本表现,条件推断森林在测试集上的均方误差最小,其次是条件推断树,均优于参数法和非参数法;机会不平等的绝对程度由50年代的0.129下降到80年代的0.049,相对程度由35.3%下降到19.8%。
|