(一)倾向得分估算
在理论上倾向得分可以使用任何一种概率密度函数进行估算,本文采用通行的logit模型预测农村男性处于大龄未婚状态下的倾向得分(Angrist,et al,2009)[19]。如前述及,影响农村大龄男性婚姻状态的因素可以概括为宏观因素和个体因素两类。前者指适婚年龄段未婚男女性别比、贫富差距等宏观经济、社会变量,后者则包括年龄、个人收入、健康程度、经济条件等个体特征。本文将使用上述宏微观经济、社会因素,预测农村大龄男性处于未婚状态的倾向得分,最后筛选出对婚姻状态有着显著影响的变量。
表2 匹配变量表
续表
注:资料来源于《中国人口与就业统计年鉴(2010)》和CGSS2010,*、**与***分别代表在10%、5%与1%水平上显著。
第158页表2报告了在主要适婚年龄段,主要宏观和个体经济、社会变量对农村男性处于未婚状态倾向得分的影响。值得一提的是,十年前的社会经济地位作为适婚年龄社会经济地位的代理变量,以及身高作为男性个体的关键体貌特征,理应对其是否仍处于未婚状态有着显著影响。然而,在CGSS2010农村大龄男性样本中,我们并没有发现支持这一假说的证据,故后文分析中就不再包含这两个变量。我们还检验了兄弟数目和当地农民纯收入对农村男性婚姻状况的影响,其系数都不显著(p>0.1),不过为了节省空间在此没有报告。收入对农村男性的婚姻状况影响较大。CGSS2006数据显示,当被问及什么是衡量个人社会经济地位最主要的因素时,超过四成的农村受访者选择“收入”(40.4%),比“教育”(12.7%)和“干部身份”(12.5%)选项之和还高。
第158页表2结果同时支持了农村男性大龄未婚困境成因的宏观因素论和个体条件论两大假说。适婚年龄段男女比例失调突出的地区,其农村男性处于未婚状态的倾向得分普遍较高,且至少在10%水平下显著。年龄对未婚概率的影响呈U形。同时,几乎任一年龄段中,收入水平低、健康程度差、受教育水平低、家庭经济条件差的农村男性,都以更大的概率处于未婚状态。随着年龄增大,家境对农村男性未婚状态的影响逐渐超过个人收入。20世纪90年代以来,农村男性结婚花费迅速攀升,有些地区娶妻经常花掉数十倍的个人收入,没有家庭的经济支持难以独立支付结婚开支[20][2]。
图3给出了进行PSM匹配后,未婚个体和已婚个体按照倾向得分分布的直方图(不包括未被匹配的对照组观测值)。图3显示,干预组的未婚倾向得分的分布比较均匀,而控制组的未婚倾向得分则严重左倾,绝大部分都处于低于0.5的状态。对未婚倾向很低的干预组(p(X)≤0.05)观测值,在控制组中有多个观测值与其相匹配。这很容易理解:干预组未婚倾向很低的农村未婚男性,通常具有较高的个人收入水平、相当健康的身体和优越的家庭条件。这样条件的男性个体,其社会、经济条件甚至优于一般已婚男性,也就很容易遴选到与其匹配的已婚男性样本。
图3 倾向得分直方图
注:未婚农村男性观测值为实线,已婚男性观测值为虚线;深色是未遴选到匹配个体的干预组观测值;数据来自CGSS2010。
随着倾向得分增大,与干预组观测值相匹配的控制组观测值呈减少趋势。对未婚倾向得分超过0.5的干预组农村男性而言,已经鲜有已婚男性与其匹配。这些干预组农村男性,通常个人收入较低、健康情况较差,家境也相对贫困。弱势的社会、经济特征,显然是这些群体大龄未婚的重要原因,在已婚样本中也很难找到与其条件相近的匹配观测值。而未婚倾向得分高于0.8的农村大龄男性,由于其社会、经济条件在婚姻市场上处于极度劣势地位,在控制组中根本找不到与其相匹配的观测值(Off Support)。
平衡性假设是实施倾向得分匹配估计的另一前提。即干预组和控制组观测值在统计分布上没有显著差异。本文对影响农村大龄男性婚姻状态的宏观因素和个体社会经济特征变量进行了平衡性检验,结果表明匹配后干预组和控制组观测值之间并没有显著差异。不过,为了节省空间没有报告。
(二)普通最小二乘估计结果(www.xing528.com)
表3报告了最小二乘法估计与三种倾向得分匹配模型结果。本文使用最小二乘法进行基准估计的理由有二:其一,Ferrer-i-Carbonell&Frijters(2004)研究表明,对定量考察主观福利因素而言,无论使用定序响应模型,还是使用最小二乘方法,其估计系数的符号和显著性都是一致的[21];其二,OLS估计结果与倾向得分匹配方法估计结果,在系数和显著性水平上更具有可比性。事实上,不少探讨中国农村居民幸福的经济学文献[12][13],都使用了类似线性概率模型。
表3 大龄未婚对农村男性婚姻主观福利的影响:PSM VSOLS估计结果
注:资料来源于《中国人口与就业统计年鉴(2010)》和CGSS2010,*、**与***分别代表在10%、5%与1%水平上显著。
表3A部分给出了大龄未婚对农村男性主观福利影响的最小二乘估计结果。作为分析的基准组,A部分第(1)列自变量仅包括未婚变量,结果显示农村未婚男性主观福利显著低于已婚男性,且随着年龄增长呈恶化趋势。A部分第(2)列则控制了地区未婚性别比、通货膨胀、贫富差距等宏观经济变量,以及年龄、个人收入、健康程度、家庭经济条件等个体经济、社会特征。对超过22岁(含)的农村大龄未婚青年而言,若综合考虑宏观社会经济因素和个体条件后,婚姻状况对其主观福利水平并无显著影响(p>0.1)。利用中国社科院调查数据,Knight&Gunatilaka(2011)也得出了类似结论[7]。这也许意味着,农村大龄未婚男性之所以主观福利水平较低,不仅仅是由于其大龄未婚这一因素本身,而更可能因为其背后弱势的经济社会条件。然而需要指出的是,若某些农村男性预期处于未婚状态主观福利损失较小而更倾向于选择大龄未婚状态,即ATT效应小于ATU效应(Average Treatment Effect on Untreated,ATU)。这时,即使充分控制可能同时影响农村大龄男性婚姻状态和主观福利变量,即不存在遗漏变量偏误,普通最小二乘法估计结果仍可能因负向选择效应高估大龄未婚对农村男性主观福利的影响[5]。这时需要借助倾向得分匹配方法构造反事实假设,直接估算大龄未婚对农村男性主观福利影响的ATT效应。
(三)倾向得分匹配估计结果
第161页表3B至D部分分别报告了大龄未婚对农村男性主观福利影响的ATT效应的最近邻匹配、半径匹配与核匹配等三种倾向得分匹配模型估计结果。结果显示,基于可观测变量控制农村男性婚姻状态自选择效应后,在每一个适婚年龄段,大龄未婚对农村男性主观福利的影响基本上都为负;且随着年龄增长,呈现出先增大后减小的倒U形特征。不过,与OLS模型一致,大龄未婚对农村男性主观福利的影响的ATT效应估计结果,都未通过显著性水平为10%的统计检验。
值得指出的是,如第157页图1所示,落在共同支撑领域内的控制组观测值,其未婚倾向得分的分布是高度左倾的,所以当干预组未婚倾向得分一旦超过0.5,就鲜有合适的控制组观测值与其相匹配,这意味着可能会低估大龄未婚对农村男性主观福利影响ATT效应。事实上,这正是倾向得分匹配方法较之普通最小二乘法的核心优势。共同支撑假设排除了在倾向得分尾部分布的农村男性,从而提高了匹配质量,同时也会导致样本量减小。Heckman等(1997)提出非参数匹配方法仅应用于共同支撑区域时才有意义[17]。为了增强可比性,本文分别以0.01、0.05、0.1为临界点,剔除未婚倾向得分较低的观测值,然后再进行估计。第161页表3最后三行数据显示,剔除未婚倾向较低的观测值后,与全样本估计结果相比,各种倾向得分匹配方法得出的结果无论在系数大小还是显著性水平,都呈现出相当程度的稳定性。
(四)匹配加权最小二乘法估计结果
第163页表4给出了大龄未婚对农村男性主观福利影响的匹配加权最小二乘估计结果。作为参照基准,第(1)至(3)列报告了没有加权的普通最小二乘估计结果。如前述及,不同地区的农村男性对婚姻的态度以及主观福利认知,都可能存在系统性差异,因此加入地区虚拟变量以控制地区固定效应的影响。
表4 大龄未婚对农村男性主观福利影响:匹配加权最小二乘估计
注:资料来源于《中国人口与就业统计年鉴(2010)》和CGSS2010,*、**与***分别代表在10%、5%与1%水平上显著。
表4第(4)至(6)列报告了使用未婚倾向得分作为权重的加权最小二乘估计结果。第(4)列结果显示,按照未婚倾向得分对已婚男性观测值进行加权后,同样未控制任何影响婚姻状况和主观福利的宏微观变量,大龄未婚对农村男性主观福利的影响较第(1)列未加权的普通最小二乘法估计结果,系数有较大幅度减少且未能通过显著性水平为10%的统计检验。第(5)至(7)列依次放入影响婚姻状况和主观福利的宏微观变量、早期主观福利变量以及地区固定效应变量。结果显示,作为一种双重稳健性估计方法,匹配加权最小二乘法估计结果,与倾向得分匹配方法估计结果,无论是在变量系数还是显著性水平,都没有明显差异。这表明我们对大龄未婚影响农村男性主观福利的估计结果是稳健的。这也意味着,大龄未婚本身对农村男性并没有显著的负面影响,仅靠改变婚姻状况本身难以提升其主观福利。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。