浙江城镇居民区收入不平等研究：非参数理论方法

时间：2026-01-27 理论教育凌薇版权反馈

【摘要】：第三章基于非参数理论的收入不平等研究方法本章首先介绍目前已有的关于收入不平等和贫困的主要测度指标，对各指标的适用范围和特点进行了分析和评述。基尼系数根据一定人口所获得的收入比例来反映收入差距的总体水平，在收入分配领域的实证研究和政策分析中被广泛应用。基尼系数的取值范围在0～1之间，数值越高，表示收入不平等程度越大。

第三章　基于非参数理论的收入不平等研究方法

本章首先介绍目前已有的关于收入不平等和贫困的主要测度指标，对各指标的适用范围和特点进行了分析和评述。在此基础上，作者考虑将非参数估计理论引入到收入分布的拟合，然后从收入分布的视角实现对收入不平等和贫困的测度，达到准确刻画收入不平等和贫困程度的目的。此外，作者利用非参数估计和反事实函数线性变换相结合的方法来实现收入分布变化的分解，使得建立在此基础上的收入不平等动态分解和贫困变化分解成为可能。总之，本章从方法论的角度给出了本文的研究思路，为研究收入不平等提供了全新的视角。

第一节　收入不平等测度指标

在衡量收入不平等程度时，主要有两大类度量指标可供使用。一类是绝对差距指标，它们的特性在于有量纲，即数值大小与度量单位有关。比较常见的指标有极差、平均差和标准差。如果用这组指标衡量收入分配，那么经济增长总是带来收入不平等程度的上升。例如，受经济增长的影响，富人的收入增加10%，而穷人的收入增加15%，应该说，这样的经济增长带来的是收入不平等程度的下降，但用绝对指标衡量的收入不平等却显示是上升。正是这些原因，绝对指标较少的被单独使用。另一类是相对差距指标。从理论上讲，一个好的相对指标需要具备以下一些性质：一是匿名性或无名性，即度量结果只与观测数值有关，和观测对象的地位、身份没有任何关系。二是齐次性，当变换度量单位时，指标值的结果不受影响。三是总体独立性，即样本容量的大小不影响度量结果。四是转移性，给定一个样本或一组人，如果你从富人收入中拿出一部分，转移给穷人，那么收入不平等程度应该下降。五是强洛伦兹一致性，即和洛伦兹曲线具有一致性。一个好的相对指标应该能够准确描述这些关系。

目前，经济学界常用的相对指标是基尼系数。尽管基尼系数自身存在着某些局限性，如不能反映社会不同收入阶层的收入分布状况。但由于它具有较强的可操作性，已成为国际上度量收入不平等普遍采用的指标。此外，还有几种常用的收入不平等度量指标，如泰尔指数、库兹涅兹比率、统计指标等，旨在弥补基尼系数的不足。本节将对它们进行简单介绍。

一、洛伦兹曲线和基尼系数

洛伦兹曲线是德国统计学家洛伦兹提出的，用来衡量社会收入分配平均程度的曲线，是随人口累计百分比变化的收入累计百分比变化的曲线，如图3－1所示。

图3－1　洛伦兹曲线与基尼系数

图3－1中，OP 代表人口百分比，OT代表收入百分比，OC是45度线，为收入分配绝对平等的洛伦兹曲线，OPC曲线则代表收入绝对不平等曲线，P点表示一人独占全部收入，其余人收入为零。反应实际收入分配状况的洛伦兹曲线介于OC和OPC之间，如曲线OLC为某一洛伦兹曲线，与OC线越接近，收入分配越均等；而与OPC线越接近，弧度越大，收入分配越不平等。

洛伦兹曲线是依据人口百分比及其在收入中所占份额的大小而变化的，可以直观地把收入分配是否平均的状况表现出来，但没有数值化。由于洛伦兹曲线在不同国家，或在同一国家不同时期、不同发展阶段都不一样，不能直接比较，因此在实际中很少单独使用。

20世纪初，意大利统计学家基尼（Gini）根据洛伦兹曲线提出了基尼系数。基尼系数是用洛伦兹曲线与绝对平均线之间所围的面积大小来度量收入不平等，即用洛伦兹曲线的弯曲程度来度量收入分配的差距程度。基尼系数根据一定人口所获得的收入比例来反映收入差距的总体水平，在收入分配领域的实证研究和政策分析中被广泛应用。

在图3－1中，A表示绝对平均线OC与洛伦兹曲线OLC之间的面积，B表示洛伦兹曲线OLC与绝对不平等线OPC之间的面积，基尼系数可以表示为区域A与（A＋B）之比。基尼系数的取值范围在0～1之间，数值越高，表示收入不平等程度越大。根据国际惯例，认为基尼系数在0．2～0．4之间表示收入不平等较为合理，并将0．4作为划分收入不平等是否合理的警戒线；小于0．2表示收入不平等较小，平均主义严重；大于0．4意味着收入不平等过大，可能影响社会公平；如果基尼系数大于0．6，则认为会引起社会动荡。

基尼系数的计算方法主要有几何法、平均差法和协方差法。各种方法相互统一，又各有其自身的特点和特殊用途。

（一）几何法

如图3－1，洛伦兹曲线将45度线以下的部分划分为A和B两个区域。设正方形为单位正方形，则有：A＋B＝，基尼系数就可以表示为：

如果收入分配是离散型的，根据阿马蒂亚·森（1973）的定义，基尼系数可以进一步表示为：

其中，μy＝，该定义表明与收入相关的权重（n＋1－i）是收入大小的逆序，高收入者在指数计算中所占的权重小，低收入者在指数计算中所占的权重大。

几何法的优点是理解容易，经济含义一目了然，这也正是基尼系数最吸引人之处。但缺点是计算过程相当繁琐。

（二）平均差法

基尼在1921年将以平均差为基础的统计方法和几何方法统一起来，得出“基尼系数总是等于相对平均差的”的结论，为平均差计算方法奠定了基础。此后的统计学家继承这一思想，发展了平均差法计算基尼系数。根据平均差法，离散收入分布的基尼系数计算公式为：

建立在平均差基础上的基尼系数有着非常优良的统计意义，但其计算过程同样较为复杂，因此在经济分析中较少使用。

（三）协方差法

协方差法表示的离散型收入分布基尼系数的计算公式为：

协方差法的优点是可以通过软件中协方差的计算程序来计算基尼系数，大大减少了手工计算量，因此在对收入分配的统计学分析中被广泛采用。

二、泰尔指数

荷兰经济学家泰尔H．Theil在1960年将信息熵理论应用于对收入差距的研究，提出泰尔指数：

其中，n为人口数，yi为第i单位的收入。泰尔指数值的大小与收入差距成正相关关系，数值越大，表示收入差距越大，收入分配越不平等；数值越小，表示收入差距越小，收入分配越平等。

泰尔指数的最大优点在于：它具有可分解性。利用泰尔指数可将总体的收入差距变动在不同区域之间或不同人群之间进行分解，即分解为组内差距变动和组间差距变动，从而为观察和揭示组间差距和组内差距各自的变动方向和变动幅度，以及各自在总差距中的重要性及其影响程度提供了可能。

三、等分法

等分法是将全部居民收入按高低顺序排队，划分为若干等分，然后取收入最高一组人口的收入或收入比重，与最低一组人口的收入或收入比重进行比较，其结果称为高低收入倍数或高低收入比率。等分法集中考虑分析收入最高与最低的居民之间的收入差距，而对中间部分则忽略不计。等分法简单明了地反映居民收入分配两极化的状况。

等分法通常分为十等分、五等分、四等分、二等分等几种，最常用的是五等分法。五等分法最早是由英国学者佩什在1957年发表的一篇题为《个人所得税的实际发生率》的论文中提出。该方法首先将人口按家庭人均收入的高低排序，然后将排序的人口分为五等分，最后测量各1/5层的人口收入在总收入中所占的比例。一般将这种方法划分出的最高收入的1/5人口视为最高收入阶层，而将最低收入的1/5视为相对贫困层。

四、库兹涅兹比率

库兹涅茨比率是将各家庭组的收入份额比重与人口份额比重之间的差额相加，再除以人口数，即：

其中，K是库兹涅茨比率，Yi和Pi分别是各家庭组的收入份额比重和人口份额比重，满足＝100，＝100，P是人口总数。

库兹涅茨比率用于反映总体收入差距状况，计算简单。计算中给各个家庭所赋的权重不等，最富有和最贫穷的家庭组的权重较大，中间家庭组的权重较小。所以，当收入分配出现两极分化现象时，库兹涅茨比率的数值变化幅度比基尼系数大。

五、阿特金森指数

阿特金森指数由英国经济学家阿特金森（Atkinson）将社会福利与收入分配情况相联系，在福利函数的基础上推导而来，其计算公式为：

其中，Y为全社会所有人口的平均收入；Pi表示收入为Yi的人口占总人口的比重；e表示社会对收入差距的厌恶程度，e越大，表示社会越不能容忍收入差距过大的情况，e越小表示社会对收入差距的容忍能力越强。A的取值范围在0～1之间，值越大表明收入不平等程度越大，反之则表明收入不平等程度越小。特别地，当A＝0时，表示收入分配绝对平等，A＝1表示收入分配绝对不平等。

阿特金森指数对于收入不平等的度量考虑了社会心理因素（社会对收入差距的厌恶程度），其主观性和变动性较强，这在所有指标中独具特色。但由于社会对收入不平等的厌恶程度的主观评价色彩很强，因而不易确定，并且不同人计算出来的数值可能也不一样，这就给比较分析带来很大困难，因此在一定程度上限制了阿特金森指数的应用。

六、统计指标

从统计学角度看，测算收入不平等主要有绝对差异指标和相对差异指标两类。绝对差异指标是指某变量偏离参照值的绝对值；相对差异指标是指某变量偏离参照值的相对值。绝对差异指标主要有：极差、平均差和标准差；相对差异指标主要有：极值比和变异系数。下面做简单介绍。

（一）极差

极差也称全距，指变量的最大值与最小值之间的离差，用以说明变量的变动范围和幅度，计算公式为：

其中ymax为变量的最大值，ymin为变量的最小值。

（二）平均差

平均差即离差绝对值的算术平均，计算公式如下：

其中，yi为第i个变量，y为所有变量的平均值，n为变量数。

（三）标准差

标准差又称均方差，是统计中应用最广的一种标志变动度量指标，该指标主要用于说明各样本与其平均水平的绝对偏离程度，数值越大，表示绝对差异越大，计算公式为：

（四）极值比

极值比是指变量的最大值与最小值的比率，反映变量值偏离参照值的相对程度，因此可以反映一个国家居民收入差异的特殊情况，即最富有地区与最贫穷地区人均居民收入之比，计算公式为：

（五）变异系数

变异系数是变量的标准差与其均值之比，反映变量值偏离平均水平的相对不平等，计算公式为：

以上各度量指标均有其独特的设计思想，因而有各自的侧重点和特点。从国内外研究收入不平等测度的文献来看，很少采用单个指标来度量收入不平等程度。因为单个指标的分析很难全面地反映收入不平等状况，并且单个指标存在的缺陷也会影响其度量收入不平等程度的准确性。在实际应用中往往根据数据特征、分析目的等情况，选用一个或多个指标对收入不平等进行全面、准确的分析。本文在此思想指导下，采用以基尼系数为主的收入不平等指标，并以若干具有不同特征的辅助指标，如泰尔指数、极差、变异系数和分组比率指标来共同对收入不平等程度进行度量。

第二节　贫困测度指标

贫困的衡量主要是通过贫困测度指标来实现。贫困测度指标主要从收入或社会福利角度衡量人口总体中贫困的程度以及分配的不平等状况。本文主要介绍几种常用的贫困测度指标，主要有贫困发生率、贫困缺口率、森贫困指数和FGT贫困指数。

一、贫困发生率

贫困发生率指被识别为贫困的人数比率，从贫困人口在其人口总体中所占比例的角度，反映贫困现象社会存在的范围或发生率。贫困发生率指标是最基本的，也是目前应用最为广泛的贫困测度指标。若用H表示贫困发生率，n表示人口总体数量，q表示贫困人口数，则

贫困发生率反映在全部人口中有多少人处于贫困状态，重在测度人口比率。该指标从总体上反映某个国家、某个行业、不同类型家庭的贫困发生面及变动趋势，但是没有说明贫困人口之间的贫富差别，对位于贫困线以下的人口在测算贫困程度时给予了相同的权重，不能衡量贫困线以下贫困人口的收入变化和生活水平的变化。只有当一个人的收入从贫困线以下提高到贫困线以上才能引起指标变化，因此，利用贫困发生率指标来测度贫困的后果是低估贫困的程度。

二、贫困缺口和贫困缺口率

贫困缺口是指贫困者的收入与特定贫困线的差距，^[1]主要侧重从收入差距的角度衡量贫困者收入低于贫困线的程度，或者说为了消除贫困，使所有贫困者的收入都超越贫困线所需的社会财力。设yi表示贫困者的经济收入（yi＜z，i＝1，2，…，q），给定贫困线z，贫困缺口G和贫困缺口率I分别表示为：

公式（3－15）中，分母q与z的乘积是假设贫困者的经济收入都达到贫困线水平时的总收入，称为理论最大缺口，即当yi＝0（i＝1，2，…，q）时，q·z＝＝（z－yi）。因此，贫困缺口率是实际贫困缺口与理论贫困缺口的比率，且0＜I＜1。I越小，贫困程度越轻，当I接近0时，说明贫困者的经济收入基本接近贫困线已达到脱贫的临界点。反之，I越大，贫困程度越严重，当I趋向1时，表示贫困阶层的人基本没有经济来源，因而贫困缺口达到最大值。

贫困缺口率与贫困发生率相比，能够准确反映贫困群体的平均贫困程度，但无法衡量贫困人群中贫困差额的分布情况，它没有考虑贫困者在贫困内部发生的收入转移所产生的影响。如果在一个贫困群体中，收入向较富者集中，贫者愈贫，贫困状况恶化，但这却无法在贫困缺口率指标得到反映。

三、森贫困指数

阿马蒂亚·森在1974年给出一个贫困标准化度量的一般性公式：

其中，A（n，q，z）是一个标准化参数，由总人口n、贫困人口q和贫困线z确定。gi（gi＝z－yi）是第i个贫困者的贫困缺口，Vi是第i个贫困者的贫困缺口gi的权重。

阿马蒂亚·森指出，在有大量贫困者存在的情况下，满足排序的相对贫困公理^[2]和标准化绝对贫困公理^[3]的唯一贫困度量是：

上式即称为“森指数”。其中，G是贫困者内部的收入分配基尼系数。

森指数将贫困人口收入的绝对差距和相对差距同时反映出来，并把绝对贫困和相对贫困的概念很好地结合起来。一方面，收入差距的扩大会增加贫困程度。因为当内部收入分配差距增大时，基尼系数就增大，森指数从而也增大，贫困程度加深。另一方面，贫困人口内部的收入分配变化也会影响贫困程度。在收入缺口不变的情况下，收入分配变得更为平均会缩小贫困人口之间的收入差距，即G变小，引起P也变小，从而使得贫困程度降低。

四、FGT贫困指数

FGT贫困指数是由经济学家福斯特、格林尔和索贝克在1984年提出的一个测度贫困的指标，现已得到广泛应用。他们认为，对于贫困的测量除了要满足单调性公理和弱传递性公理外，满足转移敏感性公理^[4]和子集单调性公理^[5]也是合理的。由此给出FGT贫困指数的计算公式为：

其中，n表示总人口，z表示贫困线，xi表示第i个贫困者的收入，q表示贫困人口数，参数α是大于0的参考值。当α变大时，贫困指数变得对最贫困者的收入情况更灵敏。参照阿马蒂亚·森标准，α取0，1，2时，贫困指标间有显著对应关系。

当α＝0时，

此时，FGT（0）贫困指数退化为贫困发生率，即收入低于贫困线下的贫困人口占总人口的比例。

当α＝1时，

此时，FGT（1）指数被称为贫困距指数，它是贫困发生率与贫困缺口率的乘积，反映了贫困人口的收入与贫困线之间的相对距离。当给贫困线下的贫困人口增加收入，且增加收入后贫困人口仍在贫困线下，这时的贫困发生率H保持不变，但贫困人口的平均收入增加，导致贫困缺口率I减小，从而使贫困距指数FGT（1）减少，说明贫困状况有所好转。反之，当贫困人口的收入被转移到非贫困人口中去时，贫困发生率仍不变，而此时贫困人口的平均收入会减少，贫困缺口率I增加，从而导致FGT（1）也增加，说明贫困人口比以前更加贫困了。可以说，贫困距指数是贫困发生率指数的一种补充。

当α＝2时，

FGT（2）指数被称为平方贫困距指数（Squared Poverty Gap Index），用于说明贫困人口中最贫困者的状况，是对最贫困人口状况的敏感反映。公式（3－21）前一部分反映贫困缺口，后一部分反映贫困人口收入的分散程度，贫困人口收入的上限已确定是z，标准差越大，收入也就越分散，而且收入只能向下（低收入）方向分散，这说明某些贫困人口的贫困状况在恶化。CVp是贫困者收入的变异系数，用于衡量收入不平等的程度，即收入分布状况。

三个指标联合运用，能全面反映贫困水平及其变动情况。贫困率下降，表明贫困人口比例减少，但不能反映贫困人口远离贫困线的距离变化，而贫困距指数弥补了这个缺陷；当贫困率和贫困距指数不变时，说明贫困人口比例和整体收入相对于贫困线保持不变，但不能反映贫困人口之间的收入分配状况，平方贫困距指数弥补了这个缺陷。

第三节　非参数理论的收入不平等测度

对已有的收入不平等测度指标的分析发现，准确度量收入不平等，一定程度上依赖于收入分布函数的确定。以往研究中，为了便于计算的需要，各种收入不平等指标大都采用离散的计算方法，回避了收入分布函数的确定，因此计算结果的准确性受到一定的质疑。虽然有学者从拟合收入分布的角度来测度收入不平等，但所用的拟合函数基本都是经典分布函数，如正态分布函数、对数分布函数、帕累托分布函数，等等，而这些函数本身的假定性也使实际的收入分布很难满足，不可避免地降低了拟合结果的准确性以及建立在收入分布基础上的收入不平等指标的准确性。

为了精确计算收入不平等指标，国外学者已经试图从非参数估计理论的角度出发，通过拟合实际收入分布的密度曲线，来计算收入不平等指标。本节将介绍基于非参数估计理论的收入分布拟合方法，以及在此基础上计算的基尼系数等收入不平等指标。

一、非参数估计理论

非参数统计是与参数统计相比较而存在，其估计特点是不依赖于总体分布及其参数，亦即不受分布约束的统计方法。在过去的几十年里，尽管非参数理论得到了进一步的发展，并且已经在经济、社会研究以及医学、企业管理等领域得到一定的应用，但是作为一种新生事物，相对于传统的参数统计法，对非参数统计方法了解较少，应用领域尚需进一步拓展。

非参数估计主要有如下两个特点。

1．使用样本的信息与参数方法不同。样本是统计推断的依据，统计方法优劣的依据很大程度上依赖于它是否“充分地”提取和使用了样本中的信息，以此构造合理的模型。例如极大似然估计，它要求总体的概率密度的形状已知，所以，参数统计方法往往对设定的模型有更多的针对性，一旦模型改变，方法也随之改变。非参数估计方法则不然，由于非参数模型中对总体的限定很少，因而只用很一般的方式去使用样本信息，如位置、次序关系之类。由于参数统计方法对数据有较强的假定条件，因而当数据满足这些条件时，参数统计方法能够从其中广泛地、充分地提取有关信息。非参数统计方法对数据的限制较为宽松，因而只能从其中提取一般的信息。当数据资料允许使用参数统计方法时采用非参数统计方法会浪费信息。

2．非参数统计具有稳健性。稳健性是指当真实模型与假定的理论模型有不大的偏离时，统计方法仍能维持较为良好的性质，至少不会变得很坏。参数统计法是建立在假设条件基础上，一旦假定条件不符合，其推断的正确性就会不存在。非参数统计方法由于都是带有最弱的假设，对模型的限制很少，故天然具有稳健性。

非参数估计一般不事先假定变量之间的结构关系，是通过直接估计获得这种结构关系。相比之下，参数估计则需要事先假定这种结构关系，然后利用数据对决定这种结构关系的未知参数进行估计，从而确定这种结构关系。因此，参数估计事先对变量间结构关系的准确预知是决定估计结果的关键因素，而这在实际情况下是很难做到的。相比参数估计的局限性，非参数估计直接对结构关系的估计给研究带来方便。因此，已经有越来越多的学者将非参数估计的方法应用到各种领域。例如，王雪峰等（1999）用非参数核估计来探讨天然林直径结构的规律，谭英平（2003）用非参数核估计对个体损失的研究。考虑到收入分布的不均匀性，非常适合利用灵活性较大的非参数估计对其研究。

二、核密度估计

密度估计是指在给定样本后，对其总体密度函数的估计。它是统计研究的一个关键问题。当随机变量的密度函数被构建后，就可以充分了解随机变量的分布特性，其他相关问题也就相应解决。密度估计可以分为参数估计和非参数估计两种类型。前者是密度函数结构已知而只有其中某些参数未知，此时的密度估计就是传统的参数估计问题。后者是密度函数未知（或最多只知道连续、可微等条件），仅从现有的样本数据出发得出密度函数的表达式，这就是非参数密度估计。非参数密度估计始于直方图法，后来发展为最近邻法、核估计法等，其理论发展最完善的是核密度估计法。

频数分布直方图是最简单的非参数密度估计，但是直方图是一种非连续估计，估计结果是一个间断函数。因此，这个函数的分析性质较差，如不可求导。此外，直方图的估计结果对区间宽度的选择有很强的依赖，对区间中心的位置也有较强的依赖。核密度估计通过平滑方法，用连续的密度曲线代替直方图，能更好地描述随机变量的分布形态。下面介绍核密度估计方法的基本原理。

（一）简单核密度估计

考虑到一组数据集合：x1，x2，…xn，通过核密度估计来刻画它们的某种分布特征，这里定义密度函数为f（x），在点x的核密度估计为：(https://www.xing528.com)

上式中n是观测值的个数，h为窗宽，K是核函数。核函数是一种权函数，该函数利用数据点xi到x的距离（x－xi）来决定xi在估计点x的密度时所起的作用，主要包括正态（Gauss）核、（Epanechnikov）核、三角（Triangular）核、四次（Quartic）核等类型。

关于核函数的影响，J．DiNardo（2001）提出：不同的核密度函数，并不会影响非参数核密度估计“让数据说话的本质”，即不会使通过估计得到的密度函数图像看起来像选定的核函数，比如一个使用正态密度函数作为核函数的密度估计图像并不会使结果看起来像正态分布。因此引入不同的核函数，不会造成增加新的假设约束的负面效果。在估计中无论使用哪个满足条件的函数作为核函数，都可以得到相同精度的估计结果，都能将样本所具有的分布特征体现出来。这就避免了传统参数检验对数据分布族假设错误的风险。但是，核函数的光滑性会传导给估计得到的密度函数，所以选择光滑的核函数对最终估计出的密度函数的分析性质有一定的改善。考虑到计算方便、拟合函数的光滑性，一般选用正态分布密度函数作为核函数进行拟合估计。

在核密度估计时，窗宽h的选择十分重要。对于窗宽而言，一方面，窗宽越小，核估计的偏差越小，但同时核估计的方差会变大；另一方面，窗宽越大，则核估计的方差会变小，但同时核估计的偏差却会增大。所以，窗宽的变化不可能既使核估计的偏差减小，又使核估计的方差较小。因此，最佳窗宽的选择标准必须在核估计的偏差和方差之间权衡，使得均方误差达到最小。满足此要求的窗宽主要有三种：

其中，IQR＝x［0．75］－x［0．25］是分位数极差，σ是标准差。Minoiu比较了三种窗宽的优缺点，指出h3既能够做到一定的平滑，又能够保留有偏度和峰度等一些重要的统计特征。因此，本文选择h3作为实证研究的窗宽。

（二）加权核密度估计

由于每个数据包含的信息不同，因此可以考虑对不同的数据赋予不同的权数，来刻画它们对潜在密度函数的贡献度。反映每个观测值对于密度函数都包含了不同的信息量，而不是相同的平均信息量1/n。在这种情况下，每个权重值会改变各个观测值跳动的高度，即。

设权重w1，w2，…，wn，满足＝1。这时对于一般的核密度估计的一个自然推广就是把公式（3－22）中的简单和用加权和来代替。具体形式如下：

（三）局部化窗宽的核密度估计

窗宽作为平滑参数，在非参数估计中一般是不变的。但从实际的角度来考虑，不难发现，如果窗宽可以随着样本点的不同而变化，那么估计结果将会有更大的改善。其思想是使窗宽包含较多的局部性质，也就是说，要有较多的信息可以利用来估计潜在的密度函数。因此，可以考虑让平滑参数窗宽局部化。当观测值较多时，肯定包含了比较多的信息在里面，所以此时可以选择一个较小的窗宽；反之，就选择一个较大的窗宽。

对于处于某个密度区的一个加权样本来说，它所包含的潜在密度函数f（x）的信息不仅与这个区域的观测数有关，而且和这些观测值所带的权重有关。因为此时，并不是所有的观测值都带有相同的信息含量。在样本是服从独立同分布的情况下时，观测值带有相同的权重1/n。而对于加权样本来说，我们认为，如果观测值的权重wi＞1/n，那么它包含有比观测值平均水平还要多的关于密度函数f（x）的信息。而相反如果wi＜1/n，那么它包含有比观测值平均水平少的关于密度函数f（x）的信息。具体构造一个加权样本的局部：窗宽的核密度估计的方法如下定义局部窗宽参数δi＝＝（nwi）－γ。这里γ是敏感参数，满足0≤γ≤1。类似的定义样本加权的局部窗宽核密度估计为：

这里h是全局平滑参数，而hδi就是在点xi处的局部平滑参数。

公式（3－28）在估计结构上是一个加权和，而通过局部窗宽化的过程，将权重wi引入到核函数当中。正如上文已经提到的，当观测值包含有比平均水平还要多的信息时，即nwi＞1，这时就会有一个比均值要小的平滑参数δi＜1；反之当观测值包含有比平均水平要少的信息时，nwi＜1，那么δi＞1。窗宽的局部化使得权重作为一个与各个观测值有关的密度指标被引入到核估计的过程当中。这样不仅会改变每个跳点的高度，而且会改变它的宽度，即，此时的密度估计函数（x）就是所有这些点的和。这里，对于敏感性参数，一般取γ＝0．5。

三、收入分布核密度估计

从统计学的角度看，居民的收入服从一定的分布，因此可以用一定的密度函数来描述收入的分布情况。利用局部化窗宽加权核密度估计来得到收入分布的概率密度函数f（x）

其中，K（·）是核函数，n为样本量，h为窗宽，hδi为最后估计时加在每个变量xi上的平滑量，将人口因素作为权重wi。在实际应用中，由于核函数的选取对估计结果的影响不大，所以笔者选取正态函数来做分析。

四、基于收入分布的收入不平等指标计算

在确定收入分布的基础上，利用两类指标共同测度收入不平等。一类是绝对差距指标，如平均差和标准差；另一类是相对差距指标，如变异系数，基尼系数等。以下就对各种指标的计算方法进行简单介绍。

（一）绝对差距指标计算

1．均值。均值表示收入的平均水平，计算公式如下：

2．平均差。平均差即离差绝对值的算术平均，用来衡量变量偏离平均水平的绝对程度，计算公式如下：

3．标准差。标准差又称均方差，主要用于说明变量值与平均水平的绝对偏离程度，数值越大，表示绝对差异越大，计算公式为：

（二）相对差距指标计算

1．变异系数。变异系数是指变量标准差与均值之比，反映变量值偏离平均水平的相对程度，计算公式为：

2．基尼系数。设收入低于y的人数占总人数的比例F（y）＝；收入低于　的人口总收入占全部人口总收入的比例y，那么此时的基尼系数表示为：^[6]

运用分部积分的方法有^[7]

公式（3－34）和（3－35）是计算连续分布基尼系数的常用公式。

五、基于收入分布的贫困指数计算

关于贫困的测度，本文采用福斯特、格林尔和索贝克（1984）提出的FGT贫困指数，其优点是计算方法成熟，而且三个指标全面反映贫困状况。FGT贫困指数的连续形式为：

其中，x为居民收入，f（x）是收入分布的密度函数，z表示贫困线。当α＝0时，P0为贫困发生率，贫困人口占总人口的比例，反映贫困的广度。当α＝1时，P1为贫困距指数，贫困人口的收入与贫困线之间的相对距离，反映贫困的深度。当α＝2时，P2为平方贫困距指数，度量贫困人口之间的收入不平等，反映贫困的强度。

第四节　非参数理论的收入不平等分解

本节将从两个方面介绍收入不平等的分解方法，一种是收入不平等的动态分解，另一种是收入不平等的空间分解。收入不平等的动态分解是本文的一个主要创新，其思想是在收入分布变化的分解基础上来实现收入不平等的动态分解。同样，对于贫困变化的分解也是建立在收入分布变化的分解之上，相比以往的贫困分解方法，本节采用的方法更加合理、准确。收入不平等的空间分解主要是利用泰尔指数可内部分解的特点来实现。

一、收入不平等动态分解

已有收入不平等变化的研究主要集中于某个具体指标的变化，如收入的不平等指标、贫困指标和平均收入指标等。这些不平等指标的变化，往往未能全面反映由于收入分布变化而导致的收入不平等变化。因此，研究结果具有一定的局限性。基于这样的考虑，本节试图对收入分布的变化展开分解，并以此为基础实现收入不平等变化的分解，研究导致收入不平等发生变化的内在原因。

思路如下：收入分布的变化可以从三个方面展开分解：收入分布位置的变化（平滑度），主要反映收入分布沿着收入水平的移动；收入分布形状的变化（分散度），主要反映收入分布离散程度的变化；其他分布特征的变化（聚集度），主要反映收入分布的聚集特征或俱乐部特征。具体分解过程为：

其中，Δf（x）表示收入分布的总体变化，CD1（x）、CD2（x）和CD3（x）分别表示收入分布的平滑度、分散度和聚集度，用来测度收入分布的位置变化，形状变化和其他特征变化。

为了估计CD1（x）、CD2（x）和CD3（x），笔者利用了基于密度函数变换的思想。具体来说，假定存在一个刻画基期（用下标0表示）和报告期（用下标1表示）收入关系的变换函数g（x），使得x1＝g（x0），那么此时基期和报告期的概率密度函数之间存在如下关系：

通过选择不同的变换函数g（x），可以构造出各种反事实的概率密度函数，反映收入分布变化的各种特征。例如，为了反映收入分布的平滑度和分散度的变化，可以尝试构造线性变换函数。假定基期和报告期的收入关系是如下线性函数：

α、β为待估计参数，由此得到反事实的概率密度函数为：

其中，ζ（x）为基于线性变换的概率密度函数，而f（x）为实际的基期或报告期的概率密度函数。通过估计不同的参数α、β来反映收入分布的各种不同变化。

（一）收入分布位置变化

为了反映收入分布沿着收入水平移动，即变换后收入分布的均值相比基期水平增加a，而方差保持不变，可令线性变换函数为：

收入的上述变换保证了收入分布仅发生位置变化而形状不变的变化需要^[8]。由此，可以构造出一个反映均值收入变化的反事实概率密度函数ζ1（x）^[9]。

（二）收入分布形状变化

现在，再考虑收入分布形状的变化，它反映概率密度函数围绕不变均值的分散度的变化。如果将报告期的收入看成是基期收入和基期平均收入的线性组合，那么

收入的上述变化满足报告期收入的平均水平维持在基期，但其方差却增加s2的变化需要^[10]。此时，反事实的概率密度函数ζ1（x）^[11]反映收入分布在均值不变条件下的分散度增加。

（三）收入分布位置和形状变化

将以上两种变换的思想相结合，就可以构造出既反映收入分布均值变化，又反映收入分布形状变化的反事实的概率密度函数ζ1（x）^[12]，即参数α，β满足：

将以上三种变换过程相结合，就可以得到收入分布变化的分解方程：

在公式（3－44）的基础上，研究收入分布各分解变化的情况以及它们对收入总体变化的作用效果。以上三种收入分布的变化分解可以计算相应的收入不平等指标，由此达到对收入不平等动态分解的目的。

二、收入不平等空间分解

为了考察区域内以及区域间收入不平等对地区收入不平等的影响程度，可以对地区收入不平等进行空间分解。收入不平等指标泰尔指数具有在不同区域间分解的性质，即地区收入不平等可以分解为区域间收入不平等和区域内收入不平等，从而有利于观察两种收入不平等的变动幅度以及各自对地区收不平等变动的贡献。如果将一个地区按一定的方法和原理分为k个组（区域），则泰尔指数可分解为：

公式（3－45）中，i表示组数（区域数），Vk是第k组人口比重；I0k是第k组零阶泰尔指数；是第k组的平均收入，是总平均收入。这样就可以将收入不平等分解为组内收入不平等（VkI0k）和组间收入不平等（）。

三、贫困变化分解

大多数关于贫困变化分解的研究是使用Datt和Ravallion （1992）提出的方法，与之类似的还有Kakwani和Subbarao（1990）与Jain和Tendulkar（1990）等提出的方法。这三种方法都具有路径依赖性^[13]。此外，前两种方法在收入水平和收入分配同时变化时，不是分解不完全，就是存在一个非零的剩余项。具体来说，ΔP表示贫困指数的变化，并假设收入Y和贫困线z都是以真实值衡量。时期0和时期T之间的贫困变动可以写成：

贫困变动中的增长成分指在保持收入Y的分布不变前提下，Y的均值变化而导致的贫困变化。贫困变动中的不平等或再分配成分指在保持收入Y的均值不变前提下，Y的分布变化所导致的贫困变化。如果假设存在一个洛伦兹曲线为Li、均值为μj（i≠j）的收入分布Y（Li；μj），用P（Li；μj）代表与Y（Li；μj）相应的贫困指数，则Datt－Ravallion分解法中的增长成分ΔP可以表示为：

或者：

类似地，再分配成分可以表示为：

或者：

使用上述增长成分与再分配成分定义的不同组合可得出对ΔP的四种不同分解结果。如果使用（3－47）和（3－49）两个公式的组合，则时期0是参考点；而如果选择公式（3－48）和（3－50）的组合，则时期T是参考点。这两种分解的结果不一定相同，而且由于其增长成分与再分配成分之和不等于ΔP，这两种分解都不完全。但是，如果将以上两种分解组合，则可以得到ΔP的完全分解：

然而，在等式（3－45）和（3－46）中，度量再分配成分与增长成分的参照点不同。一般来说，它们产生的分解结果也会不同。任何在二者之间的取舍都具有很大的随意性。为了权衡两者，可以考虑取两者的平均值，这样就可以解决上述由参照点不同而造成的问题：

公式（3－53）的分解方法可以运用合作博弈理论对其进行理论证实和推导（Shorrocks，1999；Konenikoof and Shorrocks，2005）。除了所用符号的不同外，公式（3－53）与Shorrocks（1999）使用Shapley值推导出来的结果完全相同。据此，可以将贫困变动中的增长成分G和再分配成分I定义为：

以上分解方法既是对称的，也是完全的。

第五节　本章结论

本章是关于地区收入不平等研究方法的具体介绍。首先，回顾了已有的各种不平等测度指标和贫困测度指标；然后，介绍了非参数理论中的核密度估计理论，并将其用于收入分布的拟合；最后，建立在收入分布的基础上给出了收入不平等和贫困测度的研究方法，以及基于收入分布变化分解的收入不平等动态分解和贫困变化分解。本章从方法论的角度论证了本研究的理论价值，主要结论如下。

1．评述已有的各种收入不平等指标的发展由来、计算方法、适用范围和特点。虽然有众多测度不平等程度的指标，但各指标都有一定的局限性，如基尼系数无法反应内部不平等程度，而泰尔指数仅仅关注各组之间差距，分位数也只考虑局部相比较的不平等程度。因此，为了全面衡量不平等程度，应该考虑结合多个指标一起来分析。

2．贫困水平的衡量包含多个方面，除了较常见的贫困发生率指标外，测度贫困人群摆脱贫困的程度和贫困人群内部的不平等程度也是同样需要考虑的问题。因此，对于贫困的度量应该结合这三个方面展开，这为本文测度贫困水平提供了理论依据。

3．介绍了非参数理论中的核密度估计方法，通过该方法实现了收入分布密度曲线的连续型拟合，解决了长久以来学术界无法准确刻画收入分布特点的难题。更为重要的是，本文建立在收入分布的基础上，给出了各种收入不平等指标和贫困指标的计算方法。将非参数理论融入到收入不平等指标的计算是一个全新的尝试。

4．提出基于收入分布变化分解的各种收入不平等指标和贫困指标的变化分解方法。本节将非参数理论和反事实变换两种思想方法相结合，创造性的给出了收入分布变化的分解方法，即将收入分布的变化分解为收入分布位置变化、收入分布形状变化和收入分布其他变化。通过分析这三种变化来实现对收入不平等动态分解和贫困变化分解的目的。为后文收入不平等相关问题的实证研究提供方法指导和理论支撑。

【注释】

[1]阿马蒂亚·森：《贫困与饥荒》，商务印书馆2001年版。

[2]排序的相对贫困公理：从相对贫困的角度考虑，第i个贫困者收入缺口的权重Vi取决于这个人与同一参照组中其他人的相对地位。如果参照组是贫困群体，那么相对地位就是第i个人在贫困群体的集合中的排序r（i）。这是权重Vi的一个重要决定因素。如果Vi能够被构造成r（i）的增函数，那么，权重就代表第i个人在贫困群体的集合中的排序。V（i）＝r（i）即排序的相对贫困公理。

[3]标准化的绝对贫困公理：贫困发生率和贫困缺口率对贫困群体内部的收入分配不敏感，如果不存在收入分配问题，那么这两者的结合是充分的。也就是说，当所有的贫困者都具有相同的收入时，贫困发生率H和贫困缺口率I的结合应该是完全充分的，而结合的最简单方式是两者的乘积，即对所有i∈T，yi＝y＊，则有，P＝HI。

[4]转移敏感性公理指贫困者的收入水平越高，从他们那里进行相同水平的收入转移时，对全社会贫困程度的影响就越小。

[5]子集单调性公理指如果部分成员的贫困程度加重，则整个社会的贫困程度亦加重，任何部分成员的贫困程度减轻，则整个社会的贫困程度也随之减轻。

[6]