城市管理紧缺人才8个大类、48个子类的人才数量紧缺指数、人才质量紧缺指数和人才供给紧缺指数均采用专家打分的方法,通过聚类分析的方法对多名专家的打分值进行分析判断,得到每一类的标准分。
6.2.4.1 聚类分析理论
聚类分析是一种应用性很强的数学方法,已经广泛应用到工程技术中的许多领域。它的基本原理就是在没有先验知识的情况下,基于“物以类聚”的观点,用数学方法分析各模式向量之间的距离及分散情况,按照样本的距离远近划分类别。由于事物的复杂性,聚类对象之间的界限往往是不清晰的。例如,在本次研究分析中,就众多专家对人才数量紧缺指数、人才质量紧缺指数和人才供给紧缺指数的打分来说,由于不同的因素混杂在一起,使得这种不清晰性更加突出。因此,需要利用模糊聚类技术来客观地描述具有不分明性的对象,从而使实际的聚类结果更加合理。
模糊C-均值聚类算法(FCM)是模糊聚类中应用最广泛的方法,它通过优化目标函数得到每个样本点对所有类中心的隶属度,从而决定样本点的类属以达到自动对样本数据进行分类的目的。假设样本集合为X={x1,x2,…,xn},将其分成C个模糊组,并求每组的聚类中心Cj(j=1,2,…,C),使目标函数达到最小。
FCM用模糊划分,使得每个给定数据点用值在[0,1]间的隶属度来确定其属于各个组的程度。与引入模糊划分相适应,隶属矩阵U允许有取值在[0,1]间的元素。一个数据集的隶属度的和总等于1:
那么,FCM的价值函数(或目标函数)就是:
这里uij介于[0,1]间;ci为模糊组i的聚类中心,dij=||ci-xj||为第i个聚类中心与第j个数据点间的欧几里德距离;且m∈1,∞[)是一个加权指数。
构造如下新的目标函数,可求得使(6.2)式达到最小值的必要条件:
这里,λj(j=1~n)是(6.1)式的n个约束式的拉格朗日乘子。对所有输入参量求导,使式(6.2)达到最小的必要条件为
和
由上述两个必要条件,模糊c均值聚类算法是一个简单的迭代过程。通过FCM确定聚类中心ci和隶属矩阵U[1]:
6.2.4.2 采用MATLAB进行聚类分析的基本程序语句
本次模糊C-均值聚类算法(FCM)采用MATLAB进行,MATLAB所用到的基本函数是fcm,其调用格式为
[CENTER,U,OBJ_FCN]=fcm(DATA,N_CLUSTER,OPTIONS)
参数说明如下:
(1)fcm:Data set clustering using fuzzy c-means clustering.
即从数据集DATA中找出N_CLUSTER个类集;
(2)输入数据:DATA(M-by-N),M是样本点数,N是数据维数;
(3)CENTER:其每行代表某个(类)的中心;
(4)U:DATA中的每个数据点对某个类的隶属度。其列数等于样本数,行数等于N_CLUSTER。
(5)OBJ_FCN:目标函数,每次迭代生成一个,反映了算法的收敛情况。
(6)OPTIONS:一个向量,规定了算法的可选参数:(www.xing528.com)
OPTIONS(1):exponent for the matrix U(default:2.0)
该参数又称为“模糊系数”。
OPTIONS(2):maximum number of iterations(default:100)
OPTIONS(3):minimum amount of improvement(default:1e-5)
OPTIONS(4):info display during iteration(default:1)
当使用默认值时,使用参数NaN。
聚类过程的结束条件:达到最大迭代次数,或者两次相邻迭代目标函数的改善值小于最小改进值。
这一算法中,模糊系数m(m>1),即OPTIONS(1)的选取十分关键。
m→1,则趋于硬分类;m→∞,则越模糊。
一般情况下,原始数据聚类性质较明显时,m可适当取大点;若样本数量较多,m可取小点,但并无特定的规则,需要多次尝试后确定。
6.2.4.3 人才紧缺程度评分值聚类分析
现有n名专家对上海城市管理紧缺人才的每一类人才的数量紧缺指数、人才质量紧缺指数和人才供给紧缺指数等3个指标进行了打分,打分值在0~10之间,打分值越高表明紧缺程度越高。n名专家的打分值构成一个n×3的矩阵。
首先对这组矩阵数据进行归一化处理,然后采用模糊C-均值聚类算法的FCM函数进行聚类分析。
本次研究聚类种类数取值为三类,这代表着对于同一种类型的紧缺人才,众多专家的打分可呈现为“乐观”“适度”“保守”三类。通过聚类,将n名专家的打分分为三类,类中心矩阵Cij(其中i为聚类种类数,i=1,2,3;j为指标数,j=1,2,3)。通过隶属度分析,得到每一类的隶属概率,组成一个1×3的隶属度概率矩阵Ui(i=1,2,3),最终的类中心为:Gi=Cij×Ui,该值即为某一类紧缺人才在数量紧缺指数、人才质量紧缺指数和人才供给紧缺指数三方面的最终评分值。
采用MATLAB程序计算,对专家打分数据进行处理,得到上海城市管理紧缺人才8个大类、48个子类的数量指数、质量指数、供给指数的最终评分值见附表6-6和附表6-7。
附表6-6 上海城市管理紧缺人才8大类专家打分聚类结果
(续表)
附表6-7 上海城市管理紧缺人才48子类专家打分聚类结果
(续表)
(续表)
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。