在数据分析中,首先使用描述性统计手段了解样本数据的基本特点。其次,根据创新产出的2个因变量指标与影响创新产出的自变量指标,分别建立2个模型对前期设立的4个假设进行检验。模型(一),产品创新对企业总营业额的影响。模型(二),工艺创新对企业总营业额的影响。模型(三),市场创新对企业总营业额的影响。模型(四),组织创新对企业总营业额的影响。
在统计分析中,传统OLS模型会将排序数据视为基数,导致人为的信息膨胀,Multinomial Logistic不考虑数据内在排序,会使得统计结果因为排序信息的遗失而让统计效率受损,但是Ordered Logistic模型可以很好地解决这方面的不足,在社会科学实证研究中得到较为广泛的运用。例如,何海燕、王子文等人运用Ordered Logistic模型研究了我国产学研协同创新影响因素;伦晓波、许林萍等人运用Ordered Logistic模型进行了创新环境影响企业创新水平的非平衡效应的研究。因此本书把Ordered Logistic有序回归分析作为检验假设的基准模型,以模型(一)为例,以下阐述数理模型的基本原理。
建立模型。以分析自变量x1,x2,…,x22对因变量产品创新y的影响程度为例建立Ordered Logistic模型。本文采用五分法进行数据收集,因此自变量与因变量的评价等级j取值由低到高依次为1,2,3,4,5。
定义产品创新y满意度指数的数学模型为:
其中,x=(x1,x2,…,x22)T表示由本文所设的22个自变量组成的向量,β=(β1,β2,…,βi)表示系数向量,ε服从Logistic分布,其分布函数为:
将U的取值利用四个临界点α1,α2,α3与α4分为五个等级。于是,因变量取不同评价等级的概率可借助于Ordered Logistic模型具体表示为:(www.xing528.com)
模型求解。假设现有n组观测数据,具体为xi,yi,i=1,2,3,…,n。
定义一组哑变量:
那么第i个个体做出相应评价的概率为:
其中,P(yi=j)的取值计算表达式由(10-1)式给出。于是,由所有样本观测值所决定的似然函数为:
最大化该似然函数即可得未知参数的估计值。在本书大样本数据分析中运用SPSS 17.0分析软件中的Ordered Logistic回归进行上述模型参数的求解。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。