山西省支付清算数据挖掘分析研究
资金是反映实物资产流动和金融资产流动的金融流量,资金流动是影响经济增长的重要因素,任何区域的经济运行事实上都离不开资金的参与。支付清算数据是经济社会资金往来的真实数据,对蕴含的资金流量、流向等信息进行分析将有助于揭示经济金融运行趋势和特点,提供决策参考信息。
一、开展山西省支付清算数据分析研究的背景和意义
当前,我国经济金融运行正向宏观调控的预期方向发展,但经济金融发展面临的形势依然复杂,世界经济继续缓慢复苏,但面临的风险因素仍然较多,我国经济继续平稳较快发展,通胀压力有所缓解但仍处在高位。从山西省情况分析,全省经济延续上年以来持续向好势头,各项主要经济指标均保持较快增长,但经济运行中也存在一些需要高度关注的问题,主要是物价上涨过快、消费价格偏高,一些项目融资困难,部分行业效益下滑等。因此,当前经济运行中不稳定和不确定因素仍然较多,如何处理好国家宏观政策收紧与山西省经济发展之间的关系、保持经济平稳较快发展与经济结构调整之间的关系、经济发展与资源环境可承受力之间的关系、经济发展与管理通货膨胀预期的关系仍是当前面临的难题,正确分析和判断山西省经济金融形势成为当前重要研究内容。
在当前形势下,为进一步加强宏观调控,支持地方经济转型跨越发展,人民银行总行要求我们进一步采取有效措施,切实加强经济金融运行监测分析工作,科学研判经济金融走势,及时发现和研究经济金融运行中出现的新情况、新问题,并提出具有前瞻性、预见性、有效性的政策建议。
2011年是山西省转型跨越发展的关键之年,也是山西省转型综改试验区建设起步之年,山西省委、省政府提出转型跨越发展,在建设国家新型能源和工业基地的基础上,建设全国重要的现代制造业基地、中西部现代物流中心和生产性服务业大省、中部地区经济强省和文化强省,再造一个新山西的宏伟战略目标。同时,也对金融部门的经济金融运行分析也提出了更高的要求,迫切需要更多能真实反映山西省资金流入流出、流量流向情况的分析材料,以期能够反映经济金融形势变化特点及存在的问题。因此,做好支付清算数据挖掘分析研究工作,对于支持宏观调控和全省经济转型跨越发展有着重大而现实的意义。
二、支付清算数据挖掘分析研究现状
资金是反映实物资产流动和金融资产流动的金融流量,资金流动是影响经济增长的重要因素,任何区域的经济运行事实上都离不开资金的参与。支付清算数据是经济社会资金往来的真实数据,对蕴含的资金流量、流向等信息进行分析将有助于揭示经济金融运行趋势和特点,提供决策参考信息。人民银行总行清算总中心领导高度重视数据分析工作,多次提出开展数据分析研究设想。然而,长期以来,全国各地在支付清算数据分析工作中,主要关注了综合性信息,而忽略了支付系统中零散却很有意义的数据信息,造成大量可挖掘数据信息白白流失,支付清算数据资源没有得到有效利用。
人民银行太原中心支行运行着中国现代支付系统,业务涵盖山西省跨行、跨省市的资金支付以及国库资金收付,是全省资金汇划和资金清算的重要平台和核心枢纽,包含了全省的主要资金运动,是山西基本经济现象的主要资金反映。据测算,2010年全省通过大小额支付系统清算资金量占全省全部支付业务(包括大小额支付系统、同城票据清算系统、银行业金融机构行内支付系统、银行卡跨行支付系统)的74.4%,是山西省资金汇划主渠道,有丰富的可挖掘数据资源。如何有效通过开展山西省支付清算数据信息挖掘分析研究,从支付清算资金流独特视角,对山西支柱产业、重点行业资金运动走势进行描述,对山西经济金融运行趋势做出判断,为领导决策提供有价值的决策参考信息,这将对助推山西经济转型跨越发展以及进一步提高人民银行金融服务水平具有重要意义,也是摆在我们面前的一项重要课题。
从2010年3月开始,人民银行太原中心支行清算中心依托山西省大小额支付系统数据优势,探索性地开展了山西省支付清算数据挖掘分析研究工作,对山西省大小额支付系统往来资金流量流向进行分析。该工作作为人民银行太原中支的重点工程,经过可行性研究、研究方法确定、辅助系统开发、数据加工与校准、撰写分析报告、安全管理、规范化管理等一系列研究,从2010年10月开始,按月度和季度撰写《山西省支付清算数据分析》。分析材料定期呈送给山西省委、省政府领导和有关经济部门,人民银行清算总中心、人民银行太原中心支行领导及有关处室,全省商业银行一把手及分管领导,得到了人民银行总行和山西省政府主要领导的高度肯定和评价。
三、山西省支付清算数据挖掘分析的主要做法
2010年以来,人民银行太原中心支行清算中心发挥山西省大小额支付系统数据优势,创造性地开展了山西省支付清算数据挖掘分析研究工作,对山西省大小额支付系统往来资金流进行分析,通过结构化的关联模式以及时序关系、分类关系等分析,筛选出重点信息,进而根据信息特征进行加工整理,对重点问题进行深度挖掘,变“过路信息”为“有用信息”,取得了一定成效。主要做法有:
(一)领导高度重视,为数据挖掘分析工作指明方向。人民银行太原中心支行党委书记、行长赵志华亲自提出并谋划指导,由清算中心独立开展对山西省支付清算系统数据信息进行挖掘分析研究工作,并作为人民银行太原中心支行的一项重点工程。
(二)成立数据挖掘分析小组,建立分析人员队伍。根据山西省支付清算数据挖掘分析工作需要,选派具备统计、计算机等数据挖掘相关专业知识的人员组成数据挖掘分析小组,为顺利开展支付清算数据挖掘分析提供人员保障。
(三)开展可行性研究,确保数据挖掘分析项目可行。2010年3月,我们组织人员开展对山西省支付清算数据挖掘分析的可行性研究,提取出部分支付清算样本数据信息,逐一进行研究并讨论分析,从分析因素、分析方法、分析形式等方面论证了工作的可行性,为支付清算数据挖掘分析顺利开展打下了坚实基础。
(四)在如何有效利用支付清算数据上下功夫,变粗放式分析为精细化分析。一是用科学的方法将大量企业进行行业分类,解决过去无法进行行业分析的难题,实现了行业资金运动的可比性,为利用行业数据进行深入分析打下了基础。二是根据山西省主要以“煤、焦、冶、电”为主的产业结构特点,创设单位类分析新方法。为针对性地分析山西省产业经济运行特点创造了条件。
(五)增加延伸分析和理论研究,将支付清算数据分析引向深入。一是开展延伸分析,围绕热点问题、难点问题和资金流反映出来的特征进行挖掘,及时发现资金流变化规律,揭示支付清算数据变动背后的深层次原因。二是加强理论研究,通过建立理论模型,对支付清算数据与宏观经济数据之间的定量关系进行理论研究,为经济运行趋势判断提供实证分析。
(六)通过技术手段,增强工作效率和质量。开发山西省支付清算数据信息管理系统,作为辅助分析系统,对支付清算数据进行自动加工处理,提供数据查询并自动生成报表、图表等,有效提升了工作效率,同时确保数据计算准确无误。
(七)加强安全管理,建立支付清算数据安全屏障。开展山西省支付清算数据挖掘分析研究,安全保密是前提。一是加强安全保密教育,提升安全保密意识。二是制定一系列安全保密制度,确保支付清算数据安全保密。
(八)梳理工作流程,提升数据挖掘分析研究规范化。支付清算数据挖掘分析研究工作流程主要分为数据准备、数据基本分析、数据深入挖掘分析、分析报告提交四个阶段。一是数据准备阶段,包括生产系统备份数据导入分析系统,添加行业分类信息和单位类分类信息,生成各类报表并提供数据查询。二是数据基本分析阶段,通过纵向或横向比较和运算,对山西省整体资金流向和特点进行分析。三是数据深入挖掘分析阶段,包括热点问题分析、延伸分析、理论研究等部分。四是分析报告提交阶段,将支付清算数据分析报告定期递交有关领导,为领导决策提供参考。
(九)建立人民银行与商业银行信息共享交流机制,拓宽支付清算数据行业产业信息“活”情况来源渠道。开展支付清算数据挖掘分析研究,商业银行与经济运行中各类企业联系紧密,对企业经营情况有深入了解,对经济运行中的问题有直观见解,具有独特的信息优势。通过将人民银行的数据优势与商业银行的信息优势加以互补和整合,由商业银行向人民银行提供支付清算数据变动背后的“活”情况,人民银行向商业银行反馈分析结果,通过交流实现信息共享,有效提升山西省支付清算数据挖掘分析的层次和水平。
四、山西省支付清算数据实证分析研究
本文对山西省支付清算资金量与山西省GDP、CPI、PPI等地方宏观经济指标之间关系进行了实证分析,结果表明,山西省支付清算资金量与山西省GDP、CPI、PPI等地方宏观经济指标之间具有较强相关关系,并得出相应的定量模型,能够为预测宏观经济数据提供决策参考。
(一)山西省支付清算系统资金流对山西省GDP增长影响的实证分析
地区GDP可以综合反映一个地区经济增长状况,也是宏观经济运行趋势的反映,GDP数据需各级统计人员层层汇总得出,计算周期较长;而支付清算资金流反映了一段时期内真实发生的资金往来情况,计算机可以自动统计每日资金往来数据,实时汇总得出支付清算资金流规模,时效性极强。如果可以揭示二者的近似定量关系,将有助于通过支付系统真实发生的资金流量近似动态反映宏观经济运行态势,提供动态决策信息参考。
本文通过协整理论和VEC模型研究支付清算资金流与地区GDP之间的定量关系,进行实证分析。研究结果表明,在5%置信水平下,山西省支付清算系统资金流可以动态预测山西省地区GDP变化,山西省支付清算系统资金流每增加1%,山西省地区GDP增加0.294%,从而定量刻画了山西省支付清算系统资金流对山西省地区GDP的影响程度。
1.数据收集与整理
本次数据采用2008年一季度至2010年四季度的季度数据,支付清算系统资金流直接使用山西省季度支付清算系统清算金额(简写为:PS,单位:亿元),地区GDP使用山西省季度GDP增加值(简写为:GDP,单位:亿元),原始数据如图1所示:
图1 支付清算系统金额与地区GDP折线图
为消除数据中存在的异方差,首先我们将支付清算系统资金流(PS)和山西省季度GDP增加值(GDP)取自然对数,分别记为LPS和LGDP。对LPS与LGDP做散点图(见图2),可以看出,图中点近似集中于一条直线附近,可能蕴含着某种定量关系。
图2 LPS与LGDP散点图
2.实证分析方法
对非平稳时间序列建模时,往往存在“伪回归”问题,这就需要把数据进行变换,以满足平稳性。常用的方法就是对非平稳序列进行差分,然后用差分后的序列进行建模,但是,这样做会丢失一些有用的长期信息。1987年,Engle和Granger提出的协整理论及其方法,为非平稳的多变量时间序列分析提供了有力的理论和方法。虽然一些经济变量本身是非平稳序列,但是他们的线性组合却有可能是平稳的,这种平稳性体现了各变量之间存在长期稳定的均衡关系,并可通过向量误差修正模型(Vector Error Correction,VEC)调整短期内各变量对长期均衡关系的偏离。
具体分析步骤如下:
(1)对各个序列进行单位根检验。因为只有具有相同单整阶数的序列才有可能存在协整关系,所以首先需要对各个序列进行单位根检验以检验各序列的平稳性。在这里,我们使用ADF(Augmented Dickey-Fuller Test)进行序列的单位根检验。
(2)协整检验。由于VEC模型的表达式仅仅适用于协整序列,所以先进行协整检验,并确定协整关系数。协整检验的方法主要有EG(Engle-Granger)两步法和JJ(Johansen-Juselius)检验法。虽然EG两步法比较容易实现,但其检验方式存在一定欠缺性,在第一阶段需要设计线性模型进行OLS估计,应用不方便,而且样本容量越小,偏差越大。Johansen与Juselius提出的以向量自回归模型为基础检验回归系数的方法,是一种进行协整检验的较好方法。本文采用JJ检验法。
(3)建立VEC模型。一个协整体系由多种表示形式,用VEC模型表示是当前处理这种问题的普遍方法。可以利用VEC模型建立各个变量之间的短期均衡关系,将长期均衡关系作为误差修正项纳入方程中,以反映短期波动偏离长期均衡的程度。
(4)VEC模型检验。可以利用Granger因果检验对VEC模型各方程系数的显著性进行联合检验,从而判别各变量因果关系。
3.模型估计与检验
(1)ADF检验。首先对变量的平稳性进行检验,同时考察变量的单整阶数。由表1的单位根检验结果可以看出,各时间序列均为一阶单整序列,可以运用协整方法分析它们之间的动态关系。
表1 LPS和LGDP时间序列的单位根检验结果
注:检验形式(c,t,k)分别表示带有常数项和趋势项,k表示滞后阶数。
(2)协整检验。本文采用JJ(Johansen-Juselius)检验法进行协整检验,协整滞后区间选取(1,2),迹统计量和最大特征值检验结果分别见表2和表3。
表2 迹统计量检验结果
表3 最大特征值检验结果
(3)VEC模型和协整关系。由协整检验结果可知,LPS与LGDP之间存在一个协整关系,得到标准化协整回归模型如下:
LGDP=0.294*LPS+4.336 (1)
式(1)表明:山西省支付清算系统资金流增加1%,山西省地区GDP将增加0.294%,从而定量刻画了山西省支付清算系统资金流对山西省地区GDP的影响程度。
(4)VEC模型检验。利用Granger因果检验对VEC模型(1)方程系数的显著性进行检验,检验结果见表4。
表4 Granger因果检验结果
Granger因果检验显示,在5%置信水平下,LPS是LGDP的Granger原因,相反则不成立。因此,可以用山西省支付清算系统资金流动态预测山西省地区GDP变化,反之不成立。
4.实证分析结论
综上,通过协整理论和VEC模型对支付清算系统资金流与地区GDP之间的定量关系进行了实证分析,得出如下结论:
(1)山西省支付清算系统资金流可以动态预测山西省地区GDP变化;
(2)山西省支付清算系统资金流每增加1%,山西省地区GDP增加0.294%。
上述实证分析结果验证了由山西省支付清算系统资金流动态预测山西省地区GDP变化的可行性,并且定量刻画了山西省支付清算系统资金流对山西省地区GDP的影响程度,为通过支付系统真实发生的资金流量动态反映宏观经济运行态势提供了实证依据。
(二)山西省支付清算资金流对CPI影响的实证分析
居民消费价格指数,简称CPI,是度量消费商品及服务项目价格水平随着时间变动的相对数,反映居民购买的商品及服务价格水平的变动情况,通常作为观察通货膨胀水平的重要指标。自2009年2月以来,CPI指数总体呈上升趋势,一路上扬,山西省CPI指数从98.2上升至105.1,全国CPI指数从98.4上升至105.4,特别是2010年11月以来,山西和全国CPI指数持续在105高位附近波动(见图3)。
图3 2009年1月至2011年3月CPI指数走势图
CPI持续走高直接影响到居民的购买力,影响到居民消费水平,在一定程度上反映了当前较强的通货膨胀压力,因此,CPI及未来CPI预期成为近期社会高度关注话题之一。支付清算资金流反映了一段时期内真实发生的资金往来情况,计算机可以自动统计每日资金往来数据,实时汇总得出支付清算资金流规模;如果可以揭示二者的近似定量关系,通过支付清算资金流预测未来一段时间CPI走势,对政府宏观调控及央行制定货币政策具有积极意义。
本文通过研究山西省支付清算资金流与山西省CPI之间的定量关系,进行实证分析。研究结果表明,山西省支付清算资金流同比增长1%,山西省CPI三个月后将增加0.069,从而定量刻画了山西省支付清算资金流量变化与山西省CPI增减的关系。
1.数据收集与整理
本次数据采用2009年1月至2011年3月的月度数据,CPI直接使用山西省CPI数据,支付清算资金流使用山西省月度支付清算金额,为加强可比性,将支付清算资金流按照CPI指数计算方法进行处理,得到支付清算资金流与上一年对应月份同比指数(简写为:PSI),原始数据如图4所示:
图4 支付清算金额同比指数PSI与CPI折线图(www.xing528.com)
从图4可以看出,山西PSI与山西CPI存在某种相似变化趋势,总体上来看,山西PSI上涨或下降之后一段时间,CPI也发生类似趋势。
2.模型估计与检验
(1)绘制散点图。由于CPI是在物价已经发生变化之后才反映出来,是滞后数据,而PSI是当前真实发生的资金流,是现实数据,因此CPI较PSI存在一定滞后期;同时,图23也显示出PSI的变化先于CPI的变化,所以,首先应确定CPI滞后期。
分别对PSI各滞后期与CPI做散点图(见图5):
图5 PSI滞后1-4期与CPI散点图
从图5可以看出,PSI滞后2期和3期与CPI散点图中点近似集中于一条直线附近,因此,初步确定滞后期为2或3期。
(2)拟合模型。根据散点图显示CPI与PSI呈近似线性关系,设定模型如下:
CPI=α+β×PSI(-k)
其中k为滞后期。
我们按滞后2期、3期分别建立回归模型,即:
模型1:
CPI=α+β×PSI(-2)
模型2:
CPI=α+β×PSI(-3)
模型拟合结果如下:
表5 模型1拟合结果(滞后2期)
R2=0.655,F统计量=43.7
表6 模型2拟合结果(滞后3期)
R2=0.674,F统计量=45.4
表5、表6显示,两个模型对应的F统计量分别为43.7和45.4,说明线性模型高度显著;系数检验对应的t统计量分别为6.61和6.74,说明作为回归自变量的PSI系统高度显著;判定系数R2分别为0.655和0.674,说明模型2优于模型1。
因此,最终得到回归模型如下:
CPI=92.312+0.069×PSI(-3)
3.实证分析结论
综上,本文通过对山西省支付清算资金流同比指数PSI与山西省CPI之间的定量关系进行了实证分析,得出如下结论:山西省支付清算资金流同比增长1%,山西省CPI三个月后将增加0.069。
上述实证分析结果定量刻画了山西省支付清算资金流量变化与山西省CPI增减的关系,为通过支付系统真实发生的资金流量动态反映宏观经济运行态势提供了实证依据。
(三)山西省支付清算资金流对PPI影响的实证分析
PPI即生产者物价指数(Producer Price Index),亦称工业品出厂价格指数。PPI是衡量工业企业产品出厂价格变动趋势和变动程度的指数,是反映某一时期生产领域价格变动情况的重要经济指标,也是制定有关经济政策和国民经济核算的重要依据。如果生产物价指数比预期数值高时,表明有通货膨胀的风险。如果生产物价指数比预期数值低时,则表明有通货紧缩的风险。目前,我国PPI的调查产品有4000多种(含规格品9500多种),覆盖全部39个工业行业大类,涉及调查种类186个。
根据价格传导规律,PPI对CPI有一定的影响。PPI反映生产环节价格水平,CPI反映消费环节的价格水平。整体价格水平的波动一般首先出现在生产领域,然后通过产业链向下游产业扩散,最后波及消费品。PPI作为CPI的先行指标,同时也是作为观察通货膨胀水平的重要指标,准确预测PPI将对政府宏观调控及央行制定货币政策具有积极意义。
1.数据收集与整理
本次数据采用2009年1月至2011年3月的月度数据,PPI直接使用山西省PPI数据(简写为:SXPPI),支付清算资金流使用山西省月度支付清算金额,为加强可比性,将支付清算资金流按照PPI指数计算方法进行处理,得到支付清算资金流与上一年对应月份同比指数(简写为:SXPSI),原始数据如图6所示:
图6 支付清算金额同比指数SXPSI与SXPPI折线图
从图6可以看出,山西PSI与山西PPI存在某种相似变化趋势,总体上来看,山西PSI上涨或下降之后一段时间,PPI也发生类似趋势。
2.模型估计与检验
由于PPI是在物价已经发生变化之后才反映出来,是滞后数据,而PSI是当前真实发生的资金流,是现实数据,因此PPI较PSI存在一定滞后期。
设定模型如下:
SXPPI=α+β×SXPSI(-k)
其中k为滞后期。
经过对比选择,确定滞后期为3期,即:
SXPPI=α+β×SXPSI(-3)
表7 模型拟合结果
表7显示,模型对应的F统计量为48.47359,说明线性模型高度显著,即设定线性模型是正确的;系数检验对应的t统计量分别为6.592117和6.962298,说明作为回归自变量的SXPSI系统高度显著,即SXPSI(-3)和常数项均应保留在模型中;判定系数R2为0.687826,说明模型反映了数据中68.8%的信息。
因此,最终得到回归模型如下:
SXPPI=49.7869+0.3686×SXPSI(-3)
3.模型预测稳定性分析
为进一步分析上述模型的预测稳定性,根据模型将各月SXPSI代入计算SXPPI的预测值,并与真实值进行比较,将模型预测值、真实值及残差作图如图7。
图7 模型预测值、真实值及残差图
从图7可以看出,模型SXPPI预测折线(即图中Fitted)与SXPPI真实值折线(即图中Actual)趋势基本一致,说明模型大体可以预测出SXPPI变动趋势。同时,从图7也可以看出,模型SXPPI预测折线比较曲折,而SXPPI真实值折线比较平缓,因此,下一步拟通过扩充数据区间、增加经济指标等方法进一步提高预测精度。
4.实证分析结论
综上,本文通过对山西省支付清算资金流同比指数PSI与山西省PPI之间的定量关系进行了实证分析,得出如下结论:山西省支付清算资金流同比增长1%,山西省PPI三个月后将增加0.3686。
上述实证分析结果在一定程度上定量刻画了山西省支付清算资金流量变化与山西省PPI增减的关系,为通过支付系统真实发生的资金流量动态反映宏观经济运行态势提供了实证分析依据。
五、结束语
虽然山西省支付清算数据挖掘分析研究工作取得了一定成效,但还需进一步深化完善。下一步将增加分析深度,把数据流特征和其背后的经济金融现象结合起来进行分析,提出具有科学性、针对性、前瞻性的政策建议,从而不断提升金融服务水平,助推山西经济转型发展、跨越发展。
[1]周文峰:“创新思维勇于实践开创清算中心数据挖掘分析研究新领域”,《支付清算》,2011年第4期
[2]晓丽:《区域资金流动问题研究》,中国经济出版社,2011
[3]高铁梅:《计量经济分析方法与建模》,中国人民大学出版社,2006
[4]王燕:《应用时间序列分析(第二版)》,中国人民大学出版社,2008
[5]张晓峒:《Eviews使用指南与案例》,机械工业出版社,2010年。
中国人民银行太原中心支行清算中心课题组
主持人:周文峰
成 员:高 鼎 王凯华
执 笔 人:王凯华
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。