首页 理论教育 时间序列预测方法介绍

时间序列预测方法介绍

时间:2023-08-21 理论教育 版权反馈
【摘要】:基于云模型的时间序列预测[16]。基于云模型的时间序列预测不仅在时间粒度,还能在信息粒度上给予一定的压缩。利用各个分量重构时间序列对应的相空间样本训练MISO结构的径向基函数神经网络,进而利用连续传递结构的RBF神经网络对各个主分量进行多步预测。

时间序列预测方法介绍

1)时间序列预测分类

对时间序列研究的目的在于根据一系列有序数据预测未来值,时间序列预测已成为大数据挖掘与分析的挑战性课题之一。时间序列预测有着广泛的应用领域,如预测天气、太阳黑子的活动、网络流量、销售量、股票市场等。大体上时间序列预测方法可分为以下几类:

(1)线性时间序列预测[16]。主要包括自回归模型(autoregression model,AR模型)、滑动平均模型(moving average model,MA模型)、自回归滑动平均模型(autoregressive moving average model,ARMA模型)、求和自回归滑动平均模型(autoregressive integrated moving average model,ARIMA模型)等。这些模型的优点是:所需样本量少,数学模型精确且能获得具有一定精度(用模型误差方差来表示)的统计特性,与真实结果非常接近,因此在实际应用时比较方便,可操作性较好。缺点是:适用范围有限,对具有异方差、非线性时间序列不能精确预测。

(2)非线性时间序列预测[16]。除传统时间序列分析中的自回归条件异方差模型(autoregressive conditional heteroskedasticity model,ARCH模型)和广义ARCH模型(GARCH模型)外,还有神经网络、嵌入空间法、决策树等方法,然而基于神经网络的时间序列预测在确定网络的结构和参数(如隐含节点的个数)时比较麻烦,并且如何改进神经网络的结构,克服神经网络内部结构的缺陷也是一个难点。

(3)支持向量机(support vector machine,SVM)[16]。支持向量机在时间序列中的应用主要是基于复杂事件处理的,例如金融数据处理。其优点是计算速度快、全局最优和泛化能力强等,但由于预测模型的拟合精度和泛化能力主要取决于相关参数的选取,因此至今没有通用的理论和方法,在一定基础上限制了支持向量机的应用。

(4)混沌时间序列预测[17] 。20世纪60年代初,美国麻省理工学院科学家洛伦茨(Lorenz)在研究气象数据中发现“蝴蝶效应”后,来自天文水利、气象、脑电生理学等实际工程领域,如太阳黑子、河流径流量、潮汐脑电波等时间序列也都被发现具有混沌特性。分析和预测混沌时间序列的演变规律不仅是掌握复杂系统动力学特性的重要手段,也可以为大气洋流、潮汐中长期演变、脑电生理图像病理分析等实际工程领域的问题提供理论支持和决策依据。混沌时间序列预测研究有两个焦点:一是增加预测模型的复杂度,以面向控制、水文、气象、脑电生理学等研究背景下的具体预测需求;二是引入和改进模式识别领域的特征提取算法,从而降低混沌数据的预测难度,以提高预测精度。

(5)基于云模型的时间序列预测[16]。基于云模型的时间序列预测发展很晚,其相关理论和应用成果不多,自1995年李德毅教授提出云模型概念,随着云模型理论的相应完善,才逐步发展起来。云模型是将随机性与模糊性相结合,通过特定的算法实现定性定量间不确定转换的一种模型。自提出以来,一直是各界研究者探究应用的热点,目前云模型已成功应用在金融市场、数据挖掘、人工智能图像处理决策分析等众多领域。基于云模型的时间序列预测就是运用云理论为知识表示的理论基础,提出预测知识,并综合不同时间粒度的知识进行时间序列预测。系统将要表达的预测知识应当是模糊的、不确定的,是一种定性知识。基于云模型的时间序列预测不仅在时间粒度,还能在信息粒度上给予一定的压缩。

2)时间序列预测在海洋灾害上的应用

赤潮是我国沿海最主要的生态灾害之一,赤潮的发生对沿海的生态环境和水产养殖造成了严重的影响。由于赤潮过程的复杂性,目前人们还没有完全掌握赤潮的发生、发展和消亡的机理,赤潮灾害的监测和预报已成为一个国际性的难题。

影响赤潮发生的因素非常多,其中温度和盐度是影响赤潮生物活动的两个很重要的因素,绝大多数的赤潮生物都有适合自己生长繁殖的温度和盐度范围,因此,如果能够准确地预测温度和盐度的变化对掌握赤潮生物的动态是很有意义的。文献[18]提出了一种结合奇异谱分析(singular spectrumanalysis,SSA)和径向基函数(radial basis function,RBF)神经网络的时间序列多步预测温度和盐度的方法。方法的过程框图如图4-5所示。

图4-5 SSA+RBF神经网络水质时间序列多步预测的过程框图[18]

其步骤如下:

(1)将用于建模的时间序列做考虑缺失数据的SSA分解,获得m阶主分量。

(2)分别对各个分量的方差贡献率进行排序,选取累计方差贡献率超过90%的前n个分量作为神经网络建模的对象,其他的分量作为噪声忽略不计。

(3)对于各个主分量的训练时间序列s(ti)(i=0,1,…,n),用一定的嵌入维数m可以建立起一个包含p=n—1—(m—1)个向量的相空间X,构造出的相空间向量xi

(www.xing528.com)

对应的输出值为(sm+1,sm+2,…,sn)。

(4)利用各个分量重构时间序列对应的相空间样本训练MISO结构的径向基函数神经网络,进而利用连续传递结构的RBF神经网络对各个主分量进行多步预测。

(5)线性叠加各个分量的预测结果,获得最终的预测结果。

实验时,以在1号站位浮标连续监测参数(温度、盐度)的监测时间序列样本为研究对象,考虑到时间序列的等间隔采样要求,取每天12∶00的采样结果构成时间序列,采样的时间间隔为1天/次。将数据分为两段:6月1日—7月20日带有缺失值的数据完全用于训练预测模型;7月21日—8月28日共39个数据用于预测模型的验证。分别用RBF神经网络和RBF+SSA的方法对五项连续监测参数的时间序列进行建模和预测,SSA变换的嵌入系数m=10,考虑到经过SSA变换后得到的时间序列分量表现出一定的线性行为,取嵌入维数为3,分别做第1步(T+1)、第2步(T+2)和第3步(T+3)预测,则温度和盐度这两项误差的结果见表4-1。

表4-1 不同预测方法的误差对比[18]

温度和盐度的第3步预测结果如图4-6所示,图中横坐标表示验证数据的编号,其中图a和b分别为利用RBF和RBF+SSA方法的温度时间序列预测结果,图c和d分别为利用RBF和RBF+SSA方法的盐度时间序列预测结果。可以看出,对于波动较小的温度时间序列,RBF方法和RBF+SSA方法的1~3步的预测误差相差不大,RBF+SSA方法只是略好于RBF方法;对于波动较大的盐度时间序列RBF方法的1~3步的预测误差要明显高于RBF+SSA方法,并且RBF方法在第2步和第3步的预测出现了非常大的误差,预测误差还有快速增长的趋势,而使用RBF+SSA方法则可以将第2步和第3步预测误差降到非常低的程度。

图4-6 温度、盐度时间序列3天后预测结果和实测结果对比[18]

叶绿素是反映水体中浮游植物生物量的重要因子,也是赤潮现象最重要的表征因子。为了对叶绿素浓度进行预测,文献[18]一方面采用变量线性相关系数法筛选出溶解氧是与叶绿素变动相关的因子,将其作为叶绿素的辅助预测因子,借助其关联性的信息提高预测模型的可靠性;另一方面,由于溶解氧、叶绿素时间序列中每个采样点的不确定性无法评价,因此将其采样数值模糊化,以模糊时间序列的形式表达采样数据的不确定度。综上所述,结合现有的二元模糊关系法和二元高阶模糊推理法的特点和优势,提出了一种改进的二元模糊时间序列预测方法,其步骤如下:

(1)利用SSA方法分别对叶绿素和溶解氧时间序列进行分解,考虑到时间序列波动较大的特点,只取前两阶主分量进行重构,形成叶绿素和溶解氧变动的趋势信息时间序列。

(2)对叶绿素和溶解氧的趋势信息时间序列使用二元模糊关系法进行预测,窗口函数取w=7,获得第i+1天的叶绿素趋势模糊化变动预测值ti+1。

(3)对原始叶绿素时间序列,采用二元高阶模糊推理法进行预测,阶数k=3,对存在匹配模糊关系的情况,计算第i+1天的叶绿素预测值,对不存在匹配模糊关系的情况,则进入第(4)步。

(4)利用第(2)步中获得的趋势模糊化变动预测值,与第i天的叶绿素相叠加,获得第i+1天的叶绿素预测结果。

实验时,以1号站位和2号站位8∶00组、12∶00组、16∶00组的浮标监测叶绿素和溶解氧数据为研究对象,二元模糊关系法取窗口宽度w=7,二元高阶模糊推理法取阶数k=3,考察7月21日—8月28日叶绿素数据的预测情况,得到的单步预测结果的均方误差见表4-2。从中可以看出,该预测方法比其他预测方法的预测精度都要高。

表4-2 不同预测方法的误差对比[18]

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈