道路交通安全预测技术可分为两类:定性预测和定量预测。
定性预测是在数据资料掌握不多,或需要短时间内做出预测的情况下,运用人的经验和判断能力,用逻辑思维方法,把有关资料加以综合,将定性资料转换成定量的估计值来预测未来。常用的定性预测技术有专家会议法、德尔菲法、主观概率法、趋势判断法、类推法、相互影响分析法等。定量预测是在历史数据和统计资料的基础上,运用数学或其他分析技术,建立可以表现数量关系的模型,并利用它来计算预测对象在未来可能表现的数量。目前对于道路交通事故的预测一般采用定量预测的技术。下面介绍几种常用的定量预测方法。
9.2.1 数学曲线预测法
根据预测对象的观测值序列随时间而变动的不同趋势,用线性、二次曲线、生长曲线等数学曲线进行拟合,进而进行未来年的预测。线性预测主要应用在预测对象随时间呈线性变化趋势,预测模型为:y=at+b,式中a、b为模型系数。对数抛物线是一种特殊的增长曲线,它随着时间的推移而逐步增长,当增长到一定程度时,数值又会逐渐下降,曲线模型为:y=aebt,式中a、b为模型参数。对两边取对数可得lny=lna+bt,令Y=lny,A=lna,从而上式可写为线性模型:Y=bt+ A。下面重点介绍增长曲线预测法和对数抛物线预测模型:
1.增长曲线预测法
许多事物的发展规律类似于生物的自然增殖过程,可以用一条近乎S型的曲线来描述:发展初期增长速度较慢,一段时间后,增长速度会逐渐加快,到接近于某一增长极限时,增长速度又会放慢。国民生产总值、交通事故、客货运量等的增长过程,都具有这种特点。
有多种S型增长曲线模型,常用作预测的有戈伯兹曲线和逻辑曲线。(1)戈伯兹曲线预测模型
戈伯兹曲线的数学模型为(见图9-1)
图9-1 戈伯兹曲线
式中:y——预测函数值;
t——时间变量;
k——渐进线值;
a,b——模型参数。
如果通过对时间序列数据的观察分析,认为可以用戈伯兹曲线拟合,可按如下步骤计算k、a、b等三个待求参数。
①进行时间编序,第一年t=0,第二年t=1,依次类推;
②将时间序列数据分为三段,每段n年,计算各时间段内实际数据之对数和:
式中,yt——第t年的实际数据。
③计算k、a、b:
由bn、lga、lgk求得参数b、a、k,再代入式(9-1)中,即可得戈伯兹曲线预测模型。
(2)逻辑曲线预测模型
逻辑曲线的数学模型为(见图9-2)
图9-2 逻辑曲线
式中:y——预测函数值;
t——时间变量;
k——渐进线值;
a,b——模型参数;
e——自然对数的底。
待定参数k、a、b的计算方法如下:
①将时间编序,第一年t=1,第二年t=2,依次类推;
②将时间序列数据分为三段,每段n年,计算各时间段内实际数据的倒数之和,分别记作S1、S2、S3,设
③计算k、a、b:
式中
将求得的k、a、b代入式(9-5)中,即可得逻辑曲线预测模型。
2.对数抛物线预测模型
对数抛物线是一种特殊的增长曲线,与前述两种增长曲线不同,戈伯兹曲线与逻辑曲线的预测对象数值随时间推移而逐步增长,而对数抛物线的预测对象在增长到一定程度后,数值将会逐渐下降,如式(9-12)所示:
式中:y——预测函数值;
t——时间变量;
e——自然对数的底;
a,b,c——模型参数。
将式(9-12)两边取对数,得到
令y′=lny,a0 =lna,x1 =t,x2 =t2,则得到二元线性回归方程:
运用二元线性回归的方法,可求出a0、b、c三个参数,再经变换后即可求出对数抛物线预测模型。
对于戈伯兹曲线和逻辑曲线,也可采用变量代换的方法,将其变换为一元线性回归曲线,并运用一元线性回归的方法计算待定参数。经过对数变换后,模型的参数是一个有偏估计。
9.2.2 回归分析预测法
回归分析预测方法是一种定量地描述变量之间的数量关系的预测方法,是定量预测方法的基础。回归分析预测法是根据事物内部因素变化的因果关系来预测事物未来的发展趋势。回归分析预测法就是对其中具有相关关系的变量,通过数理统计方法建立起变量间的回归方程,从而对变量间的密切程度进行描述,并实现对变量回归的估计和测定,进而应用回归方程进行预测。
回归分析预测模型按照变量的个数,可以分为一元回归分析和多元回归分析;按照变量之间的关系,又可分为线性回归分析和非线性回归分析。其中大多数非线性回归分析的问题都可以转化为线性回归分析的问题来处理,通常的做法是采用变量代换法将非线性回归转化成线性回归问题,利用线性回归方法进行求解。多元回归分析的原理又同一元回归分析的原理一致。
1.多元线性回归方程
其基本步骤如下:
(1)建立多元线性回归方程
设因变量为y,与因变量有关的m个自变量为x1,x2,…,xm,若存在线性关系,则可建立回归预测方程:
式中,a,b1,b2,…,bm为回归系数。
(2)计算回归系数
回归系数由下列方程组计算得到:
(3)相关检验
多元线性回归模型的相关性检验通过计算复相关系数进行,计算公式为:
R值越接近于1,回归模型的预测效果越好。一般要求计算出的R值大于临界复相关系数Rc值(查有关数表可得),否则回归模型不能成立。
(4)F检验
F检验的目的是判别全部自变量x1,x2,…,xm作为一个整体与因变量y的线性统计关系是否显著。
它服从第一自由度为m-1,第二自由度为n-m的F分布,因此,对于它给定的置信水平α,查F分布表可得临界值Fα=(m-1,n-m)。
若F>Fα=(m-1,n-m),则认为一组自变量x1,x2,…,xm与y的线性统计关系显著;否则,则说明其线性统计关系不显著。
(5)t检验
t检验的目的是检验每个自变量对y的影响程度,从而决定x1,x2,…,xm中哪些为主要自变量。第j个自变量的值tj的计算公式为:
当tj >t(α/2,n-m)时,说明自变量xj对y有显著影响;否则说明没有显著影响。
(6)求置信区间
在取置信度1-α=0.95的情况下,对于任意的xj0(j=1,2,…,m),相应的y0的置信区间近似为y∧0±2S。S由下式给出:
在多元线性回归分析中,二元回归具有极其重要的地位。
[例9-1] 已知某区域1998~2007年交通事故次数和非机动车、机动车拥有量如表9-1。初步分析知y是x1和x2的线形函数,试建立回归方程。
表9-1 某区域交通事故次数与车辆拥有量统计表
[解] 利用多元线性回归式进行计算,得到二元线性回归方程如下:
置信度为1-α=0.95时,对于任意给出的x10和x20,预测值y0的置信区间近似为
2.多元逐步回归预测模型
多元逐步回归预测是按照自变量对因变量作用程度的大小来决定该变量是否引入或剔除,自动地从大量可供选择的变量中选择重要的变量,以建立回归方程的预测方法。
逐步回归预测法是根据自变量对因变量作用程度的大小来决定该变量是否引入或提出的。为了衡量一个自变量对因变量作用的大小,定义Di为“贡献”系数,来表示自变量对因变量的“贡献”。Di可以表示为:
式中:riy、rij为
由于逐步回归预测是对自变量逐步进行的,每次计算中的“贡献”系数记为:
式中:l——第l次计算。
在逐步回归预测中,一方面要引入贡献最大的自变量,另一方面要提出贡献最小的自变量,其标准用F检验值来确定。假定显著性水平为α,然后查F检验表得到F检验临界Fα,Fα亦可人为确定。
在第l步计算中,如果有第k个自变量的“贡献”:pk(l) =max{pli},i为未被引入的变量序号,则要用F检验来判断该自变量是否被引入,即计算该变量第l步的
Fin为:
式中:n——样本数;
l——第l步计算;
——第k个变量第l步的“贡献”系数;
ryy——因变量自相关系数。
如果Fin>Fα,则在显著性水平α意义下,该自变量可以被引入,否则不能被引入。
如果在l步计算中,对第k个自变量有Dk(l) =min {Di(l)},i为已引入的自变量
序号,也要用F检验来判断该自变量是否应该剔除,即计算该变量的Fout为:
当Fout≤Fa时,即在显著性水平α意义下,该自变量应该被剔除;否则应该保留。
所以,逐步回归分析中,每计算一步都要用自变量的“贡献”系数选择引入或剔除的自变量,并用F检验来判断是否引入或剔除。
3.生成数列回归分析法
生成数列回归分析法是运用灰色系统的基本理论对影响因素进行关联分析,定量地找出主要影响因素,并建立因变量、自变量的生成数列,据此进行一元或多元回归分析,得到生成数列回归预测模型,其主要步骤如下:
(1)关联度分析
关联度分析的基本思想是根据曲线间的相似程度来判断关联程度,两曲线几何形状愈相似,其关联度愈大,因素间的关系愈密切。关联度分析的目的是为了找出影响预测对象的主要因素。
设参考数列(预测对象的原始数据列)为x0,被比较数列(影响因素的原始数据列)为xi(i=1,2,…,m),且曲线xi与曲线x0的关联度为ri:
在式(9-29)中,x0(t)-xi(t)=Δi(t)称为第i点x0与xi的绝对差;imintminx0(t)-xi(t)称为两级最小差,其中tminx0(t)-xi(t)是第一级最小差;imaxtmaxx0(t)-xi(t)是两级最大差。ρ为分辨系数,在0~1之间取值,一般取ρ= 0.5。
对于单位不同,或初值不同的数列作关联度分析时,一般要作处理,使之无量纲化,即用x0(1)去除x0(t),用xi(1)去除xi(t)。(www.xing528.com)
关联系数大的因素xi(t),对预测对象x0(t)的影响大,一般应作为主要影响因素。根据实际情况,可选择1~3个关联度大的因素作为自变量进行回归分析。
(2)生成数列回归分析
设因变量的原始数据为y(0)(t),其一次累加生成数列为y(1)(t),即
应当注意,自变量原始数列和因变量y(0)(t)应是连续若干年份的数据,
若某一年的数据缺乏,应进行数据修补。
对生成数列进行常规的回归分析,建立生成数列的回归预测模型,用相关系数等进行回归模型的精度检验,根据回归模型逐年计算出预测年限内的生成预测值。
对生成预测值进行累减还原,即得所求预测对象的预测值,可用预测值的离差
等反映预测精度。
[例9-2] 已知预测变量、自变量的原始数据见表9-2,用生成数列回归分析方法进行预测。
表9-2 原始数据表
续 表
[解] 自变量对因变量的关联度分别为
根据关联度的大小,可知x1、x2对y的影响是主要的,可以建立二元线性回归方程。如采用三元线性回归,对表9-2中的数据进行一次累加生成处理,再进行多元线性回归,得到以下预测模型:
为了进一步检验精度,表9-3中列出了预测计算结果,并与一般的回归方法进行了比较。比较结果是:生成数列回归预测法的离差为4.610 2,一般回归方法的预测离差为5.543 7,前者较之后者减少了16.8%,显然提高了预测精度。
表9-3 预测结果表
9.2.3 经验模型法
常用的经验模型有Smeed模型、北京模型等。
1.Smeed模型
Smeed模型是由伦敦大学斯密德(R.J.Smeed)教授在1949年根据欧洲20个国家的交通事故调查数据,经分析得到的回归模型,模型表达式如下:
式中:D——死亡人数(人);
V——机动车保有量(辆);
P——区域内人口总数(人)。
为了进一步验证这一公式,Smeed又根据1960~1967年欧、美、亚、非等洲的68个国家的事故数据进行分析,得到了很好的结果。其他一些国家也纷纷采用各自国家的数据,对Smeed模型进行修正,得到自己的预测模型,如日本采用1960~1972年的数据得到的模型为:
设Smeed模型的系数为μ:
或
通过修正Smeed模型的系数μ,改进预测模型,并据此进行模型验算,检验其
适用性。结果表明该模型对陕西省进行事故预测及安全评价是有效的,其修正公式为:
中国目前正在进入迅速发展机动化阶段,道路交通安全是亟待解决的问题。通过对Smeed模型进行验证,可以认为全国各地都可用Smeed模型进行交通事故预测,但应根据各地实际情况对模型系数μ进行必要的调整。
[例9-3] 斯密德(R.J.Smeed)模型预测示例:
某城市2003~2007年人口和机动车数量资料见表9-4,试用斯密德公式预测交通事故死亡人数。
表9-4 某城市2003~2007年人口、机动车数量资料
[解] 根据1949年英国伦敦大学教授斯密德对欧洲20个国家进行统计分析得出的数学模型:
式中:D——每年的交通事故死亡人数(人);
N——机动车拥有量(辆);
P——人口总数(人)。
式(9-37)可用交通事故危险度来表示:
式中:——平均每辆机动车交通事故死亡人数(人/辆);
——按地区人口平均多少人可能发生1人交通死亡(人/人);
——按地区人口平均多少人有一辆机动车(辆/人)。
该城市2003年人口数为1 046 890人,机动车辆数为17 470辆,按式(9-37)计算2003年交通事故死亡人数为
实际交通死亡人数为98人,误差为-18.11%,其他年的计算见表9-4。说明用斯密德公式计算交通死亡人数与实际交通死亡人数相差较大。
2.北京模型
北京模型是针对我国道路交通事故特点所构建的具有代表性的交通事故统计预测模型,择优选取了与预测模型相关的11项影响因素指标,如下:临时人口数x1、常住人口数x2、机动车辆数x3、自行车数x4、道路长度x5、道路面积x6、灯控路口x7、交通标志x8、交通标线x9、繁忙而失控的部位x10、交警人数x11,所建模型如下:
9.2.4 灰色理论模型法
灰色理论预测法不同于数理统计,不需要分析道路交通事故的影响因素,是一种基于现实性和动态性的分析预测方法,通过探究数据序列本身的内在规律,构建预测模型。由于其小样本建模以及计算简单等显著优点,因而得到广泛应用,但是对于波动性较强、序列较长的数据,拟合情况常常不尽人意,因此常用于中短期宏观预测。
灰色理论预测法是在数据处理上提出“生成”的方法(累加或累减生成),通过生成使数据列的随机性弱化,从而转化为比较有规律的数据列,将随机过程变为便于建模的灰过程。
如给定数据列:
是随机过程,不平稳,若作数据累加生成处理,令
得到新的数据列:
新数据列随机性将被弱化(可进行n次处理),新数据列绘制曲线多逼近指数式曲线。
灰色动态模型GM(n,h),n为微分方程阶数,h为变量的个数。一般采用GM (1,1)模型形式:
式中:a,μ——建模过程中待辨识的参数和内部变量;
x(1)——原始数据x(0)(ti)经过累加生成处理得到的新数据列。
参数辨识过程如下:
(1)构造数据矩阵B
(2)构造数阵向量yN
(3)作最小二乘法计算,求参数a,μ
(4)建立时间响应函数
GM(1,N)模型计算程序框图见图9-3。
图9-3 GM(1,N)模型计算程序框图
[例9-4] 灰色系统模型示例:
某城市2002~2007年交通事故发生次数数据列见表9-5,试用灰色系统理论建立交通事故预测模型。
表9-5 某城市交通事故次数历年数据列
[解] 本题yN =[12.86,8.65,8.7,13.75,15.55]Τ
可得
时间响应函数为
令x(1)(0)=x(0)(0)=11.28,则
将上式离散化,得
上式为交通事故发生次数预测模型,可由上式求得x(1)(k)值后,累减还原可得到预测数据x(0)(k),由于计算误差较大,还需要进行修正,建立生成数据残差模型。
计算生成数据残差数据列:q(0)(k)=x(1)(k)-x∧(1)(k),式中x(1)(k)为实际原始数据累加值,x∧(1)(k)为由式(9-48)计算得出的生成数据列预测值。计算得到的残差数据见表9-6,在表中进行残差数据累加生成处理,残差数据经过2次累加生成处理后,数据才平稳。
将q(2)(k)输入计算机,得到输出结果为
时间响应函数为
将上式离散化得
表9-6 残差数据列
将式(9-50)求灰导数,与式(9-49)相加可得到该城市用灰色系统理论建立的交通事故预测模型(累加值):
修正后模型经过精度检验、残差大小检验和后检差检验,均得到较好的结果。
如对该城市2021年交通事故进行预测:
(1)由式(9-49)计算得:
第一次累减:
第二次累减:
所以,2021年交通事故次数为
或直接代入式(9-51)中计算:
此外还有BP神经网络预测法、基于主成分分析的道路交通事故预测、基于聚类分析的道路交通事故预测等等。在定量预测中,预测模型的选择至关重要,选择正确的数学模型必须依据客观情况,通过调查、收集数据资料,观察和研究其固有的特征和内在规律,经过必要的抽象和简化,做出能反映实际问题本质的数量关系,并能分析和解决客观实际问题。针对道路交通事故的发生是随机过程的特点,道路交通事故的建模预测分析主要是应用数理统计分析方法,根据大量道路交通事故发生的现象,以及时间、地点、环境等相关因素进行归纳和总结,找出一定的规律性,预计和推测未来的发展情况和危害程度,以及判明影响的原因和因素。在道路交通事故的定量预测中,其数学模型的建立应遵守两条重要原则,一是连续性原则,二是类推原则。连续性原则是指事物的发展过程是按照一定规律进行的,在其发展过程中,这个规律自始至终不应受到破坏,未来的发展与过去和现在无本质的差别。类推的原则是指事物必须有某种结构,其变动是按照一定的规律进行的,也就是说,道路交通事故的发生宏观上表现为连贯性,未来的道路交通事故与过去和现在的道路交通事故本质上无区别,但其变动是有规律可循的。因此,根据其发生和变化的规律性,可以预测未来道路交通事故的发展情况和危害程度。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。