首页 理论教育 智能车辆行为决策模型及安全评估

智能车辆行为决策模型及安全评估

时间:2023-08-18 理论教育 版权反馈
【摘要】:少有研究综合采用属性重要度排序及多分类器融合的方法实现对最优属性集合的选择,考虑到信息增益在属性重要度排序中的优越性,本研究提出一种融合信息增益和多分类器的属性选择方法从分类准确率方法对人机共驾智能车驾驶模式决策因子进行选择。图5-5融合信息增益和多分类器的属性选择方法框架采用融合信息增益和多分类器的属性选择方法旨在得到分类效果最优的属性集合,忽略算法计算复杂度和运行时间。

智能车辆行为决策模型及安全评估

相关研究表明,Wrapper 属性选择方法相较于Filter 属性选择方法能够更为有效地提高分类的准确率[91]。而目前Wrapper 类方法进行最优属性组合选择主要是基于单分类器或者单纯基于分类器(如贝叶斯网络、决策树等)。少有研究综合采用属性重要度排序及多分类器融合的方法实现对最优属性集合的选择,考虑到信息增益在属性重要度排序中的优越性,本研究提出一种融合信息增益和多分类器的属性选择方法从分类准确率方法对人机共驾智能车驾驶模式决策因子进行选择。该方法的框架模型如图5-5 所示。

图5-5 融合信息增益和多分类器的属性选择方法框架

采用融合信息增益和多分类器的属性选择方法旨在得到分类效果最优的属性集合,忽略算法计算复杂度和运行时间。所以选择搜索策略时优先考虑穷举式搜索方法。同时,通过将所有特征与类别之间的信息增益作为评价函数对特征的重要性进行评价。而信息增益是一个比较理想的用于评价相关性的指标,其概念是在信息熵的基础上建立的,信息熵是一种常见的用于统计离散变量不确定性的方法。假设存在离散变量Y ,其信息熵定义为

而另一个离散变量Y 在X 已知的基础上的信息熵值可以计算:

式中, P ( y i)是变量Y 所有取值的先验概率; H (Y | X )是当X 已知时Y 的条件信息熵; P ( y i| xi )是当变量X 已知时Y 的后验概率。而加入条件X 前后Y 信息熵的差异就是X 与Y 之间的信息增益。在属性排序方法中,属性特征相对于类别的信息增益可以定义为:

(www.xing528.com)

式中,Y 为类别属性, xi 为特征属性。假设存在两个特征子集 x1 和 x2 ,如果存在Gain (Y | x1 )>Gain (Y | x 2),则认为选择用特征子集 x1 的分类结果比 x2 更好。通过循环使用这个规则,能够最终实现对所有属性按照重要性进行排序[92]

属性排序完成后,通过采用不同的分类器对选取不同特征子集时的分类效果进行分析,最后能够得出在不同驾驶模式选择的最优决策属性集。本研究中采用朴素贝叶斯分类算法、支持向量机分类算法和K 近邻分类算法这三种经典方法构建分类模型对最优决策属性进行挖掘。三类算法的特点和原理简述如下:

(1)朴素贝叶斯分类算法(NB):作为一种最简单的概率分类器,NB具有效率高和泛化能力优越等特点,并且它也拥有确定性的结构,只需根据训练数据对参数进行估计,而无须像贝叶斯网络分类器一样必须先对其结构进行训练。其基本原理是通过某一对象的先验概率,采用贝叶斯公式计算其后验概率,选择最大后验概率的类作为该对象所属的类别。而当条件属性出现冗余或者重复时,该算法的准确率将大大降低。所以利用该算法对特征集的敏感性对属性选择结果进行评价是非常合适的[93]

(2)支持向量机分类算法(SVM):作为一种结构风险最小化的模式识别和分类方法,SVM 具有良好的泛化能力和直观效果,在解决高维模式识别和样本非线性等方面的模式识别问题具有较大的优势。目前该方法已经广泛应用于故障诊断图像识别交通状态识别等领域。但当缺少对样本进行有效特征选择时,支持向量机在分类过程中往往易出现训练时间长、分类准确率低等问题。所以采用支持向量机作为属性选择性能评价方法具有一定的合理性和有效性[94],分类中采用径向基函数作为算法的核函数。

(3)K 近邻分类算法(KNN):作为最简单的机器学习方法之一,KNN算法的核心思想是,当一个样本在特征空间中的k 个最相似的样本的大多数属于同一类别,则这一样本也属于该类别。特征空间中所选择的邻居都是已正确分类的对象。该方法虽然原理上也依赖于极限定理,但其分类决策值与少量邻近样本相关,而不是靠判别类域来确定所属类别。所以,对于类域重叠或者交叉较多的待分类测试集,KNN 具有较好的效果[95]

本研究中采用分类真正率(True Positive Rate)和假正率(False Positive Rate)这两项指标对不同分类器的分类效果进行评价,其计算公式

式中,TPR表示真正率,即被模型预测为正的正样本比例;FPR 表示假正率,即被模型预测为正的负样本比例;TP 为正确划分为正例的个数;TN 为正确划分为负例的个数;FP 为错误划分为正例的个数;FN 为错误被划分为负例的个数。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈