首页 理论教育 基于ELM的芝麻油伪检测方法研究

基于ELM的芝麻油伪检测方法研究

时间:2023-06-27 理论教育 版权反馈
【摘要】:配制好的芝麻油掺伪样本与纯芝麻油样本40个共计220个样本进行定性建模分析。随机分配90个训练集样本和40个测试集样本,类别1表示纯正芝麻油的类别,类别2表示芝麻油中掺入大豆油的类别。改变ELM算法隐层节点个数和激活函数类型不会改变模型的训练和预测结果,得到纯正芝麻油样本和掺入大豆油的芝麻油样本分类准确率均为100%,预测模型具有较高稳定性。

基于ELM的芝麻油伪检测方法研究

1.极限学习(Extreme Learning Machine,ELM)介绍

ELM算法是由新加坡南洋理工大学的黄广斌教授在2004年提出的一种单隐层前馈网络训练方法,该算法具有很强的学习能力并广泛应用于众多领域。传统的人工神经网络算法如BP、RBF等在设置网络相关训练参数时一般经人为操作而无法确定最优隐层节点数,训练时间长而且易得到局部最优解,而ELM算法可以较好地解决上述问题,是一种学习训练速度快、泛化能力较强、能够获得全局最优解的训练算法。

ELM算法在设置输入层跟隐层之间的权重连接值和隐层节点阈值时是随机生成的,并且在训练过程中无需调节输入层跟隐层间的权重连接值和隐层节点的阈值,只要人为设定隐层节点的数量便可以得到最优的唯一解。ELM算法不仅适用于回归、拟合问题,同样也可以适用于分类、模式识别等领域问题,随着一些改进算法不断被提出,ELM算法的性能也随之提高,应用范围越来越广,计算结果也越来越好。

ELM算法如下:

给定N个不同的样本(xjtj)∈Rn×Rmgx)代表激活函数,978-7-111-58430-8-Chapter08-22.jpg表示隐层节点数量,数学模型式(8-8)表示单隐层前馈神经网络:

978-7-111-58430-8-Chapter08-23.jpg

式中,ωibi表示随机生成的隐层各节点的参数;βi是连接隐层第i个节点的权重值;j=1,2,…,N

当网络的实际输出跟期望输出相等时,则有式(8-9),简写成式(8-10):

978-7-111-58430-8-Chapter08-24.jpg

Hβ=T (8-10)

式中,隐层输出矩阵978-7-111-58430-8-Chapter08-25.jpg,矩阵的行表示此行对应的训练样本对隐层全部节点的输出,列表示全部训练样本与对应此列的隐层节点的输出;978-7-111-58430-8-Chapter08-26.jpg978-7-111-58430-8-Chapter08-27.jpg978-7-111-58430-8-Chapter08-28.jpg

ELM算法依照如下步骤来实现:

1)确定隐层节点的个数,输入层跟隐层之间的权重连接值ω和隐层节点阈值b均为随机设定。

2)从S型函数、正弦函数、不可微函数等函数中选择一个作为隐层节点的激活函数来计算隐层输出矩阵H

3)计算输出层权值978-7-111-58430-8-Chapter08-29.jpg,其中H+为隐层输出矩阵H的Moore-Penrose广义逆。

2.样本制备与光谱采集

为模拟掺伪芝麻油,本实验的样本均为实验室配制的样本,各种类的食用油均采购自北京市各大超市,均为正品保质的食用油。前期的分析调研结果表明,参与芝麻油掺伪的食用油多为价格相对廉价的大豆油菜籽油,因此选购了不同品牌、不同批次的芝麻油3种[分别为金龙鱼100%纯芝麻油(一级压榨)400mL、古币100%纯芝麻香油(一级压榨)245mL、鲁花芝麻香油(一级压榨)350mL]、大豆油3种(金龙鱼精纯一级大豆油1.8L、福临门一级豆油1.8L、九三非转基因大豆油1.8L)、菜籽油3种(金龙鱼外婆乡小榨菜籽油900mL、盈成双低菜籽油1.8L、鲁花压榨特香菜籽油2L)进行芝麻油的掺伪样本配制。

为了增加定性模型的可靠性,掺伪样本按每50mL芝麻油中掺入体积比为50%、45%、40%、35%、30%、25%、20%、15%、10%、5%的10个梯度进行配制,共计3×3×2×10=180个掺伪样本,其中90个为芝麻油掺入大豆油的掺伪样本,另外90个为芝麻油掺入菜籽油的掺伪样本。配制好的芝麻油掺伪样本与纯芝麻油样本40个共计220个样本进行定性建模分析。

对配制好的芝麻油掺伪样本采集其近红外和中红外光谱,样本无需任何化学试剂处理,直接采用德国Bruker公司VERTEX70傅里叶红外光谱仪进行近红外和中红外光谱采集。样本光谱如图8-11和图8-12所示。

978-7-111-58430-8-Chapter08-30.jpg

图8-11 芝麻油掺入大豆油的光谱图

978-7-111-58430-8-Chapter08-31.jpg(www.xing528.com)

图8-12 芝麻油掺入菜籽油的光谱图

3.模型建立与测试

(1)芝麻油掺入大豆油的定性建模分析

选取芝麻油掺入大豆油的90个掺伪样本与从古船采样获得的40个纯芝麻油样本进行中红外光的定性建模分析。

在芝麻油中掺入大豆油不会明显改变芝麻油成分,因此掺入大豆油的芝麻油与大豆油、纯芝麻油的主成分大致相同。对比图8-13所示大豆油、芝麻油掺入大豆油和纯芝麻油的中红外光谱图,发现它们的中红外光谱图的吸收峰位置基本相同,在600~3200cm-1范围内有明显的吸收峰,分别在3011cm-1、2926cm-1、2857cm-1、1747cm-1、1467cm-1、1378cm-1、1240cm-1、1161cm-1、1100cm-1、720cm-1附近出现相似的中红外光谱吸收峰,无法直观地区别3条光谱有何明显差异,因此需要结合模式识别算法进行定性分析来区别芝麻油中是否掺伪。

978-7-111-58430-8-Chapter08-32.jpg

图8-13 基于中红外光谱的大豆油、芝麻油掺入大豆油和纯芝麻油光谱图

将90个芝麻油掺入大豆油的掺伪样本和40个纯芝麻油样本的中红外光谱图转为光谱数据表,每张光谱图有2021个数据点,形成130个实验样本的数据表。通过MATLAB软件实现ELM分类算法建立芝麻油掺入大豆油的定性分析模型,经过多次计算比较,隐层节点个数可以设定为2以上的任意数值,激活函数可任意选择S型函数、正弦函数。随机分配90个训练集样本和40个测试集样本,类别1表示纯正芝麻油的类别,类别2表示芝麻油中掺入大豆油的类别。

建模分析结果训练集分类准确率为100%(90/90),测试集预测分类准确率为100%(40/40)。测试集预测结果如图8-14所示,其中圆圈符号表示样本的真实类别,星形符号表示通过ELM算法进行预测的分类。改变ELM算法隐层节点个数和激活函数类型不会改变模型的训练和预测结果,得到纯正芝麻油样本和掺入大豆油的芝麻油样本分类准确率均为100%,预测模型具有较高稳定性。

978-7-111-58430-8-Chapter08-33.jpg

图8-14 基于中红外光谱的芝麻油掺入大豆油和纯芝麻油的预测分类结果

(2)芝麻油掺入菜籽油的定性建模分析

选取芝麻油掺入菜籽油的90个掺伪样本与从古船采样获得的40个纯芝麻油样本进行中红外光的定性建模分析。

在芝麻油中掺入菜籽油同样不会明显改变芝麻油的成分,因此掺入菜籽油的芝麻油和菜籽油、纯芝麻油的主要成分大致相同。对比图8-15所示的菜籽油、芝麻油掺入菜籽油和纯芝麻油的中红外光谱图,可以发现它们的中红外光谱图的吸收峰位置基本相同,也是在3200~600cm-1波长范围内有明显的吸收峰,分别在3011cm-1、2926cm-1、2857cm-1、1747cm-1、1467cm-1、1378cm-1、1240cm-1、1161cm-1、1100cm-1、720cm-1波长附近出现相似的中红外光谱吸收峰,无法直观地区别出3条光谱有什么明显差异,因此需要结合模式识别算法进行定性分析来区别芝麻油中是否掺伪。

将90个芝麻油掺入菜籽油的掺伪样本和40个纯芝麻油样本的中红外光谱图转为光谱数据表,每张光谱有2021个数据点,形成130个实验样本的数据表。通过MATLAB软件实现ELM分类算法,建立芝麻油掺入大豆油的定性分析模型。随机分配90个训练集样本和40个测试集样本,经过多次计算比较,隐层节点个数可以设定为2以上的任意数值,激活函数可任意选择S型函数、正弦函数,类别1表示纯正芝麻油的类别,类别2表示芝麻油中掺入菜籽油的类别。

建模分析结果训练集分类准确率为100%(90/90),测试集预测分类准确率为100%(40/40)。测试集预测结果如图8-16所示,其中圆圈符号表示样本的真实类别,星形符号表示通过ELM算法进行预测的分类。改变ELM算法隐层节点个数和激活函数类型都不会改变模型的训练和预测结果,得到的纯正芝麻油样本和掺入菜籽油的芝麻油样本分类全部正确,预测结果准确率均为100%,预测模型具有较高稳定性。

978-7-111-58430-8-Chapter08-34.jpg

图8-15 基于中红外光谱的菜籽油、芝麻油掺入菜籽油和纯芝麻油光谱图

978-7-111-58430-8-Chapter08-35.jpg

图8-16 基于中红外光谱的芝麻油掺入菜籽油和纯芝麻油的预测分类结果

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈