首页 理论教育 基于PLS-LDA法的食用油种类鉴别方法研究

基于PLS-LDA法的食用油种类鉴别方法研究

时间:2023-06-27 理论教育 版权反馈
【摘要】:图8-22 食用油拉曼光谱图2.PLS-LDA方法介绍本实验采用PLS-LDA方法建立判别模型。表8-4 基于PLS-LDA法的食用植物油定性识别结果一般情况下,变量筛选可以提高模型的预测精度和增强模型的解释性。表8-5 基于MCUVE-PLSLDA法的食用植物油定性识别结果基于PLS-LDA法的多种类食用油识别根据上述实验结果,PLS-LDA法可用于单一种类的食用油识别,即二元识别。图8-25 基于PLS-LDA法的多种类食用油识别流程

基于PLS-LDA法的食用油种类鉴别方法研究

1.样本制备与光谱采集

食用油样品:23个食用植物油样本购于北京物美超市,其中橄榄油样本6个、花生油样本5个、玉米油样本4个、葵花籽油样本4个、稻米油样本2个、亚麻籽油样本2个。

采用DXR激光显微拉曼光谱仪采集食用油的拉曼光谱。由于待测对象是液体样本,因此采用金属制容器装样,以避免干扰待测对象的拉曼信号。全部样品未经任何化学处理,采用移液枪逐一装样扫描样本。每次测量前均用石油醚分析纯清洗金属质容器,避免样本间交叉污染。食用油样本的拉曼光谱图如图8-22所示。

978-7-111-58430-8-Chapter08-41.jpg

图8-22 食用油拉曼光谱图

2.PLS-LDA方法介绍

本实验采用PLS-LDA方法建立判别模型。PLS-LDA方法的基本思路:首先利用PLS算法矩阵X和y进行主成分分解,得到X矩阵的主成分T。然后利用T和各样本的y值作线性判别分析,最终导出判别函数。本实验中采用PLS算法进行主成分分解结合Fisher线性判别法进行分析[11]。在Windows7操作系统和MATLAB7.6.0的软件平台下,调用软件包CARS_PLSLDA V3.5实现上述算法(下载地址:http://code.google.com/p/cars2009/downloads)。

3.模型建立与测试

(1)谱图预处理

食用植物油的拉曼光谱中位于1650cm-1处特征峰的峰值直接反映了不饱和烯烃键(C=C)的含量,而位于1260cm-1处的特征峰则反映了不饱和烯烃键所在碳原子氢键(=C-H)的含量,这两个特征峰均体现了食用油的不饱和程度。另外,从上图8-22中可以看到位于两端的光谱信号毛刺较多,噪声较大。因此本实验选取包含上述特征峰,且避开两端的光谱区域(1109~1784cm-1)作为区别食用植物油品种的理论依据。

airPLS可以用来对拉曼信号进行背景扣除,且无需用户的任何介入和初始信息(如峰值检测等)。该方法主要包括两个方面:惩罚最小二乘算法对信号的平滑和自适应迭代将惩罚过程转变成一个基线估计的惩罚最小二乘算法。其中参数λ可以用来调节拟合基线的平滑度和准确度之间的平衡。本实验采用airPLS对食用油拉曼光谱进行基线校正。当选取λ=105时,如图8-23所示。

978-7-111-58430-8-Chapter08-42.jpg

图8-23 airPLS光谱预处理

(2)基于PLS-LDA法的单一种类食用油的识别

考虑到本实验食用油样本集中一些种类的食用油样本个数较少,因此实验只选择3种食用油,橄榄油、花生油和玉米油分别进行单一种类识别。以橄榄油识别为例,若为真实橄榄油样本,则类别标记为1,若非橄榄油样本,则类别标记为-1。在本实验样本集中,橄榄油真实样本有6个,假冒样本有17个。

根据文献蒙特卡洛交叉校验得到的模型指标与K折交叉校验和留一法交叉校验相比,更接近于实际预测能力。采用蒙特卡洛交叉校验的模型指标来评价模型预测能力更有意义实际。因此本实验采用蒙特卡洛法进行抽样建模。(www.xing528.com)

通常采用真实样本识别率,假冒样本识别率及总体识别率对模型识别的性能进行评价。设真实样本个数为n1,假冒样本个数为n2,样本总体个数则为n1+n2;设被正确识别的真实样本个数为m1,被正确识别的假冒样本个数为m2,则真实样本识别率为m1/n1,假冒样本识别率为m2/n2,总体识别率为(m1+m2)/(n1+n2)。

本实验采用蒙特卡洛抽样方法随机抽样1000次,每次按80%的比例随机在样本集中抽样作为训练集,20%作为测试集。根据每次抽样得到的训练集建立PLS-LDA识别模型,计算测试集样本的种类识别率。根据抽样比例,每次抽样,测试集样本23×20%≈5个样本,因此1000次抽样得到测试集样本共有5000个。表8-4中的结果是1000次抽样得到的测试集的平均识别率。

8-4 基于PLS-LDA法的食用植物油定性识别结果

978-7-111-58430-8-Chapter08-43.jpg

一般情况下,变量筛选可以提高模型的预测精度和增强模型的解释性。鉴于表8-4中识别率不高,因此这里采用蒙特卡洛无信息变量消除(MCUVE)法挑选波长变量。本实验通过MCUVE-PLSLDA法变量筛选后的波长如图8-24所示。从图中可以看出3种植物油识别模型挑选的拉曼光谱在位于1650cm-1附近处有重叠区域,而该处的特征峰的峰值直接反映了不饱和烯烃键(C=C)的含量,正是区别不同食用油种类的理论依据。

978-7-111-58430-8-Chapter08-44.jpg

图8-24 MCUVE-PLSLDA法筛选的食用油光谱拉曼光谱波长变量

在MCUVE-PLSLDA法变量筛选后,重复蒙特卡洛交互检验,建立PLS-LDA识别模型,结果见表8-5。表8-5中3种植物油的真实样本识别率、假冒样本识别率和总体识别率均高于变量筛选前的识别率。

8-5 基于MCUVE-PLSLDA法的食用植物油定性识别结果

978-7-111-58430-8-Chapter08-45.jpg

(3)基于PLS-LDA法的多种类食用油识别

根据上述实验结果,PLS-LDA法可用于单一种类的食用油识别,即二元识别。若想将其用于多元识别,即多种类食用油的识别,可采用如图8-25所示流程。本实验随机选取了橄榄油样本、花生油样本、玉米油样本及亚麻籽油样本各一个,采用上述选取的波长变量建立的PLS- LDA法模型及图8-25所示多种类食用油的识别流程进行测试。4个样本均得到了正确的分类。

978-7-111-58430-8-Chapter08-46.jpg

图8-25 基于PLS-LDA法的多种类食用油识别流程

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈