实验数据同步完成后,根据不同实验采集的数据指标数量和特点,需对采集的多传感器数据进行以下预处理。
1. 实验数据的标准化处理
不同传感器和设备的数据采样率往往存在较大的区别,如血流量脉冲(BVP)和皮肤表面电导(SC)的采样频率为256 Hz,呼吸频率(RESP)的采样率为32 Hz,而眼动仪数据的采样率为60 Hz。这就决定了在进行数据分析之前必须完成实验数据标准化工作,考虑到三类实验进行的时间都较长,且研究对象特征变化经历的时长一般超过1 s,所以处理过程中首先将不同设备采集的数据格式统一后,导入Matlab 中进行统一存储。然后根据不同设备的采样率以1 s 为时间单位计算其均值进行数据降频处理,最终得到所有指标的数据即为标准化处理后的数据集。
2. 数据奇异值修复和处理方法
数据出现奇异值的情况一般包括两种:一种为由于操作失误或者传感器接触不良等原因造成较长一段时间内大面积的数据缺失;另外一种可能是由于特殊区域信号不良或者信号不稳定造成的小部分数据缺失。针对两种不同的数据缺失或者错误的情况,本研究中分别采用以下两种方法进行数据预处理或者修复。
(1)大面积数据缺失的情况。
在实验过程中,尤其是在实车实验中,由于车辆颠簸、驾驶人动作等原因可能会造成在一段时间内传感器或者设备接触不良而出现的设备停止数据采集的状况。针对这类数据缺失情况,采用Observer XT 行为分析软件进行数据处理。其处理过程包括三个步骤:首先,将视频和各设备采集的数据都同步导入至Observer 软件系统中;然后,通过观看视频寻找异常的数据片段并对其进行编码,编码完成后,将编码好的数据片段进行删除,并对剩余数据进行整合;最后,利用软件的数据导出功能将处理后的数据文件导出并保存[57]。采用该种方法的优点是能够非常直观地对数据进行观察,在观看视频过程中,随着视频中时间的变化,其他对应数据也会时间变化而发生对应的移动,这样可以很明显地发现数据中存在的缺失。另外,该软件还具有视频和数据片段自动合成功能,当删除异常数据片段后,剩余视频数据和其他数据能够进行自动拼接,有利于保障数据的完整性。
(2)小部分数据缺失的情况。
实验中由于设备稳定性等问题,可能会造成某些数据出现跳变或小部分异常等情况,这部分数据往往可以采用一些插值方法进行数据修复。常用的差值方法包括分段插值法、Lagrange 插值法、最小二乘法和样条插值法等。陈弘等提出采用三次样条插值法能够有效地对速度、转角等数据异常值进行修复[58]。所以,本研究尝试采用该方法进行数据修复,三次样条插值的基本理论表述如下:
假设存在有序的数据点集合:
在此区间内存在插值函数:
式中, i={1,2,..., k}; ai i表示为未知数的系数。为保证函数曲线的连续性,式(3-4)应满足条件:
为使得三次样条插值函数在各数据点处的1 阶导数存在且连续,需满足:(www.xing528.com)
为使得三次样条插值函数在各数据点处的2 阶导数存在且连续,需满足:
为对公式(3-3)进行求解,需对中间节点建立约束方程,其具体表述如式(3-7)所示:
综合上述公式即可对公式(3-3)中系数进行求解[59,60]。
为了验证该插值方法对本研究中的数据修复是否适用,随机选取了一组实验中的150 条速度值的数据样本进行验证实验,在该数据样本中随机删除10 个样本点,然后采用三次样条插值法对删除样本点进行修复,得到的数据修复结果如图3-14 所示。通过对10 个修复后的数据点与真实数据点进行对比,得到其相对误差如图3-15 所示。
图3-14 基于三次样条插值的数据修复结果
图3-15 相对误差分析结果
由图3-14 可知,就直观比较而言,采用三次样条插值法对数据点进行复原得到的结果基本与真实值一致。而由图3-15 可知,通过对10 个真实数据点和修复数据点的相对误差进行分析发现,除第3 个和第10 个数据点的相对误差值大于1.5%外,其他点的相对误差值都小于1.5%,即说明该三次样条插值方法能够较好地实现对速度值的修复。
为了进一步阐述该方法的有效性,选取实验中出现异常的速度数据片段作为示例进行说明,该片段包括300 个数据点,由于信号缺失等原因导致其中一些数据点缺失,通过采用三次样条插值法进行修复得到的结果如图3-16 所示。
图3-16 基于三次样条插值的速度异常点修复结果
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。