时空异常(spatio-temporal outlier,STO)是指某对象与时空相邻域内其他对象存在明显的差异。时空异常既表现为空间上的异常,也表现为时间序列上的异常。时空异常检测是指从描述时空对象的时空数据中检测出存在明显偏离正常模式的时空对象的过程。时空异常检测的结果可以为海洋灾害的预测预警、海洋资源分布的发现等提供参考依据。
1)时空异常的主要类型
时空异常包括空间关系异常、时间关系异常、时空关系异常。
(1)空间关系异常。若被研究的对象数据集依据空间关系应该符合某种规律,但是数据集中存在某对象数据没有依据空间关系遵从该规律,则称该对象数据集存在空间关系异常。例如,海洋鱼类对环境有一定趋向性,鱼类的聚集与温度有很大关系,从海洋表面向下,依照空间位置不同,海洋温度不同,鱼类聚集情况应该呈某种分布规律,若在某研究区域中,鱼类聚集情况没有依照这种规律变化,则表示存在空间关系异常。
(2)时间关系异常。若被研究的对象数据集依据时间关系应该符合某种规律,但是数据集中存在某对象数据没有依据时间关系遵从该规律,则称该对象数据集存在时间关系异常。例如,海洋风暴潮来临时,随着时间推移,海水增水量不断上升,然后下降,但是如果在某研究区域风暴潮来临后增水量未升反降,则表示存在时间关系异常。
(3)时空关系异常。若被研究的对象数据集依据时空关系应该符合某种规律,但是数据集中存在某对象数据没有依据时空关系遵从该规律,则称该对象数据集存在时空关系异常。例如,某海岸区域,在过去的30年海岸侵蚀情况逐年加剧,但是从该区域去年的监测情况来看,海岸侵蚀情况明显好转,则表示存在时空关系异常。
2)时空异常检测方法(www.xing528.com)
常见的时空异常检测方法包括:基于统计的异常检测方法、基于距离的异常检测方法、基于密度的异常检测方法和基于规则和模式的异常检测方法等。
(1)基于统计的异常检测方法。利用标准的统计分布方法来检测异常数据。依据时空对象数据集的特点,假设数据符合某个分布模型,那些不服从分布模型定义的时空对象数据就是异常点。这种方法的优点是建立于成熟的统计学理论基础之上,只要给出分布模型,发现异常点的过程相对就比较简单。但是,这种方法总是需要预先假设时空对象数据符合某种分布模型,如果模型选择不合适,异常检测的结果就可能出现偏差。
(2)基于距离的异常检测方法。通过计算时空对象数据间的距离来发现异常点的方法。可以具体描述为在数据集S中,至少存在p个对象与对象O的距离大于d,则对象O是基于距离的与参数p和d相关的异常点。这种基于距离来发现异常点的方法是目前使用比较普遍的异常点检测方法。但是,基于距离的异常检测方法存在一定的缺陷,当数据维度较高时,若时空对象数据空间具有稀疏性,则距离就无法给出合理的解释。因此,该方法适用于数据维度不高的异常点检测。
(3)基于密度的异常检测方法。综合考虑时空对象数据间的距离以及某个范围域内时空对象的数量(即密度)来发现异常点的方法。由于基于距离的异常检测方法提出了同一个p和d参数,因此利用该方法对密度不同的区域进行检测会有问题。基于密度的异常检测方法可以体现出局部不同,因此相对基于距离的异常检测方法更易于发现局部异常。
(4)基于规则和模式的异常检测方法。从大量的时空对象数据中提取出相关的规则和模式,然后依据这些规则和模式,检测出异常点。提取规则和模式的主要方法包括关联分析、序列模式分析、分类分析和聚类分析。利用已有的时空对象数据进行训练,其中包含正常时空对象数据和异常时空数据,通过对正常时空对象数据进行训练建立正常行为模式,再利用得到的规则和模式实现异常点的检测。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。