首页 理论教育 海洋大数据的安全挑战分析

海洋大数据的安全挑战分析

时间:2023-08-21 理论教育 版权反馈
【摘要】:1)海洋大数据来源和种类的高复杂性海洋数据根据其来源,可以分为空基、岸基、海基、海床基等多种差异化数据,各种数据中包含了重要的信息。如何保护不同来源的数据,成为海洋大数据的首要挑战问题。由于海洋信息采集方式与信息内容的多样性,以及对安全要求的差异性,尤其是涉及大比例尺和长周期序列的敏感数据,其采集与传输环节存在严峻的挑战。3)海洋大数据存储与处理的超海量性海洋数据的最大特征是数据量巨大。

海洋大数据的安全挑战分析

一般来说,海洋数据会经历采集与传输、存储与处理、发布与推送等过程。数据的采集主要依靠基于传感器的物联网,数据的传输主要依靠传感网的数据汇聚、移动船载节点的中继转发以及卫星通信,因此具有多源性的特点、传输频率和传输媒介的全覆盖特性,在这个过程中,多源数据带来安全差异性,传输频率和传输媒介亦带来安全的差异性。数据的存储与处理主要依靠云计算、超级计算机等提供大数据的处理服务,具有数据量大、数据差异性大、数据在线与固化处理、海洋信息应急存储等特点。在数据发布与推送阶段,面对海洋复杂数据,传统的数据发布与推送技术已经不能满足海洋数据的需求,海洋数据发布与推送具有实时性与安全性的特点。下面针对海洋信息的各个环节,详细讨论海洋信息安全的特点。

1)海洋大数据来源和种类的高复杂性

海洋数据根据其来源,可以分为空基、岸基、海基、海床基等多种差异化数据,各种数据中包含了重要的信息。如何保护不同来源的数据,成为海洋大数据的首要挑战问题。

(1)空基数据。空基数据根据获取渠道不同主要分为太空数据和航空数据两大类;根据数据类型可以分为原始空间遥感影像数据、基于GIS的空间遥感矢量图数据、基于合成孔径雷达的多波段专题要素数据等。空基数据为多精度、多比例尺、覆盖范围广的动态多维数据,数据量大(尤其是原始影像数据)。大比例尺数据,特别是敏感地区的大比例尺数据为涉密数据。

(2)岸基数据。岸基数据可以划分为岸基雷达扫描成像数据、岸基海洋站获得的海洋观测数据与海洋监测数据、利用数学模型拟合后的多维插值数据等。岸基雷达扫描成像数据量比较大,原始岸基观测数据或监测数据的数据量不大,但是经过空间插值拟合以后的多维分布观测数据或监测数据具有较大的数据量。连续长周期的观测/监测数据也是涉密数据(尤其是敏感区域)。

(3)海基数据。海基数据按照获取途径可以分为浮标数据、潜标数据、船测数据以及通过空间插值拟合以后的多维分布数据。单波束/多波束声呐成像数据与空间插值拟合多维数据具有较大的数据量,同样连续长周期的观测/监测数据也是涉密数据(尤其是敏感区域)。

(4)海床基数据。海床基数据包括海底观测数据与监测数据,具体包括海底水温、洋流、泥沙、金属/非金属、底栖生物等数据。

(5)其他的数据分类及类型。如果按照行业领域划分,海洋数据可以分为海洋物理数据、海洋化学数据、海洋生物数据、海洋经济社会数据等。海洋物理数据又可以细分为海洋气象数据、海洋水文数据、海洋地形地貌数据、海洋地质数据、海洋地磁数据、海洋重力数据等;海洋化学数据包括含氧量、含盐量、pH值、总磷、总氮等;海洋生物数据包括海洋微生物、海洋植物、海洋动物等;海洋经济数据种类繁杂,基本上陆地所有产业行业在海洋中都有包含,具体包括海洋渔业(海水养殖业、远洋捕捞业)、海洋化工海水淡化、海洋盐业)、海洋矿产(海底油气资源、金属资源、矿砂等)、海洋装备制造业、海洋运输业、海洋旅游业、海洋科技海洋工程、海洋文化教育等。

2)海洋大数据传输频率与媒介的全覆盖性

在海洋观测系统中,传感器节点将数据汇聚,通过移动的船载节点将数据存储并携带,再转发给其他的船载基站或岸上的服务器存储。在传输过程中,任何一个恶意的中间节点都可以发起攻击,包括伪造、篡改、复制或者泄露消息等,这使得海洋数据传输网络的安全需求与传统网络存在很大不同,并对海洋数据传输的安全机制设计提出了巨大的挑战:

(1)海洋信息传输频率的全覆盖。海洋数据采集与传输的设备包括声学采集设备(如声呐、水听阵列等)、电磁学采集设备(基于电磁波的通信设备)等。由于传统的电磁波在水体中传播速度较慢,而且衰减率很高,很难在海洋中实现电磁波的无线传输,需要信号的转换设备。

(2)海洋信息传输媒介的全覆盖。海洋数据采集与传输的媒介包括跳频通信、水听阵列、水中传输、水气相结合传输等,不仅包含在水体中的信息采集与传输,还包括数据在水体与空气之间的采集、传输与交换。由于传输媒介的不同,需要有传输信号的转换设备,以适应不同的传输媒介。

(3)海洋信息的采集与传输。由于海洋信息采集方式与信息内容的多样性,以及对安全要求的差异性,尤其是涉及大比例尺和长周期序列的敏感数据,其采集与传输环节存在严峻的挑战。把当前比较成熟的云安全技术应用到海洋信息的采集与传输环节,采用FPGA等固件,在浮标及海洋站前端,针对不同的数据,分别实现数据的压缩、缓存、加密、可靠传输等,尤其是简化的VPN与身份验证等技术。

3)海洋大数据存储与处理的超海量性

海洋数据的最大特征是数据量巨大。由于地球表面70%以上由海洋覆盖,通过空基、岸基、海基以及海床基采集的数据更是PB级以上。对于如此巨大的数据,给数据存储与处理提出了很高的要求,对数据的安全性提出了更深要求。海洋数据存储过程中,不得不考虑以下问题:(www.xing528.com)

(1)数据存储的差异性大。海洋数据由于其采集方式的多样化,根据不同的采集设备,数据采集的频率不同,数据的差异性特别大,构成了复杂结构的海洋数据。

(2)数据固化在线处理。海洋数据的处理过程中,往往需要固化在线处理,即在数据采集后,及时完成校正数据、实时处理,按照先处理再发送步骤,完成数据的处理。

(3)海洋信息应急存储的安全性。海洋信息应急存储系统,需要在特殊的场景下,为了应对数据的在线处理和快速发布与推送,需要将信息进行存储。在应急存储的过程中,不能采取复杂的加密算法

由于海洋信息来源的多样性以及地理分布的分散性等特点,采取分布式云技术来实现信息的存储与处理,在采集前端实现初步的质量控制与预处理及缓存,在数据中心实现本地多级存储备份,此外还需异地灾备;采用先进的海量大数据挖掘技术,对海洋信息实现深层次的挖掘处理,以获得更细致精确的关联关系,为海洋信息的深度应用与辅助决策奠定基础;采用成熟信息安全风险评估技术,对各个环节海洋信息可能存在的安全风险进行分析评价。

海洋大数据的安全与传统通信模式下的数据安全与隐私保护有显著不同,海洋大数据呈现出典型的结构性特征,包括“一对多”(一个用户存储,多个用户访问)、“多对一”或“多对多”等数据安全与隐私保护模式。从数据的业务流程上看,海洋大数据的处理可以分为数据访问服务、数据计算服务、数据共享服务和数据监管服务。因此,海洋大数据处理的安全挑战可以简单概括为“易共享、可计算、查得到、能监管”。

(1)大数据的访问控制是实现数据共享的有效手段。海洋大数据可能用于不同的场景访问中,因此,海洋数据被多个不同用户、不同角色、不同密级的人进行访问,其访问控制需求也十分突出。传统的访问控制技术主要依赖于对数据库访问控制,一旦数据库管理者或者服务提供商出现了恶意行为,数据的访问控制将难以确保安全,从而对用户隐私和机密数据造成侵害。

(2)海洋数据的计算分析是海洋大数据一个重要的应用。由于提供计算服务的大数据服务商不能被完全信任或者计算服务往往通过外包的方式进行,如何在实现数据隐私与机密性的前提下,依然能够实现数据的有效计算与分析,是海洋数据的重要需求。同时,能够克服目前已有同态算法效率低下的缺陷,提高计算与分析的效率,保证数据的有用性。

(3)在海洋数据共享与分发过程中,由于用户/节点的密钥可能被有意或无意泄露,导致数据被泄露或非法窃取,无法实现云环境下数据共享和分发机制的健康运行。由于现代密码技术往往仅依赖于密钥的安全性,如果无法对泄露者的密钥进行追踪和撤销,数据的安全体系可能会整体瓦解。

(4)对海洋数据监管是保证海洋大数据安全的又一重要手段。在数据存储、计算、共享与分发的过程中,恶意的用户可能会插入伪造数据,无意的用户可能会插入错误数据,如果缺少有效的监管监控,即拦截与删除违法信息、减少和降低冗余开销、检验存储内容完整性、验证计算结果的正确性等手段,都有可能导致数据利用环节出现问题。

4)海洋大数据发布与推送的实时性

海洋信息的价值也在于服务,针对不同等级的用户,根据其权限,采取基于混合云的海洋信息发布与服务推送技术,实现海洋信息的智能化发布与服务;利用信息安全保障技术,从防火墙、入侵检测、身份认证等各个层面对海洋信息进行全方位的安全防护,并对安全风险评价结果制定相应的安全措施予以应对。

在数据发布与推送阶段,面对海洋大数据的复杂性,传统的数据发布与推送技术已经不能满足海洋数据的需求,海洋数据发布与推送具有实时性与真实性的特点。

海洋数据的发布,尤其是灾难信息(如赤潮海啸)等数据的发布,需要及时迅速,这对海洋大数据的发布实时性提出了更高的要求,特别是对海量的海洋数据,做出快速的处理与判断,及时发布海洋信息,具有重要的意义。

发布海洋信息时,还需要考虑发布与推送信息的真实性。针对数据处理的结果,需要进行准确的判断与分析,避免因为误报信息,引起不必要的慌乱与紧张。同时,要防止恶意用户虚假伪造的信息进入发布与推送平台,需要进行信息源的认证与鉴别。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈