以多平台协同作战资源数据为基础,构建作战资源要素基础模型,研究一体化协同作战资源要素知识图谱和作战资源要素控制技术,突破动态作战资源知识图谱构建、作战资源要素控制过程及状态的知识图谱式展现等关键技术,建立作战资源要素控制指令集,实现基于知识图谱的一体化作战资源要素级控制,并通过场景仿真展示基于知识图谱的作战资源实体关系、属性及控制信息和基于代码指令的一体化协同作战资源要素控制过程,对效果进行验证,最终形成适用的系统。其总体方案如图6-9所示。
1.作战要素协同控制体系架构研究
通过分析研究装甲车辆作战特点以及对作战资源要素的控制需求,梳理要素协同控制流程及基本功能要求,建立作战要素协同控制体系架构,为一体化作战要素控制技术的研究及系统的研制提供指导。
作战要素协同控制体系结构:针对装甲车辆作战过程中的一体化协同控制需求,以指挥员对作战资源要素管控需求为牵引,从需求分析、信息平台、体系结构、运行方式等角度,开展基于知识图谱的作战要素协同控制体系结构研究。在分布式协同方式下,指挥员对各个作战单元包括传感器节点、武器节点以及平台装备实施操控,各个作战单元节点自主或协同完成探测、跟踪、识别和火力打击等任务。
作战资源要素关键点表现在以下几个方面:高原山地地理环境、典型高原气象环境(雨季、雪季、多低温);目标要素包括武装人员、轮式车辆、装甲车辆、直升机等;传感器要素包括雷达传感器、红外探测传感器、白光CCD传感器、激光告警设备、敌我识别设备、声音感知设备等;武器要素包括主炮、遥控武器战等;通信要素包括平台与平台之间的通信采用无线通信;定位设备要素包括北斗导航定位、惯导等。
图6-9 基于知识图谱的多平台一体化作战要素协同控制技术总体方案
对作战资源的一体化协同控制模式分为以下几种:
(1)传感器与武器资源的协同控制。一个平台上的传感器发现的目标,根据作战任务的需要对该目标进行火力打击或警告射击时,优先采用本平台上的武器实施。
(2)平台间传感器的协同控制。当一个目标从A 平台的探测范围移动到B平台的探测范围,为保持对目标的持续跟踪,可通过指挥控制节点对B 平台的传感器发送控制命令,完成对目标的跟踪与监视。
(3)平台间传感器与武器的协同控制。A 平台的传感器发现的目标,根据作战任务的需要对该目标进行火力打击时,A 平台因为武器状态不具备等原因无法实施打击时,可通过指挥控制节点对B 平台的武器发送控制命令,完成对目标的打击任务。
(4)平台间武器与武器的协同控制。当一个目标从A 平台的打击范围移动到B 平台的打击范围,为保持对目标的持续打击,可通过指挥控制节点对B平台的武器发送控制命令,完成对目标的持续火力打击;或是A 平台、B 平台的武器在一段时间内协同打击指定目标。
各个作战资源要素之间的协同建立在对战场知识的统一认知基础之上。
2.一体化协同作战资源要素实体及要素关系抽取技术研究
通过分析一体化协同作战资源要素控制需求及资源数据特性,研究作战资源要素实体、实体间关系及实体属性概念及其抽取方法,建立面向典型作战任务的协同控制要素实体及关系。作战资源要素实体抽取是指在知识体系约束和引导下,从异构数据中自动抽取实体的名称以及实体间关系。要素实体抽取一般分为实体抽取和关系抽取。现阶段,实体抽取的准确率较高,已经可以在实际的工程中应用;关系抽取是得到知识单元的过程,是构建知识库的基础。下面将从作战资源要素实体和关系抽取两个方面来进行介绍。
1)作战资源要素实体抽取
作战资源要素实体抽取采用命名实体识别(NER)技术。对文本数据可采用基于规则的抽取技术,对结构化等其他数据可采用基于统计机器学习的方法来进行研究。
(1)基于规则的作战资源要素实体抽取技术。在作战领域中,拥有着大量的军事概念,为了构建多功能域知识图谱,首先就要从海量作战数据中抽取所有与作战资源要素有关的概念。对概念的抽取,一种方式是基于规则,进行文本抽取。这种概念抽取方式是利用军事词典,在限定军事文本领域、限定语义单元类型的条件下进行的,如使用已定义的规则,抽取出文本中的人名、地名、物品名、组织机构名、特定时间等实体,其中主要用到了启发式算法与规则模板相结合的方法。
①规则的表现形式。作战资源要素信息抽取的规则一般由一组条件和一个对应的动作组成。条件包括命名实体特征和上下文环境特征;动作指将命名实体标记为相应的类别。规则使用的实体特征可以包括:字符串、词形特征(如大小写和标点符号等)、词性特征、词所属的概念类别以及上下文环境中词的共现等。当输入文本满足规则规定的条件时,相应的动作就被触发。用来进行概念抽取的规则按照表现形式可以分为以下三类。
a.定义概念本身。这类规则同时限定作战资源要素概念的组成形式以及它的上下文边界。
b.定义概念的边界。有时无法对作战资源要素概念的组成形式给出准确而全面的定义,但可以给出概念的上下文边界的定义。
c.定义多个实体。可以利用作战资源要素概念处于同一个上下文环境来做语义消歧,进而同时定义多个概念。
②规则库的构建。基于规则的方法首先要做的就是对规则库的构建,可以通过人工编写和自动学习两种方式产生概念抽取的规则,基于人工编写的方式,就是军事作战领域专家或者语言学家手工编写抽取规则。该方法需要规则的编写者具备丰富的领域知识和语言学知识,同时还需要大量的人工分析来进行总结归纳,是一项非常耗费时间和人力的工作,但是这种方法也往往能够得到非常高的准确率。
③规则自动学习。自动学习的输入是一个已经标注出待抽取结果的文档集,输出是一组用于抽取的规则。已有的规则自动学习方法有序列覆盖方法(sequential covering algorithm)和基于转换的学习方法(transformation based learning)两类,它们分别对应于规则从无到有的建立和对已有规则的选取两步。
算法:基于序列覆盖方法的军事规则学习算法。
输入:初始军事实体词库E、大量非结构作战资源数据C。
输出:规则集合。
步骤一:Rule_set={};学习的规则集初始为空
步骤二:for 每个类c do
步骤三:repeat
步骤四:从特征值中学到一个Rule
步骤五:从D 中删除被Rule 覆盖的元组
步骤六:until 终止条件被满足
步骤七:Rule_set=Rule_set+Rule
步骤八:end for
步骤九:返回Rule_set
使用基于统计学习算法对军事概念进行抽取。该方法一般将文本切分成若干片段之后对每个片段进行自动分类,选出那些构成实体及属性的片段输出。切分可能存在不同的层次,可以切分成字或切分成词,这使得分类的特征有所不同。基于这些切分后的文本,首先人工选择一部分标注出那些实际构成实体的片段,形成标注语料库,然后根据语料库,利用统计方法,训练出根据文本片段的上下文环境来推测它构成实体及属性的概率模型,最后将模型应用于那些未标注的文本进行分析,选择可能性最大的输出。
(2)基于CRF(条件随机场)和人工智能算法的作战资源要素实体抽取。对作战资源要素实体的抽取,还可以利用条件随机场和人工智能算法相结合来实现。在对要素实体的抽取中,由于面对海量的网络军事文本,进行标注会消耗大量的人力、物力资源,若仅使用少量标注语料进行有监督学习,通常难以学得泛化能力强的模型,故可以选择半监督学习Self- Training 算法在少量标注语料和大量未标注语料上学得泛化能力较强的模型(图6-10)。
图6-10 Self-Training 过程
HMM、MEMM 和CRF 常用来为序列标注建模,HMM 的一个主要缺陷是其输出独立性假设限制了特征的选择,导致在一个模型中不能考虑多个特征。MEMM 相比于HMM 不存在特征受限的问题,但它在每一节点都要进行归一化,只能找到局部最优值,同时也带来了标记偏置的问题。CRF 则可以任意选择特征,它继承了MEMM 的优点,同时又解决了MEMM 的标记偏置问题。它并不在每一个节点进行归一化,而是所有特征进行全局归一化,由此可以求得全局的最优值。
2)作战要素实体语义关联关系抽取技术(www.xing528.com)
作战要素实体关系抽取方法采用有监督学习的关系抽取和基于深度学习的关系抽取。在本课题研究中,对于易于获得训练样本的数据,采用有监督学习的关系抽取方法;而对于海量、难以获取训练样本的数据采用基于深度学习的方法,并且比较相关方法的抽取精度和质量。
(1)有监督学习的关系抽取。针对文本类型以及结构化的军事作战任务背景的语料和数据,基于传统的关系抽取技术处理的方法是使用基于特征向量的关系抽取方法。该方法的关键点在于如何选择出能够进行关系区分的关系特征构成特征向量,即相应的关系特征模式。可基于一体化协同控制领域知识图谱进行设计或是将构建知识图谱时采用的关系特征作为先验知识进行关系特征模式的构建。
(2)基于深度学习的关系抽取。针对文本类型以及结构化的军事作战任务背景的语料和数据,基于深度学习的方法的关键点在于深度神经网络模型的选择和训练。目前应用最多的深度学习模型是卷积神经网络(CNN)。神经网络模型自动地学习高级抽象特征,相比于传统的方法而言,不需要人为地设计关系特征的模式,而是从已有军事领域知识图谱中抽取训练数据,使用词嵌入等操作将其中每个单词转换成简单的分布式表示,然后作为神经网络模型的输入对神经网络模型进行训练。神经网络模型基于输入的低级特征自动学习高级的抽象语义特征,并依据学习到的高级特征进行关系类型判定。通过训练,使得在输入端仅仅输入低级的语义特征即可在输出端获取对应的实体关系类型。由于人为地设计特征并不一定能覆盖所有的相关信息,可以使用深度学习技术自动地进行特征选择以及关系提取。目前应用最多的深度学习模型是卷积神经网络,该方法同样分为两个阶段:模型训练和关系抽取(图6-11)。
①模型训练阶段。从已有知识库的知识图谱中选出包含所有关系的部分数据作为正例,对数据进行词嵌入等操作,将数据转换为单词等级的分布式表示,然后作为神经网络模型的输入对CNN 神经网络进行训练,从而获得可以进行分类的模型。
②关系抽取阶段。对包含实体和任务上下文的语料进行训练数据相同的处理,如词嵌入,然后代入CNN 神经网络中进行处理,从而得到输出的实体关系三元组数据,用于进一步的知识查询。
3)面向作战数据的武器装备实体与关系抽取
武器装备实体抽取指从大量的作战数据中识别出命名实体,其抽取的实体质量对后续的知识获取(关系抽取、属性抽取等)的质量和效率有着重要的影响,因此武器装备的实体抽取是武器装备知识图谱构建中最为基础和重要的部分。
图6-11 基于文本内容的深度学习关系抽取方法
武器装备实体抽取主要涉及的关键技术为基于结构化作战数据的获取。初始国家武器装备实体的抽取首先是从已有的作战结构化数据中提取已有的国家武器装备实体,主要包括武器装备库的数据、百科类作战相关数据(百度百科、互动百科和维基百科等)、搜狗词库和QQ 词库等。对获取的数据进行清洗、整理和去噪,获得基于百科类的初始武器装备实体库。
4)战场环境知识信息提取
战场环境中多元信息复杂多变,并且战场中实体间的影响关系模糊,人工难以全面地把握战场环境和进行精确的战场推演。通过融合战场中的多元信息建立战场环境知识图谱有利于决策者全面地把握战场环境,并帮助决策者进行更加精确的战局推演,为作战的指挥决策提供参考。
3.基于作战任务的作战资源要素统一建模技术研究
基于抽取的一体化协同作战资源要素,分析资源要素数据特性,建立资源要素的规范化统一表示模型,为作战资源知识图谱的构建提供基础。
1)基于作战任务的作战资源要素分析
作战资源要素包括:敌我传感器设备参数信息、敌我武器设备参数信息、我方传感器状态信息、我方武器状态信息、地理环境数据、气象环境数据、通信设备状态信息、时间统一设备、平台定位设备、敌方目标信息、敌我固定工事参数信息与状态信息等。
2)作战资源要素统一表示
为消除异构数据之间的特征和表示差异,对多源异构作战资源数据实现统一表示,以在统一表达的基础上进行存储、索引、查询、知识抽取以及推理。采用基于词汇级语义互联的多源异构作战资源数据的统一表示模型,如图6-12所示。该模型由异构作战资源数据的底层特征表达层、底层特征词汇映射层、词汇级语义互联表达层构成,从异构数据到统一语义表示逐层次语义抽取和映射,最终实现基于词汇级语义互联的多源异构作战资源数据的统一表示。
图6-12 基于知识图谱语义划分的异构作战资源数据索引结构
3)作战资源数据组织模型构建与资源数据索引
(1)基于表示学习的知识图谱检索。由于基于关键字匹配的传统搜索引擎存在返回内容冗余、不精确、搜索接口不友好等问题,知识搜索成为当前越来越热门的课题。知识搜索能够通过语义维度的解读为用户提供更精确的信息,能够通过每一个蕴含丰富信息的节点为搜索结果提供更好的摘要,能够根据其特有的图模型特性通过深度和广度遍历为搜索结果提供更广、更深的拓展,能够揭示知识领域的动态发展规律,为学科研究提供切实的、有价值的参考。但目前对知识图谱的查询仍存在自然语言歧义性和语言表达多样性的问题。
(2)面向作战的知识图谱检索。由于军事领域的特殊性,面向作战的知识图谱构建时考虑了其特有的军事知识体系,因此在进行面向作战的知识图谱检索时,我们将作战领域、兵种、战斗类型、战斗阶段等军事属性和相互关系考虑进去,这样能根据不同的作战背景,生成不同检索需求的上下文,从而快速缩小检索范围,呈现给用户针对作战的、及时的子知识图谱。简而言之,就是检索的上下文表达是随着作战上下文变化的,同时不同的上下文对应的战争阶段看到的知识图谱也是可调整的。例如,在岛屿争夺作战中,登陆前轰炸,可能重点需要军事心理学、天气、洋流方面的知识,同时可指定后续关注点为运输组织、军事运筹学等方面的知识,而军事纵深防御方面的知识可能就需要在处理的过程中尽快筛选或屏蔽掉。
(3)快速战场态势变化的知识图谱抽取技术。随着对军事概念、军事实体的不断抽取,越来越多的关系也被挖掘出来,并且随着时间的推移,军事知识图谱的规模也在不断扩大,而在未来,军事知识图谱将会与物联网、传感器网、社会网络进一步融合,极大地丰富军事知识图谱的数据来源,使得军事知识图谱更具噪声。为了能够对战场态势做出迅速反应,就必须实现高效快速的军事知识图谱查询机制。
(4)时空动态作战数据的索引。当前时空动态作战数据具有海量、异构、多源、语义信息丰富、更新快速等特性,为其高效检索带来了极大的困难。应拟定义动态作战数据的多级索引结果;设计基于空间编码的动态作战数据的划分策略;研究构建多时空动态作战数据在分布式环境下的构建方法,以提高动态作战数据的索引构建效率和构建质量。
4.协同作战资源知识图谱动态构建与更新技术研究
通过对作战资源要素的时空特性、要素实体及其关系的分析,建立实体之间的关联关系,提出协同作战资源知识图谱构建和动态更新方法,支撑面向一体化协同作战资源要素控制的知识图谱动态构建。在作战过程中,武器装备、传感器装备、工事等性能参数信息是静态的,武器/传感器等的状态信息是动态更新的,环境数据、目标数据等处于动态更新的状态。作战资源数据的新增与演化势必造成协同作战资源知识图谱的变化,包括作战数据语义的变化,知识图谱中实体的变化,实体属性的变化,以及实体之间关系的变化。研究协同作战资源知识图谱动态构建与更新技术,可为一体化协同控制提供技术支撑。
1)面向动态作战资源数据的时空知识图谱构建
时空知识融合方法将面向作战的资源要素获得的知识有层次、有结构、有次序地关联组织起来,构建相应的知识图谱来支撑传感器、武器的一体化协同控制。这主要包括动态作战资源数据的序列构造、动态知识评估方法研究、动态知识扩充方法研究、带有时空属性的知识融合等。
动态作战数据的序列构造主要针对如何有效地预测不同尺度分布的时空序列的问题。动态知识评估方法解决从不同数据源中获取的知识之间在时空维度上的冲突和不一致性,从中找到其真实世界的时空位置,即知识的真值。动态知识扩充方法将从多源大数据中获取的知识经过知识评估,验证为正确的知识更新到知识图谱中,与知识图谱中已有的知识进行关联计算与合并计算,从而丰富图谱中的知识。带有时空属性的知识融合研究时空大数据多维关联描述的形式化表达、关联关系动态建模与多尺度关联分析方法,时空大数据协同计算与重构提供快速、准确的面向任务的关联约束对带有时空属性的数据进行融合,并对知识进行评估,评估方法包括贝叶斯估计、D- S 证据理论、模糊集理论、图模型等;并进一步对知识进行扩充,包括实体扩充、关系扩充、分类扩充;进而构建时空知识图谱。
2)多功能域知识图谱的动态更新
大规模资源的作战环境的一个重要特性就是其作战数据不断新增,旧的作战数据不断演化。作战数据的新增与演化势必造成多功能域知识图谱的变化,包括作战数据语义的变化、知识图谱中实体的变化、实体属性的变化,以及实体之间关系的变化。如何使得提出的多功能域知识图谱符合资源本身的演化特性,同时在不重构知识图谱的基础上,准确地将新作战数据加入原先的知识图谱中,便是重要的问题。
3)带有时空属性的知识融合技术
时空属性数据是最重要的军事大数据之一。时空数据由于其所在空间的空间实体和空间现象在时间、空间和属性三个方面的固有特征,呈现出多维、语义、时空动态关联的复杂性。
5.基于代码指令的要素控制技术研究
面向一体化协同作战任务及其对应的作战资源要素控制需求,细分传感器、武器等资源的控制功能,形成原子功能集,研究基于作战任务、作战资源要素等信息的资源要素控制技术,建立作战资源代码指令集,以及指令所对应的传感器、武器等作战资源控制动作序列、控制对象和控制信息。
战场作战资源要素种类繁多,作战资源要素在不同的作战任务场景下运用模式不同。基于构建的作战资源一体化协同控制知识图谱,设计作战资源要素控制的代码指令集合,实现对武器类、传感器类、目标类等作战资源的要素级控制操作功能的全部覆盖,明确代码指令的内涵与表示方式,通过代码指令的形式实现对传感器、打击武器、防护武器等作战资源要素的一体化协同控制。编码生成模型如图6-13所示。
从作用对象的角度,将作战资源要素的控制指令分为传感器类、武器类、通信设备类、平台类、定位设备、时间设备等指令控制类别。对每一类的指令分为平台动作操控指令、平台工作模式控制指令、平台工作时间控制指令、平台作用空间控制指令、平台基本状态控制指令等。
图6-13 编码生成模型
6.基于实体关系的图谱展现与仿真研究
以知识图谱的形式表示基于代码指令的作战资源要素控制过程、作战资源要素实体及其关系和属性,并通过场景仿真展示、验证基于知识图谱的一体化作战资源要素控制技术。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。