知识元由以下3个层次组成:检索层次,包括学科专业名称、分类号、知识元名称、知识级别、知识元关键词等检索点;知识元描述层次,对知识元的内容进行完整的文字描述及声像辅助描述;关联层次,与该知识元相关联的内容链接条目清单,由知识元链接地址和知识元关键词之间的语义关系进行扩展[12]。
由此,CADAL数字图书馆知识标引(CKI)中的知识元可定义为一个六元组:
式中:KEID——知识元标识号,采用URI表示;
N——知识元名称,即知识元的标题,是对本知识元的知识内容的一种高度概括表述,用一个较短的字符串表示;
C——知识元的关键字集,即一组概念集,可用于检索本知识元的关键字集;
D——简要说明,是对本知识元内容的简要描述。通过该描述,一方面,在构建知识元结构模型时,可以提高选择知识元的准确性;另一方面,在实现知识共享时,可以使知识使用者直接获得知识内容,而不需要再到庞大的载体中去寻找[13];
KC——知识类别,指对知识体系按照学科标准分成若干领域,并且与学科分类号分别对应,即对知识体系按照一定标准划分后的各个子项,如采用学科为标准,知识类别可以分为生物、哲学、管理学、文学等领域;
KL——知识级别,按照认知方式可以划分为概念、公理、规则和方法4类,这4类也是知识级别由简单到复杂递进的4个层次,概念指在头脑里所形成的反映对象本质属性的思维形式,公理指依据人类理性和愿望发展起来而共同遵从的道理,规则指长期形成的规律,方法指为达到某种目的而采取的途径、步骤、手段等,从概念、公理、规则到方法反映了人们由浅到深的认知方式[14],文献资源中知识元的知识级别,也可作为该文献学术水平切分的一个参考依据。
L——知识地址,指在构建知识库时所赋予某一知识元的唯一位置标识,一般是链接到知识元所在的载体的超级链接,通过该信息,知识的使用者可以获得该知识元更深入完整的信息。
以知识元为节点,以知识元之间的关联(包括知识元的地址关联、知识元关键词的语义关联等)为边建立起来的链接称为知识元网。该网络可以表示为KENet=(KE,R),其中KE={ke 1,ke 2,…,ken},为知识元集合,R为知识元之间关联关系的集合。关键词(概念)之间的语义关联定义如下。
定义(层级关系):根据概念间的包含关系,可将概念区分为上位概念和下位概念。上位概念称为大概念,下位概念称为小概念。按同一标准(同一维度)划分并处于同一层面的概念称为并列概念。层级关系主要指属种关系,即概念外延的包含关系。小概念(种)的外延是大概念(属)外延的一部分。小概念除了具有大概念的一切特征外,还具有本身独有的区别特征[15]。示例:(属)-树;(种)-乔木、灌木。
定义(父节点):在知识元O,H=(h,)中,如果x,y∈h,xy,且不存在概念z≠(x,y),满足xz且zy,则概念y称为概念x的父节点。
定义(规则分类体系):若知识元概念分类体系H=(h,)满足以下3点,则称H是规则:
(1)h中存在一最大概念y,对任意的x∈h,有xy;
(2)存在概念集h i(i=0,1,…,n-1),使得h=且h i∩hj=ϕ(i≠j);
(3)若hi中一个概念的父节点在h j中,则hi中所有概念的父节点都在h j中(i≠j)。
定义(超类、子类):对任意的类C 1和C 2,如果∀i:是实例(i,C 2)→是实例(i,C 1),即domain(C 2)⊆domain(C 1),则称C 2为C 1的子类,记为是子类(C 2,C 1);相应地,C 1称为C 2的超类,记为是超类(C 1,C 2)。
为便于讨论,我们引入以下关系:(www.xing528.com)
(1)有子类(C;C 1,…,Cn)≡是子类(C 1;C)∧…∧是子类(Cn;C);
(2)是子类(C;C 1,…,Cn)≡是子类(C;C 1)∧…∧是子类(C;Cn);
(3)有超类(C;C 1,…,Cn)≡是子类(C;C 1)∧…∧是子类(C;Cn)≡是子类(C;C 1,…,Cn);
(4)是超类(C;C 1,…,Cn)≡是子类(C 1;C)∧…∧是子类(Cn;C)≡有子类(C;C 1,…,Cn)。
在一个类的子类中可能存在某种次序,这种次序可能来源于领域的约定,也可能是为了便于记忆和教学而引入有顺序子类(C;C 1,C 2,…,Cn)。它逻辑上与有子类(C;C 1,C 2,…,Cn)等价,但是保留了领域的子类出现次序:
有顺序子类(C;C 1,C 2,…,Cn)≡有子类(C;C 1,C 2,…,Cn)
定义(直接超类、直接子类):对任意的类C 1和C 2,C 1不同于C 2,并且是子类(C 2,C 1)。如果对任意的类C 3,是子类(C 3,C 1)∧是子类(C 2,C 3)→C 2=C 3,则称C 1是C 2的直接超类,记为是直接超类(C 2,C 1);称C 2是C 1的直接子类,记为是直接子类(C 1,C 2)。
在分类体系中,一个类可以是多个类的直接子类,或者说一个类可以有多个直接超类。
定义(类的覆盖与划分类):C,C 1,C 2,…,Cn为知识元概念中的类,并且C 1,C 2,…,Cn为C的子类,如果∀i:是实例(i,C)↔∃k:是实例(i,Ck),则称{C 1,C 2,…,Cn}是C的一个覆盖。如果{C 1,C 2,…,Cn}中的任何真子集不是C的覆盖,则称{C 1,C 2,…,Cn}是C的极小覆盖。如果{C 1,C 2,…,Cn}是C的极小覆盖,并且∀i,∀j:i≠j→domain(Ci)∩domain(Cj)=ϕ,则称{C 1,C 2,…,Cn}为C的一个分类(classification)或划分(partition)。
根据超类和子类关系,可以定义类的等价。
定义(类的等价):对任意的类C 1和C 2,类C 1等价于C 2,记为eqv(C 1,C 2)当且仅当是子类(C 2;C 1)∧是子类(C 1;C 2),或者是超类(C 1,C 2)∧是超类(C 2,C 1)。
定义(上位节点):给定一分类系统,其中C,C 1,C 2,…,Cn为其节点。如果∀i:是成员(i;Ci)→是成员(i,C),则称C为C 1,C 2,…,Cn的上位节点,记为是上位节点(C;C 1,C 2,…,Cn)。
分类关系主要考虑上下位关系(Is-A)和部分整体关系(Part_Of)。
定义(Is-A):对于概念集SC中的概念C 1,C 2∈SC,如果有:①概念C 1的内涵包含C 2的内涵,即I(C 1)⇔I(C 2);②概念C 1的外延包含于C 2的外延,即E(C 1)⊂E(C 2),该关系存在于种概念和类概念之间。A Is-A B=def∀x[inst(x,A)→inst(x,B)],则将概念C 1和C 2之间的关系称为种属关系,记作Is-A(C 1,C 2)。
定义(Part_Of):知识元概念A与B是部分关系,当且仅当:对A的任一实例x,存在B的某些实例y在实例级与x为部分关系;反之亦然,即定义为A Part_Of B=def A part_for B&B has_part A。Part_Of关系不具自反性和对称性,但具传递性。
在知识元(概念)中,除上述的分类关系外,还包括非分类关系(non-taxonomic),又称为非层级关系,它反映了概念间的某些语义关系,其类型多种多样,主要包括:序列关系、空间关系、时间关系、因果关系、源流关系、发展关系、联想关系、推理关系、整体部分关系等。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。