数据是从数量上反映的对现实生活的理性描述。在当代社会,计算机可以处理的图像、声音、文字等都被认为是属于数据的范畴。
数据存储的最终目的是为了共享(当然,共享的范围各有不同)。所以在数据存储时需要将数据保存到大家都能够方便访问的位置,并且需要一种大家都能够理解的格式来存储。如果数据越来越多,则需要寻找一种能够在大量数据中快速、准确地搜索到所需要的信息的方法。随着数据处理要求的不断提高,人们意识到可以使用计算机来帮助人们有效地管理这些数据,这种技术就是数据库技术。数据库技术是计算机软件的一个重要分支,也是软件开发人员必须掌握的技术之一。数据库就是存储数据的空间。一般认为,数据库数据的集合,是存储数据的“仓库”。其中数据是以一定的组织方式存储的相关数据。数据库是独立的,它可以为多个应用程序所适应,达到共享数据的目的。
非遗资源图谱数据库是指存储非物质文化遗产图谱数据的软硬件存储系统,主要包括网络存储设备的选型、安装、调试和使用,数据库管理系统,存取数据的软件平台,不同保存方式的数据存储方案的确定和实施,以及数据存储系统的升级、维护与持续建设的计划和工作需求等。设计与开发非物质文化遗产图谱数据库是利用数字技术进行非物质文化遗产保护的新路径,而其中的数据库表建设是非物质文化遗产图谱数据库中的最重要的对象。可以说,数据库只是一个框架,数据库表才是其实质内容。数据库表是非物质文化遗产图谱数据库数据录入的操作标准。非物质文化遗产图谱数据库是一个搜索类产品,非遗资源数据是其核心内容。非遗资源数据的内容和质量直接影响用户的最终使用效果。基于此,建立一套合理规范的数据录入标准是非常重要的。作为数据录入标准的数据库表是其他对象的基础。没有数据库表,关键字、主键、索引也就无从谈起。此外,根据非物质文化遗产图谱数据库的设计理念,数据库表还是各地非物质文化遗产图谱数据库进入非物质文化遗产图谱数据总库的接入标准,便于不断扩容数据总库。根据信息的分类情况,一个数据库中可能包含若干个数据库表。通常用到的非物质文化遗产图谱数据库表,主要包含用户表、非遗资源项目表、非遗资源要素表、系统菜单表、地名表、邮件表等(见下表)。
表9-1 非物质文化遗产图谱数据库常用表
用户表用于管理用户信息以及用户登录信息;系统菜单表用于管理系统操作界面上的所有菜单,如果以网页的形式显示系统,那么每一个菜单就是网页内容跳转的链接点;地名表用于保存各个地名,如省、市、县等,通过地名可以实现非物质文化遗产项目的检索;项目表管理所有非遗资源项目的一般信息,如类型、来源、级别等;要素表管理所有非遗资源的要素信息;邮件表用于管理所有管理员级的用户信息,方便通信。这些各自独立的数据库表通过建立关系被连接起来,成为可以交叉查阅、一目了然的数据库。
项目表与要素表都是直接管理非遗资源信息的数据库表。两种数据库表的区别在于项目表用于管理非遗资源项目的一般信息,主要是文本信息。而要素表则用于管理非遗资源的要素信息,以图像信息为主。按照非物质文化遗产图谱数据库的设计理念,非遗资源项目表的主要内容包括项目名称、项目来源、所属地区、级别、类别等一般文本信息。非遗资源项目表主要字段的属性设置见下表。
表9-2 非遗资源项目表
非遗资源要素表的主要数据类型是图像,它是整个图谱数据库系统的核心部分。要素是构成事物的必要因素,是组成事物的基本单元。[13]非遗资源要素是构成非遗资源的必要因素。按照非物质文化遗产图谱数据库的设计理念,非遗资源要素表包括非遗资源的主要内容、历史发展、濒危状况、保护情况、传承情况、生态环境等,这些情况主要以图谱的形式表现出来。非遗资源要素表主要字段的属性设置见下表。
表9-3 非遗资源要素表
非物质文化遗产图谱数据库中的数据以图谱为主,该数据库属于图像数据库,其中的数据大部分都是二进制大对象,即blob数据。目前对于blob数据的管理大都采用表+实体的方法,即blob数据以文件形式存放于指定的计算机目录下,在数据表中只反映blob数据文件的存储路径。表+实体的方法是blob数据存储的一种方法,根据数据库的不同使用和维护的情况,blob数据也可以存储为image数据类型,即直接存储图像数据。对于非物质文化遗产图谱数据库而言,表+实体的方法更适宜其bolb数据的管理。一方面,image数据类型的大小限制是2GB,超过2GB的图像数据无法以image类型存储,而非遗图谱数据库中高清图像以及录像有可能超过2GB;另一方面,非物质文化遗产图谱数据库的日常维护需要使用远程存储。非物质文化遗产图谱数据库的设计规模是全国性的,也就是说将在各地推广使用该数据库。而各地的图像数据总量庞大,更适合保存于指定的当地目录下面,只将其存储路径存放于数据库表中。
非遗资源要素表是数据库表的核心,有必要对其进行细致的分析。非遗资源要素表中的字段体现了非遗资源的构成要素。这些要素并非随意出现,而是以一定的结构关联在一起。非遗资源要素中最重要的部分就是它的主要内容,本课题称为本体要素。本体要素是指能体现非遗资源本质特征的要素,是非遗资源中最根本和最基本的部分。以传说为例,某项传说资源的本体要素是该传说的母题、情节与异文,它表现了传说的口传性、叙事性等根本特征。本体要素之外的其他要素,均与本体要素有直接关系,以本体要素为中心点,呈放射环状分布。(www.xing528.com)
为了论述的方便,本书中将非遗资源各要素中位于中心点的本体要素称为A要素,A即autologous(adj.自体同源的,自体固有的)。A要素是所有非遗资源要素中最重要的一种要素,某项A要素的内容能决定该项非遗资源的类别。A要素之外的其他要素围绕着A要素呈放射环状分布。为了论述的方便,本书中将A要素以外的其余要素称为P要素。P即peripheral(adj.外围的,次要的)。考虑到各P要素代表的内容不同,可以将这些P要素分别命名为P1要素、P2要素、P3要素、P4要素……为了研究的方便,可以预先设定各P要素所代表的内容。我们的设定如下:P1代表非遗资源生成发展的历史要素,P2代表非遗资源生成发展的地域要素,P3代表非遗资源的传承要素,P4代表非遗资源的传播要素,P5代表非遗资源相关的器具、制品等要素,P6代表非遗资源的濒危状况要素,P7代表非遗资源的保护点、保护中心等保护要素,P8代表非遗资源的价值要素,P9代表非遗资源的相关文物古迹、风俗等生态环境要素,P10代表非遗资源的衍生形式要素。
表9-4比较清晰地显示非遗资源其余要素的具体构成:
表9-4 非遗资源其余要素代码及其含义
而A要素和P要素之间的结构关系,如图9-4所示:
图9-4 非遗资源要素结构图
注:本图为本书课题组根据对非遗资源要素结构数据库建设的研究结果编制。
A要素与P要素所构成的放射环状结构,是非遗资源项目的共同结构。但具体到每一项非遗资源则可能出现某种P要素缺失的情况。如某项分布广泛的传说可能缺乏明确的传承人和清晰的传承脉络,因而缺失P3要素;而民间技艺、美术这两类非遗资源一般没有相关的文物古迹、风俗等生态环境要素,因而缺失P9要素。A要素和P要素之间是放射关系,也就是说所有的P要素都与A要素直接相关。但A要素与P要素的关系有紧密与疏松之别,一部分P要素必须紧紧依托于A要素才能存在,它们与A要素之间的关系异常紧密。P1到P8这八种要素分别展现了非遗资源的历史发展、地理分布、传承脉络和传承人、传播过程、器具和制品、濒危状况、保护状况、保护价值等方面,它们的主体就是非遗资源的主体也就是A要素,它们与A要素之间的关系相当于句式结构中的谓语与主语之间的结构,谓语无法脱离主语独立表达语意。而另一部分P要素则可以独立于A要素之外存在,比如P9与P10要素。它们与A要素之间的关系相当于宾语与主语之间的关系,宾语往往不需要主语就能独立表达语意。P9要素是生态环境、地方风物、古迹、风俗等,这些要素或者因非遗资源的本体而产生,或者被附会与非遗资源的本体相关,但此后均能独立存在。P10要素是非遗资源的衍生形式要素,比如因白蛇传传说产生的白蛇传戏曲等,这些要素经过长期的发展,可以完全独立存在,它们与非遗资源本体之间的联系甚至已渐不为世人所知。P10要素与A要素之间的关系最为特别。P10要素是由A要素衍生而成,但在不断的发展演变中,P10要素也对A要素产生影响,比如民间文学中的“反哺”现象。“反哺”现象阐述的是民间叙事经典化后,包括经典文本在内的文本成为民间叙事的新源头,借助文本的流传,反过来又成为民间叙事的依据。[14]也就是说,P10要素与A要素之间是明显的双向关系,P10要素由A要素产生,但P10要素的发展也促进A要素的发展。
上述放射环状分布结构囊括了非遗资源的诸要素,并体现了各要素与本体要素之间的内在关系。A要素作为本体要素,是上述放射环状分布结构的中心和最重要的要素,除了因为它与所有其他外围要素都有关联之外,它的重要性还体现在能依靠自身而迅速确定该项非遗资源的分类。非物质文化遗产图谱数据库中的类型划分依照国家级非遗名录的十大类别进行,将所有的非遗资源划分为民间文学,传统音乐,传统舞蹈,传统戏剧,曲艺,传统体育、游艺与杂技,传统美术,传统技艺,传统医药,民俗等十大类。比如A要素显示了情节、母题等特征的就可以归为民间文学类别,A要素显示了唱念做打等特征的就可以归为传统戏剧类别,A要素显示了曲式结构、乐句旋律、音乐语言等特征的就可以归为民间音乐类别。十大类下还各自有小类别。比如民间文学门类下还有传说、故事、神话、歌谣、谚语等小类别的区分。而作为外围要素的P要素,在非遗资源的小类别划分中就起到重要作用。总的来说,相似度越高的P要素,其所在的非遗资源越属于同一小类。
如表9-4所示,分类是非遗资源数据库表中项目表的重要内容,A要素和P要素对分类的贡献实际上构成了要素表和项目表之间的内在逻辑关系。项目表显示的是非遗资源的一般信息,要素表显示的是非遗资源的要素信息。两张表共同构成非遗资源的全部信息。它们之间虽然可以通过非遗资源的名称实现互访,但这样的关联只是最浅显的。两者之间的内在联系在于要素表实际上是项目表中“类别”的展开。类别是非物质文化遗产图谱数据库的主要检索方式之一。所有的非遗资源都归属于一定的类别,用户可以通过类别检索得到同一类别下的所有非遗资源,进而了解每一项非遗资源的详细信息,这些详细信息就来自要素表。
P要素作为外围要素,在数据库的越级展开中负责呈现更复杂多变的搜索结果。P要素大体可以分为以时间和以空间为线索的两大部分。其中,P1要素、P3要素、P6要素、P10要素基本以时间发展的先后为线索,而P2要素、P4要素、P5要素、P7要素、P9要素则基本以空间的转移为线索或以空间本身为界限。(当然,这样的划分并不特别准确,比如P10要素代表非遗资源的衍生形式,从非遗资源到衍生形式的发展可以看作是一条时间线索,但各衍生形式之间则比较难构成时间线索;又比如P5要素代表非遗资源相关的器具、制品等,非遗资源与其器具、制品具有某种空间关系,但器具、制品本身又并非空间范畴。此外,P8要素即非遗资源的价值要素无法划入以上两大部分。)前面已经论述过,非物质文化遗产图谱数据库是数据库类型中的图像数据库,无论是“图”中的图片、地图、图示、图表,还是由一定关系构成次序而形成的“谱”,都可以归为图像。图像数据库中的数据,除了直观的图片外,大都是要借助图像表达一定的时空关系。而以时间及空间关系展开的P要素就是显示这种时空关系的关键。一般来说,以时间为线索的要素可以采用推衍层次结构或平行结构等结构图来展现,而以空间为线索的要素则适合直接用地图或图片来展现。这正是非物质文化遗产图谱数据库中数据采集、制作的大体思路。
以上是对非物质文化遗产图谱数据库表的设计思路的概述,具体制作过程中可能会有变化。总之,数据库表是非物质文化遗产图谱数据库中最重要的内容,它的设计优劣直接关系到数据库用户的最终使用效果,因而值得反复考量。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。