首页 理论教育 数据库文档、记录和索引的重要性

数据库文档、记录和索引的重要性

时间:2023-07-25 理论教育 版权反馈
【摘要】:按照数据库的编排结构,即数据库中每条记录数据项的编排方式,数据库有顺排文档和倒排文档两种。因此,在实施检索时,必须和顺排文档配合使用,先在数据库的倒排文档中查得文献篇数及其记录存取号,再根据存取号从顺排文档中调出文献记录。

数据库文档、记录和索引的重要性

1.数据库的文档

数据库是由文档(File)构成的。按照数据库的编排结构,即数据库中每条记录数据项的编排方式,数据库有顺排文档和倒排文档两种。

(1)顺排文档:顺排文档存入了数据库的全部记录,文献记录按照存取号的大小顺序排列,类似于检索刊物中按文摘号排列文摘款目。每一篇文献为一条记录单元,一个存取号对应一条记录,存取号越大,对应的记录就越新。由于它存储记录的最完整的信息,所以,又把它称之为主文档。如果在顺排文档中进行检索,计算机就要对每个检索提问式逐一扫描数据库中的每一条记录,存储的记录越多,扫描的时间越长,这样检索效率就会很低。

(2)倒排文档:倒排文档是将主文档中的可检字段(如主题词、著者)抽出,按某种顺序重新排列起来所形成的一种文档。不同的字段组织成不同的倒排文档(如主题词倒排文档、著者倒排文档等)。倒排文档可以按主题词的字顺排,也可以按分类号的大小排。按表达文献内容特征的主题词排列的文档称为基本索引文档;按表达文献外部特征排列的文档称为辅助索引文档。倒排文档只有文献的标识、文献篇数及文献存取号。因此,在实施检索时,必须和顺排文档配合使用,先在数据库的倒排文档中查得文献篇数及其记录存取号,再根据存取号从顺排文档中调出文献记录。倒排文档类似于检索工具中的辅助索引。

2.数据库的记录

数据库中的文档是由许多记录(Record)组成,主文档中的每个记录都有一个存取号;而记录又是由许多著录项目即字段(Field)组成,一个字段下可以由多个子字段(Subfield)等组成。每个字段都有一个供计算机识别的字段标识符,用于检索和显示。

下面是DIALOG系统中第1号文档ERIC(《教育文摘》)中的一条记录:

DIALOG (R) File 1:ERIC (c) form at on ly 1999 The Dialog Corporation. A ll rts. reserv.

AA=, CH= 01009428 ERIC NO.: ED430060 CLEARINGHOUSE NO.: UD032901

/TI Development of an Adolescent Neighborhood A ffiliation M easure.

AU= Perez-Febles, A lina; A lbus, Kathleen; Weist, Mark

PY=, PD= April 16, 1999 (19990416)

15pp.

/NT NOTES: Poster presented at the Biennial Meeting of the Society for Research on Child Development (A lbuquerque, NM, April 15-18, 1999).

LA= LANGUAGE: English(www.xing528.com)

DT= DOCUMENT TYPE: 143 (Reports—Research); 150 (Speeches/meeting papers)

CP= GEOGRAPHIC SOURCE: U.S.; Rhode Island

JA= JOURNAL ANNOUNCEMENT: RIESEP1999

AB= A study was conducted to develop a theoretically and statistically sound measure of neighborhood affiliation for use w ith low-income urban youth. The aim was to develop a measure that can be used in future studies to predict community violence exposure among adolescents from inner-city neighborhoods. Participants were 167 adolescents from a public high school in Baltimore (M aryland). They completed a self-report scale, a measure of exposure to violence, a risk behavior survey, a demographic questionnaire, and the new ly developed measure, "Me and M y Neighborhood," which was based on other measures in the adult literature assessing neighborhood cohesion and reports from focus groups and clinical work in the community of interest. Findings support the reliability of this new measure of neighborhood affiliation. Future studies are planned to replicate reliability findings, demonstrate convergent and discrim inate validity, and exam ine the association of neighborhood affiliation and exposure to violence among inner-city youth. (Contains 4 tables and 27 references) (SLD)

/DE, /DF DESCRIPTORS: *Adolescents; Inner City; Low Income Groups; *Neighborhoods; Psychological Characteristics; *Test Construction; *Urban Youth; *Violence

/ID, /IF IDENTIFIERS: *A ffiliative Behavior

需要说明的是,在同一类型的数据库中,文档的记录项目和格式基本上大同小异。

3.数据库的索引

为便于使用数据库,需要建立数据库索引。每个数据库中通常都有两种索引,即基本索引(Basic Index)和辅助索引(Additional Index)。

(1)基本索引。基本索引是一种主题性质的索引,它含有所有与主题内容相关的词,如书目型数据库中的题目、文摘和规范词字段中的词等,如表6.1。

表6.1 数据库基本索引字段代码表

(2)辅助索引。辅助索引是一种非主题性质的索引,它含有记录中除基本索引字段之外的那部分信息,如作者、语种、出版年等。辅助索引用前缀代码(Prefix Code)来表示,种类繁多,并且这些字段和代码随数据库的不同而有所不同(见表6.2)。

表6.2 数据库辅助索引主要字段代码表

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈