首页 理论教育 基于DIALOG的信息检索教程

基于DIALOG的信息检索教程

时间:2023-07-25 理论教育 版权反馈
【摘要】:基于DIALOG的联机信息检索主要有以下步骤:1.接通DIALOG联机系统首先,检索终端进入中国分级交换网CNPAC。最后,用户登录DIALOG系统。其次,通过DIALOG系统总索引和选库指令,选择检索文档的范围。在DIALOG系统中主要涉及选词指令和逻辑组配指令等。下面通过在DIALOG中检索有关“肺癌与吸烟”课题文献的例子,说明如何输入并组配检索词。

基于DIALOG的信息检索教程

联机信息检索之前,需要明确检索目的,充分了解联机信息检索系统的发展情况和主要特征。包括建库时间、数据库的容量、时间范围、检索功能、打印格式、价格、响应时间和联机订购等。联机信息检索的基本操作程序从与联机系统相连接开始,到与联机系统脱离而结束。

基于DIALOG的联机信息检索主要有以下步骤:

1.接通DIALOG联机系统

首先,检索终端进入中国分级交换网CNPAC。专线用户在准备好必要的参数,设置合适的通信软件后,可以打开终端设备直接登录上网;拨号用户需要先拨CNPAC在公众电话网上的终端口号,进入CNPAC,然后输入自己的CNPAC网络识别码及网络口令,系统自动验证后,就可以通过该网与国外的计算机网络连通。

其次,检索终端与DIALOG主机连通。用户需要输入DIALOG主机在SPRINTNET网或TYMNET的网络地址号,地址号前加上美国计算机地区号0311(SPRINTNET)或0310(TYMNET),CNPAC通过卫星通信将终端与DIALOG主机连通。

最后,用户登录DIALOG系统。用户需要输入DIALOG的用户标识及号令,经系统验证确认后,终端将显示“Welcome to DIALOG”,表示用户终端与系统主机正式连通,此时用户就可以开始自己的正式检索。DIALOG HOMEBASE菜单内容如图6.2所示:

图6.2 DIALOG HOMEBASE的菜单内容

2.选择数据库或文档

连通DIALOG系统之后,就可以选择需要检索的数据库或文档。如果用户对DIALOG系统数据库或检索主题比较熟悉,就可以直接进库检索。但是,如果用户对DIALOG系统数据库或检索主题不太熟悉,就需要选择数据库或文档。

首先,通过《数据库目录》(Complete Database Catalog)和《数据库蓝页》(Database Bluesheets)等工具,来了解DIALOG数据库的类型、收录范围、文档结构、记录内容、更新周期和检索费用等情况。《数据库蓝页》是DIALOG系统为用户了解每一个数据库的特征、可检字段及字段性质、输出格式等内容提供的一个检索指南,包括文档简介、学科领域文献来源、数据库生产者、记录格式、可检索字段、基本索引、辅助索引和附加限定等。现在已经成为DIALOG415文档,并免费为用户提供。

其次,通过DIALOG系统总索引和选库指令,选择检索文档的范围。DIALOG系统将所有的数据库或文档按主题分类,包括大类和小类,每个类目都有类名和缩写形式,各包括若干个相关文档,组成一个数据库组。用户检索时可以从主题出发,通过DIALINDEX,即DIALOG系统总索引(FILES 411)检索出某一相关类目,从中确定出哪些文档是最适用的,然后再入库检索。用户还可以使用文档选择指令SELECT FILE(SF)进行检索。例如,检索式“? sf business”、“? sf scitech 24, 25, 27”就表示从分类角度检索商业科技方面的文献。sf后面的business、scitech是数据库的类目。

3.构造检索式并实施检索

包括选择检索词,使用各种检索技术确定组配方式等内容。在DIALOG系统中主要涉及选词指令和逻辑组配指令等。

(1)进库指令BEGIN(B)

如果用户对数据库或检索主题比较熟悉,就可以使用进库指令BEGIN(简写为B)进行检索。其格式为:? BEGIN n或? B n,其中,?为DIALOG系统检索命令提示符,n代表某一个具体的文档号。例如,检索式“? B 7”,表示开始检索DIALOG系统中编号为7的数据库或文档,即Social SciSearch(《社会科学引文索引》)数据库。

需要指出的是,在BEGIN指令后可以输入多个文档号,一次打开多个数据库。BEGIN命令还可以消除以前存储在计算机中的所有检索步骤,同时显示前一文档使用的机时及费用等有关情况,而且显示出新文档的信息,诸如文档名称和存储年限等。

(2)选词指令SELECT(S)

在S指令后输入适当的检索词或代码,系统就会从数据库文档中检出含有这些检索词或代码的文献,并赋予一个集合号(Set No.),或称提问编号。检索词可以是单元词或多元词;可以是前缀码或后缀码,例如,“? PY=2000”或“? S information/TI, DE, ID”;还可以是与词位算符、截词算符或布尔算符等连用的检索式。例如,“? S petroleum and prices and opec and py=2000”、“? S EUROPEAN (W) ECONOMEC (W) COMMUNITY”等。

(3)分步检索指令SELECT STEPS(SS)

SS指令与S指令的功能相同,区别在于SS指令是分步给号查找文献信息的指令,系统给被组配的每个检索项都赋予一个集合号,以供修改检索策略和重新组配时调用。例如:

(4)逻辑组配指令COMBINE(C)(www.xing528.com)

C指令的功能是对各检索词进行逻辑组配,但在C指令后面只能是集合号,而不能直接使用检索词。例如,“? C (1 and 2 and 3)”。集合号与运算符之间可以空格,也可以不空格。

下面通过在DIALOG中检索有关“肺癌与吸烟”课题文献的例子,说明如何输入并组配检索词。

注:粗体部分为输入内容,检索结果为17篇文献。

此外,DIALOG系统还提供有限定指令LIMIT(L)、扩词指令EXPAND(E)、更换文档指令Filen、排序指令Sort、执行保留指令Execute、保留检索指令Save和Save Temp等。限定指令L是对检出的文献进一步加以限定,缩小检索范围,提高查准率。存取号、文献类型、文种、检索字段、时间范围等都可以用来作为限定的项目。例如,L4/Pa表示对集合号4的限定文献类型为专利文献。扩词指令E主要是展开检索系统中辅助索引或基本索引的词表,显示检索词在数据库倒排文档词库中的标引方式和词频,从而帮助用户了解与检索词有关的其他词,进一步选择合适的检索词,从而提高查全率和查准率。例如,输入检索式“? EXPAND AU=M ilton, A”,就可以在DIALOG系统的辅助索引表中得到按字顺排列的相近作者的名字,当查到所需作者及其命中记录后,用户可以再用S指令对E进行检索。更换文档指令Filen可以使查找的数据库从原先的文档调至另一文档,它与BEGIN指令执行之后不同的地方在于,Filen指令输入之前的所有信息不会被消除。排序指令Sort是按某一字段对记录进行排序,其格式为:Sort检索组号/记录范围/字段代码。检索系统默认的是升序,如果在末尾加上D,则检索记录将会按降序排列,排列的结果生成一个新的检索。执行保留指令Execute与永久保留指令Save、临时保留指令Save Temp配套使用,可以用来执行保存的检索策略。

4.检索结果的处理

(1)联机打印指令TYPE(T)

TYPE指令的使用方式有两种:一是以集合号联机打印,其格式为:? TYPE集合号/输出格式/命中文献记录的序号。例如,“? type 7/4/3”就表示用户要求联机系统以第4种打印格式联机打印第7种提问编号的命中文献记录的第3篇。在打印过程中如果想停止打印,只要键入RETURN即可。二是以文献记录索取号联机打印。由于在数据库里每篇文献记录都有一个存取号,因此用户也可使用这个编号联机打印文献记录。例如,在“? type 4723/7”中,4723是文献记录的存取号,7为第7种打印格式。使用联机打印指令可以在当时就得到检索结果,但所付费用较高。

(2)脱机打印指令PRINT(PR)

脱机打印是指DIALOG系统先将用户的脱机打印指令和要求存储在主机内,再由检索系统中心打印处理后邮寄给用户。打印格式和联机打印相同。脱机打印的费用较低,但需要等待较长的时间。

系统允许用户按自己的需要自定义显示、打印和存储记录的格式。具体做法是:使用由两个字母组成的字段代码来定义显示或打印格式,可以相继输入其相应的字段名称,并用逗号隔开,不过一次最多只能自定义9种格式。例如,“TYPE S1/TI, AU, AB/1-5”,意为显示第1组检索集合中第1个~5个记录的题名、作者和文摘。

(3)屏幕显示指令DISPLAY(D)

检索完成后可以使用DISPLAY命令,显示符合检索要求的记录。例如,检索式“? DISPLAY S2/5/1”,就表示按格式5显示第1条记录。DISPLAY指令的功能和使用方法与TYPE指令基本相同,差别在于TYPE指令把命中文献连续显示在屏幕上,而DISPLAY指令则会按屏显示命中记录。如果记录太长,在一个屏幕上显示不完,系统会给出MORE字样,键入PAGE(P)指令即可继续显示剩余的部分。

表6.4 DIALOG系统规定的输出打印格式

5.完成检索,退出系统

(1)END指令。当完成一个检索课题之后,用户可以使用“? END”指令,它表示结束查找,开始结账但不停机,可以继续查找其他课题的文献。

(2)LOGOFF HOLD指令。LOG OFF HOLD是暂停检索指令,用户可以在30分钟之内再次进入上次检索的文档中,并调用上次的全部检索策略。但时间超过30分钟,系统将自动断开,并结束检索。

(3)LOGOFF指令。如果用户在完成一项检索作业后,不准备再检索其他课题的文献,就可以直接使用脱机指令“? LOGOFF”结束检索,退出DIALOG系统。当键入LOGOFF指令后,系统会自动给出联机时间、用户编号、检索词数量、联机费用或打印费用以及退出系统的时间等信息,使用户回到网络节点。到这个时候,用户既可以连接另一个联机系统,如ORBIT系统,重新进行一项新的检索;也可以关闭设备,结束检索。

以DIALOG系统为代表的联机信息检索系统的基本指令的用法及系统响应信息如图6.3所示(斜线部分需要用户输入)。

图6.3 DIALOG系统检索操作基本指令及其过程

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈