1.数据库的查找
数据库的查找可以分为上机前查找和上机后查找。
(1)上机前查找。上机前查找主要使用印刷版数据库指南、目录或手册。这些指南、目录或手册有一些是大型联机系统自己编制出版的。例如,《DIALOG系统检索指南概要》(DIALOG信息服务部出版社)、《ESA/IRS用户手册》(ESA/IRS出版社)、《INFOLINE用户指南》(Pergamon Infoline出版社)和《ORBIT用户手册》(系统发展公司SDC信息服务部)等。还有一些是著名的数据公司公开出版的。例如,Information Today公司编制的Fulltext Sources Online(10个大型数据库零售商出售的全文数据库目录,侧重于美国)、Cuadra/Elseviev公司出版的《联机数据库索引》(Directory of Online Database,可通过Data-Star或ORBIT进行检索)、W illiams-Gale出版的《机读数据库》(Computer-Readable Database,可通过DIALOG的230文档检索)等。我国国家计委、科技部和国家信息中心合编的《中国数据库大全》汇集了截至1995年11月我国自建的并且用于对外服务的数据库1 038个,对每个数据库的内容、文种、数据总量、数据来源、更新周期、建库时间和单位以及联系方式都做了详细的介绍。还可以通过“中国数据库”(http://www.chinadatabase.com.cn/)等网站查找我国最新开发的各类数据库。
(2)上机后查找。上机后查找主要使用机读版指南。这些是检索系统所提供的专门文档,基本上相当于数据库索引。例如,DIALOG系统的411文档(DIALINDEX)和415文档(DIALOG Bluesheet),ORBIT系统的DBI(Data Base Index)文档,BRS系统的GROS文档等。此外,一些数据库自动选择的工具软件也可以用于数据库的查找。这些工具软件既包括驻留于主机系统上的软件,如Dialog’s Business Connection(DBC)和Easynet System,也包括驻留于用户微机上的工具软件以及正在研制过程中的数据库选择专家系统,如英国Loughborough科技大学研制的公司信息数据库咨询系统CIDA(Company Information Database Adviser)、加拿大的Online-Expert样机系统等。
2.数据库的选择
现代的数据库多种多样,有的检索系统就有上百个数据库,因此在检索之前,应当全面掌握数据库的类型、收录范围、文档结构、记录内容、更新周期和检索费用等情况。
(1)数据库类型。明确要查找的是文献线索还是数据、事实和原文。对于文献线索可以使用文献参考型数据库或二次文献数据库。这类数据库包括各种机读版的文摘、索引、书目等。如DIALOG中的90、101、102号文档。对于数据、事实和文本等可以使用源数据库,如全文库(机读文献全文、法律全文或新闻报道等)、文本-数值库(各种名录型数据库)和数值数据库(调查统计、财务金融类数据库等)。
(2)收录范围。包括学科范围、数据类型、收录重点、时间范围和行业范围以及数据完备程度。例如,DIALOG系统中的D&B-DUN’S MARKET IDENTIFIERS的收录范围是雇员10人以上或年销售额100万美元以上的公司,而TRINET U. S. BUSINESSES收录范围是20人以上的公司,重点是其分公司和子公司。(www.xing528.com)
(3)文档结构。说明数据库中有哪些字段,哪些是可检字段等。例如,同样是美国DIALOG系统中的美国公司名录,D&B-DUN’S ELECTRONIC YELLOW PAGES可以从商标号来检索,而D&B-M ILLION DOLLAR DIRECTORY却没有提供这一检索字段。
(4)记录内容。各个数据库在信息的记录详略上也有程度的不同。例如,DIALOG系统的专利数据库、国际专利文献中心编制的INPADOC/FAM ILY AND LEGAL STATUS,其记录内容包含某项基本专利的同族专利的详细介绍,以及有关这项专利的法律信息,而英国德温特出版公司编制的WORLD PATENTS INDEX LATEST就没有这部分信息。
(5)更新周期。数据库中信息的准确性与其更新周期密切相关,尤其是商情动态类和统计类数据库。
(6)检索费用。各个数据库的使用费和打印费是不一样的,在检索之前最好要了解订购或租用的费用、不同载体的费用差异、数据库的版权费、每次检索费用、CPU时间费用、联机或脱机打印费用、连接时间费用等情况。
数据库选择的基本原则是:先国内后国外、先免费后收费、先文摘后全文、先镜像后正式。例如,在DIALOG系统中有许多训练文档,供用户训练使用。此外,DIALOG还提供有一定时间或范围内的免费文档,用户可以通过CHRONOLOG和410号文档来了解免费文档的情况。如果能在训练文档或免费文档里形成检索式进行试检,然后再转到正式文档中进行检索,这样就可以减少输入检索式的时间,节省检索费用。
据统计,我国使用频率较高的中文数据库主要是:《中国科技期刊篇名数据库》、《中国专利数据库》、《中国企业公司及产品数据库》、《中国科技成果数据库》、《中国科技经济新闻数据库》、《中国科技文献数据库》、《全国科技成果交易数据库》、《中国科技论文引文分析数据库》、《中国学术会议论文数据库》和《中国化工文摘数据库》等。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。