首页 理论教育 信息检索与利用教程:数量庞大,迅速增长

信息检索与利用教程:数量庞大,迅速增长

时间:2023-07-25 理论教育 版权反馈
【摘要】:以历史年代为横轴,以文献量为纵轴,普赖斯描绘出了文献增长的指数模型。信息量多了,信息增长快了,使得信息检索的全面性受到严峻的挑战,查全率越来越低,并直接影响到科学研究工作的效率。在科技文献领域内,每篇文献的质量是不同的,不同质量的文献的增长速度也会是不同的。

信息检索与利用教程:数量庞大,迅速增长

1.数量庞大

据统计,世界图书产量为80万种/年,期刊为10万种/年,并以5%的速度增长。科技期刊的增长速度更快,每7年~8年就增长一倍。有些新兴学科,如原子能科学、计算机科学、环境科学等每隔3年左右就翻一番。目前,全世界专利文献每年增加100万件,技术标准增加20万件,产品样本增加50万件~60万件,会议文献增加100万篇左右,各种连续出版物40万种。若以信息单位计算,当今每天约有40亿个信息单位的信息量向全世界发送,年递增速度为18%~20%;再加上大量的新闻信息、经济信息、电子信息等各种数据库人类真正生活在信息资源的海洋中。

2.增长迅速

1961年,美国文献学家普赖斯(D. Price)在《巴比伦以来的科学》(Science Since Babylon)一书中指出:“似乎没有理由怀疑任何正常的、日益增长的科学领域内的文献是按指数增加的,每隔大约10年~15年时间增加一倍,每年增长约5%~7%。”他进一步指出,整个科学系统资金、人力和物力的指数输入是造成科研成果和科技文献指数输出的重要原因;并且认为,科研人员、科研经费与文献量呈n、n2三个阶数关系。通过对科学期刊的历时性研究(1665—1965),普赖斯得出科学文献增长同时间呈指数函数关系的结论,即:F(t )=aebt 。式中,a>0,b>0,t为时间,a为条件常数即t=0时的文献量,b为时间常数即持续增长率。

历史年代为横轴,以文献量为纵轴,普赖斯描绘出了文献增长的指数模型。如图2.4所示,图2.5则描绘了世界上期刊增长的基本情况。

图2.4 普赖斯文献增长的指数模型

图2.5 1665—2000年世界期刊增长图

3.对信息检索的影响(www.xing528.com)

如果在农业社会和工业社会中,人们遇到的是信息短缺,那么在当代的信息社会中,人们遇到的则是信息过剩。人们对“过犹不及”应当有更深切的理解和体会。

(1)查全率低下。信息量多了,信息增长快了,使得信息检索的全面性受到严峻的挑战,查全率越来越低,并直接影响到科学研究工作的效率。据统计,人们查阅文献平均占工作时间的比例为:18世纪5%,19世纪15%,20世纪50年代25%,现在为50%。

(2)查准率下降。在信息数量激增和信息污染指数比较高的信息世界中,人们检索有用信息的难度在明显增加。在科技文献领域内,每篇文献的质量是不同的,不同质量的文献的增长速度也会是不同的。

美国科学史家和信息学家勒希尔(N.Rescher)在《科学的进步》一书中,据此提出了文献质量等级增长模型。假定F( t)为文献总量,则在λ级上的文献量为 [F (t)]λ,λ为文献的质量等级指标,0≤λ≤1。具体而言:

①λ=1,起码是常规文献(代表了所有文献):F( t)λ=1=aebt

②λ=3/4,起码是有意义的文献:F( t)λ=3/4=[aebt]3/4

③λ=1/2,重要文献:F( t)λ=1/2=[ae bt]1/2

④λ=1/4,起码是非常重要的文献:F( t)λ=1/4=[aebt]1/4

⑤λ=0,第一级(头等重要的)文献:F( t)λ=0=㏑a+bt。

假设有100万篇文献(代表了常规文献),文献数量年增长率1‰,那么对应于不同λ的文献数量/倍增周期分别是:有意义的文献只有31 623篇/倍增周期9年;重要文献只是总文献的平方根,即1 000篇/倍增周期14年;非常重要的文献为32篇/倍增周期28年;而最佳文献仅为14篇,从时间上说每10年才会产生一份属于最重要等级的文献。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈