首页 理论教育 網絡搜索引擎的發展與完善:數字化與結合技術

網絡搜索引擎的發展與完善:數字化與結合技術

时间:2023-08-25 理论教育 版权反馈
【摘要】:這對今天網絡搜索引擎的發展與完善仍有啓示和借鑒意義。隨着信息網絡的發展,網上資源异常豐富而易變,客觀上要求出現效率較高的檢索系統。以上是就搜索引擎的檢索語言而論。因此,搜索引擎與類書在檢索語言方面,並無可比性。就檢索方法而言,目前搜索引擎主要有兩種方式,即分類檢索與主題檢索。網絡信息的數字化和軟硬件技術條件爲分類檢索與主題檢索的真正結合奠定了基礎。

網絡搜索引擎的發展與完善:數字化與結合技術

在宋代類書的檢索系統中,無論是類排,還是韵排,都把主題檢索自覺運用其中,從而搆成了一種典型的分析分類體系,它在展示文獻内容的門類脈絡的同時,又揭示出門類之間錯綜復雜的關係。這對今天網絡索引擎的發展與完善仍有啓示和借鑒意義。

隨着信息網絡的發展,網上資源异常豐富而易變,客觀上要求出現效率較高的檢索系統。1994年以後,搜索引擎异軍突起,從純技術(IT)角度講,它的確解决了檢索的時效性問題,給人們的信息查詢帶來了巨大便利,但是這種單純的自然語言檢索系統也常伴隨提供許多風馬牛不相及的信息,查全率和查準率難以保證。這就促使搜索引擎由注重信息搜集的數量,轉向注重信息搜索的質量,檢索組配由單純的字面組配,轉向概念組配。這也表明信息的數量越龐大,檢索系統的篩選過濾功能和智能化程度越需得以完善。最可行的解决方案是將人工語言與自然語言結合起來,在兩者之間建立對應,因此人工語言在網絡信息的整序和檢索中受到越來越多的重視。以上是就搜索引擎的檢索語言而論。當然,這與類書的檢索語言——類序語言(部、類、門、編、典)和音序語言,由於編制技術手段和應用領域的差异,因而屬於不同範疇的概念。因此,搜索引擎與類書在檢索語言方面,並無可比性。

就檢索方法而言,目前搜索引擎主要有兩種方式,即分類檢索與主題檢索。二者各有千秋,任何單一的檢索方式即使功能再强,也無法完全滿足不同知識背景和不同信息需求者的查詢需要,客觀上就要求實現分類檢索與主題檢索的一體化。網絡信息的數字化和軟硬件技術條件爲分類檢索與主題檢索的真正結合奠定了基礎。這一結合也是在網絡環境下,對信息進行整序、控制和檢索的最有效方法。目前,這一課題正在研發之中。“網絡信息的分類、主題一體化整序,就是既對信息進行分類整序,也對信息進行主題整序,把索引數據庫的信息通過類目、關鍵詞、信息形式特徵、信息編碼特徵等關聯起來,從而嚮用户提供分類主題一體化的檢索功能。所謂分類主題一體化的檢索功能,就是用户除了可以獨立進行分類檢索和主題檢索並隨意轉换檢索方式外,還能通過分類與主題的相互限定改變檢索範圍,達到最佳的搜索效果。”[12]

分類主題一體化,早在我國古代類書的檢索系統中已得到很好的實現,可以説,這是紙質時代古人智慧的結晶,然而在信息時代的今天,它却是我們在搜索引擎研製方面遇到的一大難題,這不得不引起我們的反思。

【注释】

[1]參見王利偉:《宋代類書的類目體系》,載《圖書情報工作》,2007年第6期,147~149。本文不再贅述。

[2]學術界就類書的編排尚存“字排”一説,實際上所謂“字”是以“韵”來統攝的,因此,字排從屬於韵排。

[3][宋]裴良甫:《十二先生詩宗集韵》卷三,《四庫全書存目叢書》子部一七〇冊,濟南:齊魯書社,1995:481。

[4][宋]裴良甫:《十二先生詩宗集韵》卷三,《四庫全書存目叢書》子部一七〇冊,濟南:齊魯書社,1995:543。(www.xing528.com)

[5][宋]裴良甫:《十二先生詩宗集韵》卷八,《四庫全書存目叢書》子部一七〇冊,濟南:齊魯書社,1995:574。

[6][宋]裴良甫:《十二先生詩宗集韵》卷一三,《四庫全書存目叢書》子部一七〇冊,濟南:齊魯書社,1995:657。

[7][宋]裴良甫:《十二先生詩宗集韵》卷一四,《四庫全書存目叢書》子部一七〇冊,濟南:齊魯書社,1995:669。

[8][宋]裴良甫:《十二先生詩宗集韵》卷一四,《四庫全書存目叢書》子部一七〇冊,濟南:齊魯書社,1995:669。

[9][清]永瑢等:《四庫全書總目》類書類《小學紺珠》提要,北京:中華書局,1965:1151。

[10][清]永瑢等:《四庫全書總目》類書類《小學紺珠》提要,北京:中華書局,1965:1151~1152。

[11][清]永瑢等:《四庫全書總目》類書類《小學紺珠》提要,北京:中華書局,1965:1152。

[12]俞君立、陳樹年:《文獻分類學》,武漢:武漢大學出版社,2001:100~103。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈