搜索引擎的英文名称是“search engine”,本身就蕴含着导航的意思。这里关于搜索引擎概念的阐述,是指狭义方面,即利用网络自动搜索软件,或以人工方式对万维网信息资源进行采集、分析和标引,并将标引信息组织成数据库,以网站形式为网络用户提供检索服务的一类信息服务系统。
搜索引擎的搜索程序,俗称网络蜘蛛,经由网络自动搜索程序,通过启发式学习,采取最有效的搜索策略,选择最佳时机获取从英特网上自动收集、分析、标引与整理的信息,并将索引信息组织成数据库。网络蜘蛛能在网络的任何地方工作,能尽可能地挖掘和获得信息。网络蜘蛛还有网页跟踪监测功能,如果网页出现更新、删除等情况,则须及时在数据库中更新。网络蜘蛛具有跨平台工作和处理多种混合文档结构的能力。
为什么有些搜索引擎能查到某些网页,而有些查不到这些网页?即便该网页就在第二个搜索引擎的数据库中,许多搜索引擎在搜索网站时,总是更为全面、经常地搜索常用的网站(如用户经常点击和带有许多链接的网站),对不常用的网站则不屑一顾。搜索程序对搜索的深度、广度或者二者均做了限定。在搜索深度上,不仅搜索主页,而且搜索那些网页的附属网页。在搜索广度上,只是搜索更多的网页,而不去搜索网站的附属网页。随着搜索引擎的日益成熟和竞争的加剧,搜索程序明显趋向于将搜索深度和搜索广度紧密地结合在一起。(https://www.xing528.com)
过去一般网络检索工具提供商只依靠自己建立的数据库来提供检索服务,检索范围有限,而现在某些著名的搜索引擎已经购买其他公司的数据库或者技术内核,有的与其他搜索引擎建立伙伴关系,以便用户使用。比如雅虎现在采用的是Google的搜索内核,网易也曾经使用Google的搜索内核技术来丰富自己的搜索引擎数据库,硅谷动力、广州视窗、新浪、搜狐、Chinaren、21cn、263、Tom 等搜索引擎也都使用和融合了主流搜索引擎厂商的内核技术。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。
