首页 理论教育 不同类型搜索引擎的简介与比较

不同类型搜索引擎的简介与比较

时间:2023-07-07 理论教育 版权反馈
【摘要】:目前搜索引擎的类型多样,我们将简要介绍每种类型常用的一些搜索引擎。A.Google的特色功能在于:a.检索多种类型的文件。LyCOS于1994年8月开始在网上运行,目前是Ly-COS集团公司LyCOSNetwork服务的成员之一,是一个多功能搜索引擎。

不同类型搜索引擎的简介与比较

目前搜索引擎的类型多样,我们将简要介绍每种类型常用的一些搜索引擎。目前许多单一搜索引擎都同时提供关键词检索和主题目录浏览检索两种方式,但是鉴于其服务都是有所侧重的,所以本书根据其服务侧重,将其划分到关键词型搜索引擎或者目录型搜索引擎(即网络资源指南)中。

1.关键词型搜索引擎

(1)英文关键词型搜索引擎简介。

①Google(http:∥www.google.com)。Google由斯坦福大学的两位博士生LarryPage和SergeyBrin在1998年创立。通过自己的站点提供网络信息检索服务,以及为信息内容供应商提供联合品牌的网络搜索解决方案。收录10亿多个网址的80多亿张网页,8.8亿多个图像,提供网页、图像、新闻、网上论坛等多种资源的查询,支持100多种语言。采用了先进的自动搜索技术、PageRankTM(网页级别分析)技术和完善的文本匹配技术,确保将最重要的搜索结果以最快的速度呈现给用户,以搜索相关度高而闻名。检索界面简洁直观,操作便捷。每天提供2亿次查询服务。

Google提供关键词检索和主题目录浏览检索两种方式。主题目录分类体系是依据Open Directory的类目体系构架,内容也是经由Open Directory的全球各地的义务编辑精心挑选和归类,再由Google著名的“网页级别”技术分析将网页依照其重要性先后排列出来,并通过网页介绍里的横线长度,来标明此网页的重要程度。关键词检索方式除了支持简单检索外,还提供性能优良的高级检索。在高级搜索中,用户通过检索文本框和下拉列表来确定检索条件,可从搜索结果、语言、文件格式、日期、字词位置、网域等几个方面限定检索范围。此外,Google允许用户依照个人爱好设置“使用偏好”,并保存以供将来使用。

A.Google的特色功能在于:

a.检索多种类型的文件。

除了HTML文件外,可以支持13种非HTML文件的搜索,如PDF、DOC、PPT、XLS、RTF、SWF、PS等。

b.提供多元化的服务。

除了提供Web信息资源的检索服务外,Google还推出许多服务:a.计算器;b.中英文字典;c.天气查询;d.股票查询;e.邮编区号;f.手机号码;g.电子邮件;h.Google工具栏;i.Google-earth(Google卫星地图)等。此外,英文版Google还提供了商品导航工具Froogle,将众多商品,如数码相机音乐播放器等分类列出,帮助用户通过比较的方式选择。

B.Google检索功能强大,主要体现在以下几个方面:

a.多样的范围限制功能。

除了高级检索提供的多种检索选择外,Google还提供按链接和网域进行范围限制。按链接检索(link):将显示所有指向某一网址的网页。例如,“link:www.google/com”将找出所有指向Google主页的网页。按网域检索(site:)将在某个特定的域或站点中进行搜索,可以在Google搜索框中直接输入“site:xxxxx.com”。要在Google站点上查找新闻,可以输入“新闻site:www.google.com”。

b.相关检索功能。

为了给用户提供更多的相关信息,Google推出“类似网页”。如果用户对某一网站的内容很感兴趣,但又嫌资料不够,单击“类似网页”后,就可获取与这一网页相关的网页、资料等。

c.快捷的检索。

为了减少用户搜索网页的时间,Google推出“手气不错”,单击该按钮将自动进入第一个检索结果所在的网页。由于Google的网页级别(PageRank)技术的支持,检索结果的第一个记录往往是最相关和重要的,因此使用“手气不错”将减少搜索网页的时间。

d.检索词纠错。

Google的错别字改正软件会对输入的关键词进行自动扫描,如果发现用其他字词搜索可能会有更好的结果,会提供相应提示来帮助纠正可能出现的错别字。该软件建立在互联网上所能找到的所有词条之上,能够提示常用人名及地名的最常见的书写方式,这是一般的错别字改正软件所不及的。

②LyCOS(http:∥www.lycos.com)。LyCOS于1994年8月开始在网上运行,目前是Ly-COS集团公司LyCOSNetwork服务的成员之一,是一个多功能搜索引擎。借助于自动搜索软件收集多种类型的资源,如网页、人名、企业名录、多媒体、音乐/mp3、讨论组、新闻、产品信息等,搜索结果精确度较高,尤其是搜索图像和声音文件的功能很强。此外,还提供游戏、电子邮件、音乐、购物、个性化LyCOS、新闻快讯等服务。关键词检索方式下可以从Web、人物、产品、新闻、讨论、黄页、多媒体等多种途径进行检索,检索方式分为基本检索和高级检索。支持布尔逻辑运算符(and、or、not)、精确检索符(双引号),也可在检索词前加“+”表示该词一定出现,检索词前加“-”表示该词一定不出现。高级检索提供强大的过滤功能,可以从检索词、URL/站点名称、语言、日期等几个方面限制检索范围。LyCOS也提供Web主题目录浏览检索服务。目录分类规范、类目设置较好、网站归类准确、提要简明扼要、收罗丰富,分为艺术和娱乐、汽车商业和职业、计算机和网络、游戏、健康、家庭、青少年、新闻、休闲、宗教科技社会文化体育旅行等类目。个人LyCOS主页可根据个人兴趣和爱好设置相关的检索参数。

③Excite(http:∥www.excite.com)。Excite是由斯坦福大学几个大学生在1993年8月创建的Architext扩展而成的万维网搜索引擎,目前属于AskJeeves公司,收录了100多家领先信息提供商的丰富信息资源,包括网页、新闻、体育、股票、天气、企业黄页、人名等。除了提供网络信息检索服务外,还提供网上交流、免费邮件、天气预报、股票指数、体育信息等服务。检索途径有网页检索、主题目录检索、新闻检索和图片检索四种,检索方式包括基本检索和高级检索。基本检索可以采用双引号来进行精确检索,“+”表示其后的检索词一定出现,“-”表示其后的检索词不能出现。布尔逻辑运算符(and、or、not)只能在高级检索中使用。在高级检索中,可从检索词、语言、域名等方面限制检索范围,可以选择是否纠错检索拼写和是否在检索结果中粗体显示检索词等,定制检索结果显示的数量和排序标准(按搜索引擎还是相关度排序)等。主题目录浏览检索较简单,站点被分为汽车、商业和货币、计算机和网络、游戏、艺术与娱乐、休闲、健康、社会、参考、新闻和媒体、科技、宗教、体育和旅行14大类。此外,Excite将最近的流行检索词列出,供单击检索,也提供个性化定制服务——myexcite,用户可以根据自己兴趣爱好设置个性化的界面格式、内容、布局或者颜色,自动获取相关信息。

④AltaVista(http:∥www.AltaVista.com)。AltaVista最早由DEC公司于1995年12月推出,目前隶属于Overture公司。曾经被认为是功能最完善、搜索精度较高的全文搜索引擎之一,大量的创新功能使它迅速到达当时搜索引擎的顶峰。它第一个支持自然语言搜索,具备了基于网页内容分析的智能处理能力,第一个实现高级搜索语法,如and、or、not等,同时最早提供新闻组、图片、音视频文件的检索。目前AltaVista提供关键词检索和主题目录浏览检索两种方式,主题目录依据Open Directory的类目体系构建。关键词检索的检索途径包括网页、图片、音频、视频和新闻,支持基本检索和高级检索。高级检索提供用户以日期、语种、文件类型、布尔逻辑和近似条件检索。基本及高级检索均允许针对Title、URL或特定的域名进行检索,允许以20多种不同的语种进行搜索。该搜索引擎还提供英、汉、法、德、意、葡萄牙、西班牙语等语种的双向翻译。

⑤HotBot(http∥www.hotbot.com)。HotBot建立于1996年5月,曾因“改良的界面、优秀的复杂查询、最新新闻查询及比任何网点都丰富的过滤选项”获得《PCMagazine》1997年“编辑选择奖”。目前是LyCOS公司LyCOSNetwork的成员,收集了1亿多个网页。检索界面简洁直观,并有多种颜色和式样的检索界面供选择。提供了HotBot、Google和AskJeeves三个搜索引擎的检索,检索方式包括基本检索和高级检索。

a.基本检索。选择一个搜索引擎,然后在检索主页的检索文本框中输入检索词(组),可以使用双引号来实现词组精确检索,或者在检索词前加“+”,表示该检索词一定出现,检索词前加“-”,表示该检索词一定不出现。

b.高级检索。在高级检索页面的文本框中输入相应内容,从语言、域名、地区、检索词(包含、不包含、出现的位置等)、日期、页面内容(页面包含的媒体类型,如mp3、图片、视频、音频、Java、脚本、PDF、Word文档),以及是否阻止非法内容等方面限制检索范围。用户可对检索结果的输出进行定制。此外,HotBot还设计了桌面工具栏,安装后用户可在浏览器上直接输入检索词进行检索。

(2)常用中文关键词型搜索引擎简介。

百度(http:∥www.baidu.com)。百度于1999年年底成立于美国硅谷,是目前全球最优秀、最大的中文信息检索与传递技术供应商。使用高性能的“网络蜘蛛”程序自动地在互联网中搜索信息,可定制高扩展性的调度算法使得搜索器能在极短的时间内收集到最大数量的互联网信息。百度在中国各地和美国均设有服务器,搜索范围涵盖了中国大陆、中国香港、中国台湾、中国澳门地区,以及新加坡华语地区、北美和欧洲的部分站点。目前拥有的中文信息总量超过4亿页以上,并且还在以每天几十万页的速度快速增长。检索途径有网页、mp3、新闻、地区、网站、图片、百度词典等,提供基本检索和高级检索两种检索方式,支持布尔关系“或”(用“+”表示)、“非”(用“-”表示),可将检索范围限制在指定的网站、标题、URL和文档类型。此外,高级检索可以定义要搜索网页的时间、地区、语言、关键词出现的位置以及关键词之间的逻辑关系等。目前百度也推出主题目录浏览检索,由人工维护、更新,共分为5个大类,70多个子类目。基于每天上亿次的搜索数据,百度推出中文搜索风云榜,反映目前的搜索热点

②天网中英文搜索引擎(http:∥e.pku.edu.cn/)。天网是由北大网络实验室研制开发,于1997年10月29日正式在CERNET上向广大Internet用户提供Web信息导航服务的中英文搜索引擎,目前不仅收集WWW资源,而且也收集FTP资源,因此是国内检索校园网FTP资源的主要工具。天网提供的检索途径有网页、文件、目录、主题四种。检索WWW资源时,只需在主页的检索文本框中输入检索词即可,检索词之间默认关系为逻辑“与”,支持精确检索符(“”),忽略常用的无意义的词和字符,不区分大小写。FTP资源检索时,在主页输入框输入要查询的文件名,可以包含“,”号(通配所有字符)、“?”号(通配一个字符)、空格(表示检索词之间是逻辑“与”关系),提交后即可得到查询结果。FTP检索支持更多的检索技术,如在简单检索页面,可按类别搜索文件,即单击“分类搜索”下的各种类型,将检索范围限制在图像、声音、视频、压缩、文档、程序、目录、源代码任一类型;从FTP检索页面里单击“更多选项”进入“FTP复杂搜索”页面,可以对文件的大小、日期、查询的网站、页面显示数量、网段(将教育网分为北大校园网、清华校园网、中科院网、华北教育、西北教育等10段)进行定制。除了关键词检索外,天网还提供了主题检索和目录浏览检索。目录浏览检索采用中文网页的自动分类技术,将网页分为人文与艺术、计算机与因特网、自然科学医疗与健康、商业与经济、教育、政府与政治、文化与社会、娱乐与休闲、各国风情、社会科学11个大类。主题检索提供北京大学校内搜索、西安交通大学校内搜索、新闻搜索、Unix相关搜索、美国1 000所大学搜索5种。此外,天网还开发推出中国Web信息博物馆——中国网页历史信息存储与展示系统,目前已经维护有10亿个以中文为主的网页,并以平均每月1 000万个网页的速度扩大规模。

2.目录型搜索引擎

(1)常用英文目录型搜索引擎简介。

①Yahoo!(http:∥www.yahoo.com)。Yahoo!是最早、最典型的目录型搜索引擎,起源于大卫·费罗和杨致远于1994年4月建立的网络指南信息库,目前收集了成千上万台计算机上的信息,建立了完整、合理的类目体系,提供融信息检索、用户交流和多种产品于一体的服务。全球共有24个网站,12种语言版本的雅虎开通,Yahoo!中国于1999年9月正式开通。Yahoo!主题指南主要采用人工方式采集和存储网站信息,将收集的信息分为14个主题大类,包括艺术与人文、商业与经济、电脑与因特网、教育、娱乐、政府与政治、健康与医药、新闻与媒体、休闲与运动、参考资料、区域、科学、社会科学、社会与文化等,每一个大类下面又细分为若干子类,逐层搜索十分方便。作为最早的网络资源指南,Yahoo!目前不仅提供主题目录浏览检索,而且也提供关键词检索、专题检索(人物、天气、电话号码等)服务。关键词检索是采用Yahoo!Slurp这套Web索引程序从因特网上采集文档而建立起的一个可搜索的网页索引系统,可以检索网页、图片、新闻、音乐、类目和网络实名等信息,提供基本检索和高级检索两种检索方式。目前,只有网页检索和目录检索具备高级检索功能,图片、新闻、音乐和实名检索不具备。在高级检索中,用户可以从搜索结果、更新时间、网站/网域、文件格式、分类、SafeSearch过滤器、国家、语种、搜索结果数目等方面限定检索范围。2004年6月21日雅虎公司基于全球领先的YST(Yahoo Search Technology)技术,在中国推出独立搜索门户——一搜(http:∥www.yisou.com./)。可以搜索全球50亿网页、5.5亿张图片、1 000万音乐,网页搜索支持38种语种,先进的搜索分析与排序技术(而非人工干预)保证了结果的客观与精准。一搜检索界面非常简洁,提供网页检索、图片检索、新闻检索、mp3检索和部落检索。

我们可以从多种途径利用Yahoo!中国的信息检索服务,具体如下:

a.Yahoo!网站主页(http:∥cn.yahoo.com);

b.Yahoo!搜索引擎主页(http:∥cn.search.yahoo.com)。

②Open Directory Project(ODP)(http:∥dmoz.org)。ODP是目前最大、最全面的人工编辑的网络资源指南之一,由全球大量的自愿网民构建和维护。将所收集的网站分为艺术、商业、计算机、游戏、健康、家居、青少年、新闻、娱乐、参考、宗教、科学、购物、社会、体育、全球类目共16个类目,该分类体系为Google等多个搜索引擎所采用。除了提供主题目录浏览检索服务外,ODP也提供关键词检索。关键词检索分为基本检索和高级检索,支持布尔逻辑运算符(and、or、not,检索词之间的关系默认为and)、右截词(通配符为,)、精确检索(将检索词组用双引号括起),可以用“+”表示其后的检索词一定出现,“-”表示其后的词一定不出现。此外,ODP在页面底部提供了AltaVista、HotBot、Netscape、Yahoo!、Google等的链接,可直接将检索词提交给用户选择的搜索引擎。

③Galaxy(http:∥www.galaxy.com)。Galaxy于1994年1月创建,其开发者是商业网络通信服务公司EINet,目前属于Logika公司,是因特网上最早按专题检索WWW信息的网络主题指南之一。收集的信息包括网页、网站、新闻、域名、公司名录、人名、股票指数等。将所收集网站分为购物、商业、人文、社会科学、宗教、工程和技术、家居、参考、社会团体、旅行、娱乐休闲、科学、体育、健康、政府和医学共16个大类。由专业背景的图书馆学人员分类、组织和编辑,确保了信息的可靠。提供网页、主题目录、新闻和域名四种检索途径,除了主题目录浏览检索外,还提供关键词检索。关键词检索可以分为基本检索和高级检索,支持布尔逻辑运算符(and、not,检索词间的默认关系为and)、精确检索(将检索词组用双引号括起)。检索结果按相关度排列,每条记录前会以一条长短不一的红线表示其相关度。

(2)常用中文目录型搜索引擎简介。

搜狐(http:∥www.sohu.com)。搜狐(Sohu)是1998年推出的中国首家大型分类目录搜索引擎,到现在已经发展成为中国影响力最大的网络资源指南。网站信息的收集与处理一直坚持以人工编辑为主,目前拥有总数在500 000以上的庞大网站数据,广泛借鉴信息分类领域常用分类法和行业分类的分类标准,将其分为娱乐休闲、电脑艺术、卫生健康、工商经济、公司企业、文学、体育健身、教育培训、生活服务、艺术、社会文化、新闻媒体、政治/法律/军事、科学技术、社会科学和国家地区共16个主题大类,5万多细类。搜狐也提供关键词检索方式,可以按照网站、新闻、mp3、购物、图片、商机、软件7种途径进行检索。

搜狐推出搜狗——第三代互动式搜索引擎,在用户输入一个查询词后,搜狗尝试理解用户可能的查询意图,给出多个主题概念的搜索提示,通过人—机交互过程,智能展开多组相关的主题概念,引导用户更快速准确地定位自己所关注的内容。此外,搜狗还推出“直通车搜索”,即将检索关键词提交给“直通车”中列出的其他搜索引擎(包括Google、百度、雅虎、中搜等),可在同一个窗口中得到想要的结果,也可以按主题(包括新闻、音乐、图片、小说、购物、软件、游戏、Flash、工作、商业等)查询。搜狐每天接受用户数千万人次的搜索,所有的访问统计形成搜索排行榜,再依据关键词的属性分成30个大类,这就是搜索指数,通过搜索指数能够了解用户在关注什么。(www.xing528.com)

网易(http:∥www.163.com)。网易搜索引擎是2000年9月由网易公司推出的全中文网络信息检索服务,采用互动性开放式目录管理系统(ODP,Open Directory Proiect),由众多的网民管理员建立和维护的主题指南。将所收网站资源分为经济金融、电脑网络、新闻出版、娱乐休闲、艺术、科学技术、政法军事、生活资讯、情感绿洲、时尚搜索、公司企业、社会文化、教育学习、体育竞技、文学、医药健康、旅游自然、少儿乐园、个人主页等19个主题大类。网易也提供关键词检索,可直接在网易主页检索文本框中输入检索内容,然后从文本框右侧下拉列表所列的网站、网页、图片、时尚、mp3、图片几种检索途径中选择,获取所需信息。也可进入网易搜索引擎页面(http:∥search.163.com)进行检索。网易搜索引擎主页会首先列出最近的热门网站、热门网页、热门图片和音乐搜索。网易的企业黄页检索和城市检索是其较独特之处,具体体现在它专门开辟网易黄页界面(http:∥114.163.com),用户既可以直接输入检索词,确定检索省份来查询,也可以按照行政区域图和行业类别目录来逐层单击检索;城市检索是以城市为检索词,获取该城市各个方面的信息。目前只开通了北京、上海、广州和厦门四个地方,不过网易致力于建立中国最大的城市门户网站,所以肯定会继续发展。

新浪(http:∥www.sina.com.cn)。新浪搜索引擎是新浪公司推出的网上资源查询系统,提供网站、网页、新闻、软件、游戏、音乐、黄页等资源的查询服务。网站收录资源丰富,分类目录规范细致,遵循中文用户习惯,目前共有娱乐休闲、求职与招聘、艺术、生活服务、教育就业、社会文化、政法军事、个人主页、文学、计算机与互联网、体育健身、医疗健康、科学技术、社会科学、新闻媒体、参考资料、商业经济、少儿搜索等共18个大类目录,一万多个细目和数十万个网站,是互联网上最大规模的中文搜索引擎之一。除了主题目录浏览检索,新浪也提供关键词检索,在新浪主页的文本框内输入关键词,选择网页、图片、新闻和mp3四种检索途径之一,提交申请,获取检索结果。也可在新浪搜索引擎页面,从网页、分类目录、新闻、图片、音乐、网址和黄页六种途径检索。如果没有特别指定,系统默认查询次序为目录搜索、网站搜索、网页检索。查询结果先返回目录搜索结果,然后返回网站搜索结果,再返回网页搜索结果,最后返回商品信息、消费场所等搜索结果,在同一页面上包含网站、网页、新闻、商品等各类信息的综合搜索结果。新浪关键词检索支持逻辑“与、或、非”,检索词之间的默认关系为“与”;短语精确检索符为“()”;不支持词干法或者通配符;忽略常见字符;在关键字前加“t:”表示在网站标题中搜索,在关键字前加“u:”表示在网站网址(URL)中搜索。

3.集合型搜索引擎

(1)常用英文集合型搜索引擎简介。

①MetaCrawler(http:∥www.metacrawler.com)。MetaCrawler由华盛顿大学的一名研究生和副教授于1994年开发而出,是最早的一个集合型搜索引擎,曾被评为综合性能最优良的集合搜索引擎。2000年加入InfoSpaceNetwork服务,隶属于InfoSpace公司。MetaCrawler并不进行网络信息的收集与组织,因此没有自己的网页索引数据库,它只充当用户的检索代理,可调用Google、Yahoo!、AskJeeves、About、FindWhat、LookSmart、Overture几个搜索引擎来返给用户更多的检索结果。在检索流程中,MetaCrawler的主要功能包括:提供统一的检索界面;允许用户选择检索工具;将用户检索请求转换成成员搜索引擎的检索指令;对检索结果进行转换、查重和排序。提供网页、图片、音频文件、多媒体、购物、黄页、白页、天气预报、地图等多种信息资源的查询。MetaCrawler检索界面简洁、直观,操作简便,有基本检索和高级检索两种方式。基本检索无法构造复杂检索式,不支持布尔逻辑运算符、精确检索符(“”)、通配符(*)等。要想检索固定短语,可选中页面上Exact phrase前的复选框。高级检索提供了大量限制检索条件的选项,用户可以指定检索式包含的检索词(组)、不包含的检索词(组),运用布尔逻辑运算符(and、or、not)直接构造检索式:指定搜索网页的更新日期、语种、域名;设置是否过滤成人色情网站、检索内容是按照相关度还是搜索引擎排序。操作简单,只需在文本框中输入相关内容,或者单击所需要求即可。

②Mamma(http:∥www.mamma.com)。Mamma自称为“搜索引擎之母”,可同时调用14个常用的独立搜索引擎,包括OpenDirectory、LookSmart、Business、About、Com等主题指南,Google、MSN、Gigablast、Teoma、EntireWeb等关键词搜索引擎,以及FindWhat、Kanoodle等收费搜索引擎。可查询网页、新闻、黄页、人物、股票指数、图像和声音文件等资源。其检索界面简洁友好,既可同时调用全部后台搜索引擎,也可自行控制选择,设置使用偏好,设定检索时间、每页可显示的记录数、网站简介的长短等。Mamma支持精确检索符(“”),在检索词前加“+”表示其一定出现,在检索词前加“-”表示其一定不出现。检索结果以相关性排序,剔除重复记录,内容包括网页名称、URL、文摘、源搜索引擎等。

③Dogpile(http:∥www.dogpile.com)。Dogpile隶属于InfoSpace公司,提供网页、图片、音视频文件、新闻、黄页、白页等信息的检索,其网页检索由Google、Yahoo!、AskJeeves、About、LookSmart、OpenDirectory、Overture和FindWhat提供,图片检索由Yahoo!Image和Ditto提供,音频文件检索由Yahoo!Audio和Singingfish提供,新闻检索由Yahoo!新闻、Topix、FoxNews和ABCNews提供。支持关键词检索和主题目录浏览检索。关键词检索提供基本检索和高级检索两种检索方式,高级检索可从检索词、语种、日期、结果显示、域名过滤、成人内容过滤等方面对检索进行限制。Dogpile的自动归类技术会根据检索结果中出现的词或者短语将检索结果进一步划为多个类别,如将有关“保险”的检索结果再进一步分为寿险、火险、汽车保险、疾病保险等多类,从而方便用户查找所需检索结果。此外,Dogpile还根据检索统计数据,将一些流行检索词分门别类列出,单击可获取相关信息。

④Profusion(http:∥www.profusion.com)。Profusion于1995年成立,目前隶属于Intelliseek公司,曾是2000年元搜索引擎9238推荐奖获得者。Profusion不仅可调用多种搜索引擎,包括About、Alltheweb、AltaVista、AOL、Gigablast、LookSmart、LyCOS、MSN、Netscape、Teoma、Wisenut和Yahoo!,而且还将信息资源划分为上百种专题,如健康、商业、新闻、科技、参考、教育、政府等,其下又继续细分为一些小类,小类下将列出相关的一些网站。因此,用户可以直接在检索主页输入关键词或者在Web Search Engines页面选择所需搜索引擎,设置检索限制条件后,输入检索词来获取检索结果,也可以逐层单击专题目录,选择所需专题或网站来检索。Profusion支持多种检索技术,如布尔逻辑和位置运算符、精确检索符(“”)、关系运算符(<、:、>:等)、拼写修正提示等。提交检索词后,Profusion在处理检索时,会以进程条方式显示每个被调用的搜索引擎或者网站处理检索的进度、检索结果的数量和搜索时间等信息。此外,Profusion提供了很多个性化服务,如自行创建专题类目,将自己所需信息添加进去,以后该类目就会出现在用户的Profusion检索界面;Alert服务,包括页面alert(Pagealert)和检索alert(Searchalert),Pagealert会以E-mail方式帮助用户及时了解某个网页发生的变化,而Searchalert则会以E-mail方式定期通知用户其检索课题的新信息。

(2)常用中文集合型搜索引擎简介。

中文集合型搜索引擎发展较慢,目前为数不多。本书只介绍万纬搜索引擎。

万纬搜索引擎(http:∥www.widewaysearch.com)是一个中文集合型搜索引擎。集成的英文搜索引擎包括Google、Yahoo!和HotBot,中文搜索引擎包括新浪、雅虎(中文)、搜狐、天网、Google(中文)、百度,用户可根据需要自由选择。提供基本检索和高级检索两种方式,支持“精确查找”,但不支持布尔逻辑等各种运算。搜索结果可按相关度、时间、域名和搜索引擎分类,可限定检索结果显示的数量和最大的检索等待时间。高级检索页面还按类提供一些网址导航。

4.专用型搜索引擎

专用型搜索引擎是用于查找某些特殊类型的信息,如电话号码、多媒体文件、人物、地图等的专门检索工具。侧重收录某一方面的信息,因此它们往往能比综合型的搜索引擎更迅速、准确和深入地查找上述专门信息。本节将介绍人物、地图和图像/多媒体等类型的专用搜索引擎。

(1)人物查询搜索引擎。

Web中含有大量的个人信息,而且越来越多的搜索引擎都开始提供人物/白页检索功能。本书前面提到的搜索引擎几乎都提供这种功能,如Yahoo!的peoplesearch(http:∥www.people.yahoo.com)、LyCOS的WhoWhere(http:∥www.whowhere.com)等。下面再介绍几种专门用于检索人物信息的搜索引擎。

①Internet Address Finder IAF(http:∥www.iaf.net)。IAF创建于1996年,曾是因特网上完全免费的找人工具,目前提供免费和收费两种服务。收费服务用于查询那些保密性质的专业个人社会记录,如查找失散的亲戚、个人背景、犯罪记录、破产情况、邻居资料、根据邮箱地址查找主人的物理位置、公司人员、个人生死情况等。免费服务除了通过输入人名查找其E-mail地址的服务外,还可输入E-mail地址确认其有效性,输入美国的邮编、电话区号、城市名等了解所属地域的人口统计情况,某一社会保障号所属的州市,以及商标、专利和版权检索服务等。

②Bigfoot Directories(http:∥www.bigfoot.com)。Bigfoot是为商家和个人提供服务的一个门户网站,服务内容包括Bigfoot Directories、Business Solutions和Personal Solutions三部分,其中Bigfoot Directories通过利用多方资源提供人物信息、E-mail地址等的检索查询服务,提供六个检索入口。

a.E-mail search:利用Bigfoot自己的数据库资源查找某人的E-mail地址。

b.Find Friends:利用Reunion(http:∥peoplesearch.reunion.com)的资源检索朋友的背景以及联系方式。

c.FindaDate:利用itzamatch!(http:∥www.itzamatch.com)为陌生人相识提供机会。只需在itzamatch网站提交个人相关信息,进行检索后就可找到有共同兴趣爱好的人的相关信息。

d.White Pages:利用address.com(http:∥whitepages.addresses.com)的资源检索所找人物的电话和地址。

e.Yellow Pages:利用Super Pages.com(http:∥yellowpages.superpages.com)的资源查找有关商家的信息。

f.Find People:利用Intelius(http:∥find.intelius.com)查找失散的亲戚、朋友、同学以及其他重要人物。

注:Bigfoot所调用的上述六个网站均独立运作,用户可直接访问。

③Switchboard(http:∥www.switchboard.com)。Switchboard是一个检索黄页和白页信息的专用工具,创建于1996年2月,目前隶属于InfoSpace公司。可检索公司名录、个人信息、电话号码归属、电话区号、邮政编码、地图、驾驶路线等信息。

(2)图查询搜索引擎。

①图行天下(http:∥www.g02map.com/lightmipj/map)。图行天下是我国第一个面向公众提供电子地图服务的网站,是检索全国地图信息的重要工具,在2003年地理信息系统优秀应用工程评选中获优秀工程奖。可以查询我国14个大城市的地图、交通、生活、旅游等信息,通过输入关键词,获取公交路线、周边环境以及所在位置最近的所需设施。它已经不再是一个简单的地理信息查询系统,而是涵盖了交通、地理、历史、旅游、商业等方面信息的多维化搜索引擎。

②网上电子地图(http:∥www.ppmap.com)。网上电子地图是奥发科技公司开发的一个地图引擎,目前有各类中国地图400多张,国外地图200多张。其中可以直接用于GPS、LBS移动位置服务的图有80张,包括了我国直辖市、省会城市、大多数经济发达的中等城市及旅游城市等大多数主要城市。奥发地图拥有丰富的数据信息,涵盖了道路、政府机关、学校、医疗卫生、企事业单位、邮电通信、交通、旅游景点、宾馆饭店、公交车站、娱乐场所等30个大类,用户可以根据需要分层显示,速度快。此外,网上电子地图还提供全球各大洲及其各国的基本情况,如首都、人口、面积、宗教、语言、自然地理、资源,以及国旗、国徽的图片。利用电子地图进行网上查询,可直接进行地图加载、信息点查询、漫游等地图操作,简单迅速、方便直接。

③Mapblast(http:∥www.mapblast.com)。Mapblast是微软公司推出的地图和驾车路线查询服务站点,查询美国、加拿大、欧洲的详尽地图和驾车路线信息,同时还提供世界地图集来查找世界上任何一个地方。可以检索澳大利亚、比利时、加拿大、丹麦、芬兰(只有赫尔辛基)、法国、德国、意大利、卢森堡公国、挪威(奥斯陆)、葡萄牙、西班牙、瑞典、瑞士、荷兰、英国和美国的街道(street)级地图,以及相互之间的驾车路线。输入所查地址的名称、所属州市和国家就可获得地图,显示的地图可以放大、缩小、打印和E-mail发送。

④MapQuest(http:∥www.mapquest.com)。MapQuest是由Geosystems Global公司于1996年推出的交互地图站点,后改名为MapQuest.com,目前隶属于美国在线公司,提供地图、驾车路线和地址信息的查询服务,有三个服务入口。

a.Find it:通过直接在检索文本框中输入企业名称或者所属种类,以及所在城市、州或者邮政编码来查找其位置。也可逐层浏览其分类目录获取所需细类,然后再输入所在城市、州和邮编来检索。另外,可查询所在位置的周边环境和附近的公共事业信息。

b.Maps:查询全球多个国家的城市地图,美国1 000多个城市地图。

c.Directions:查询北美、欧洲城市之间的驾车路线。

(3)图像查询搜索引擎。

万维网上的图像信息有多种形式,如图像、图形、位图、动画和影像等。对于这些信息的查找,我们可以利用一些综合性搜索引擎的图片检索功能,例如Yahoo!、百度、Google、LyCOS、AltaVista等。也可以访问一些专业的图形图像资料库、俱乐部网站,它们往往具有数量可观的各种图像资料,并且有本站内部的分类目录和搜索引擎,如知名的NIX(美国航空航天总署图片交流中心)、Smithsonian图片数据库等。此外,还出现了一些专门的图像搜索引擎,本书主要介绍以下三种。

①WebSeek(http:∥persia.ee.columbia.edu:8008)。WebSeek是由哥伦比亚大学研制的一个基于内容的图片和影像检索工具,采用了先进的特征抽取技术,至2005年年初,已经收录66多万幅图片和影像片段。用户界面直观,操作简单,查询途径丰富,结果输出画面生动、支持用户直接下载信息。提供主题目录浏览检索和关键词检索两种方式。主题目录按照(a~z)顺序分为下列16个大类:Animals、Architecture、Art、Astronomy、Cats、Celebrities、Dogs、Food、Horror、Humour、Movies、Music、Nature、Sports、Transportation和Travel。每一大类下又细分为若干小类,一般为3~4级类目,最后一级为图片/影像。关键词检索只需在主页的检索文本框中输入一个表示所检图片/影像的主题的单词即可。“检索范围”选项包括Videos(影像)、Colorphotos(彩图)、Grayimages(灰度图)、Graphics(图形)、All(所有范围)5个选择。在检索结果页面,可利用任一图片/影像的颜色在所列图片/影像中或者整个WebSeek的数据库进一步检索,也可对某一图片/影像进行颜色等方面的调整后,再重新检索。

②QBIC(http:∥www.qbic.almaden.ibm.com/)。QBIC(Query By Image Contem)是IBM公司推出的图像和动态影像查询系统,主要为IBM的DB2大型数据库提供图像检索功能,并支持基于Web的图像检索服务。可以按照图像的颜色、灰度、纹理和位置等信息进行检索,检索提问式要求以图像方式表达。可利用系统提供的范图、自己绘制的简图或者扫描输入的图像来进行相似性查找,也可从颜色、纹理和轮廓结构列表中选取所需图像的类似信息进行检索。影像检索的时候可以从影像片段和前景中运动的对象进行检索。QBIC除了上述的基于内容特征的检索外,也可辅以文本查询手段,如图像的作者、标题、内容描述等。

③图像词典(中文)(http:∥ch.gograph.com/)。图像词典是一个多语言、多类别网上图像搜索引擎,以中、英、法、德、挪威、意大利、西班牙和葡萄牙8种文字显示。在中文界面下,大量的图像被划分为动态图像、艺术剪辑图、图标、照片、壁纸、界面、背景、成套图像共8个大类和若干细类。提供关键词检索和主题目录浏览检索两种方式。检索结果不仅显示图片,而且显示图片的作者、下载次数、使用者投票率、格式、大小、分辨率、价格等信息。图像词典的英文网址为http:∥www.gograph.com。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈