1.搜索引擎的含义与类型
搜索引擎(Search Engine)是指根据一定的检索策略,运用特定的计算机程序从互联网上搜集信息,再对信息进行组织和处理后,为用户提供服务,将用户检索相关的信息展示给用户的系统。搜索引擎的功能主要包括信息搜集、信息处理和信息查询。在浩瀚的网络资源中,搜索引擎可以帮助我们迅速而全面地找到所需要的信息。搜索引擎是一种网络信息检索工具。对于用户而言,搜索引擎提供一个包含搜索框的页面,用户在搜索框内输入词语,通过浏览器提交给搜索引擎后,搜索引擎就会返回与用户所输入的内容相关的信息列表。
根据搜索引擎所基于的技术原理,可以把它们分为三大主要类型:全文搜索引擎(Full Text Search Engine)、目录索引类搜索引擎(Search Index/Directory)和元搜索引擎(Meta Search Engine)。
(1)全文搜索引擎。全文搜索引擎是名副其实的搜索引擎,国外具有代表性的有Google、Fast/AllTheWeb、AltaVista、Inktomi、Teoma、WiseNut等,国内著名的有百度(Baidu)。它们都是通过从互联网上提取各个网站信息(以网页文字为主)而建立的数据库中,检索与用户查询条件匹配的相关记录,然后按一定的排列顺序将结果返回给用户,因此它们是真正的搜索引擎。
从搜索结果来源的角度,全文搜索引擎又可细分为两种,一种是拥有自己的检索程序,并自建网页数据库,搜索结果直接从自身的数据库中调用;另一种则是租用其他引擎的数据库,并按自定的格式排列搜索结果,如Lycos引擎。
(2)目录索引。目录索引虽然有搜索功能,但在严格意义上算不上是真正的搜索引擎,仅仅是按目录分类的网站链接列表而已。用户完全可以不用进行关键词(Keywords)查询,仅靠分类目录也可找到需要的信息。目录索引中最具代表性的莫过于大名鼎鼎的Yahoo(雅虎)。其他著名的还有Open Directory Project(DMOZ)、LookSmart、About等。国内的搜狐、新浪、网易搜索也都属于这一类。
(3)元搜索引擎。元搜索引擎在接受用户查询请求时,同时在其他多个引擎上进行搜索,并将结果返回给用户。著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等(元搜索引擎列表),中文元搜索引擎中具代表性的有搜星搜索引擎。在搜索结果排列方面,有的直接按来源引擎排列搜索结果,如Dogpile,有的则按自定的规则将结果重新排列组合,如Vivisimo。
除上述三大类引擎外,还有以下几种非主流形式:
一是集合式搜索引擎。如HotBot在2002年底推出的引擎。该引擎类似META搜索引擎,但区别在于:不是同时调用多个引擎进行搜索,而是由用户从提供的4个引擎当中选择,因此叫它“集合式”搜索引擎更确切些。
二是门户搜索引擎。如AOL Search、MSN Search等虽然提供搜索服务,但自身既没有分类目录也没有网页数据库,其搜索结果完全来自其他引擎。
三是免费链接列表(Free For All Links,简称FFA)。这类网站一般只简单地滚动排列链接条目,少部分有简单的分类目录,不过规模比起Yahoo等目录索引来要小得多。
2.常用搜索引擎
(1)百度(http://www.baidu.com)。
“众里寻她千百度”,“百度”二字源自辛弃疾的《青玉案》。1999年底,李彦宏先生及徐勇先生于美国硅谷创建百度,2000年百度落户中国,从此掀开了中文搜索引擎的新篇章。目前它已成为全球最大的中文搜索引擎,具有全球独有的“超链分析”专利技术,每天访问量超过6000万人次,有来自全球138个国家的搜索请求。
百度的主要功能与Google类似,但是界面更简洁,尤其值得称道的是,百度把视频、MP3、图片等检索功能列于主页,使用极其简便。也许,这正是在中国搜索引擎中首选百度的奥秘所在。
1)简单检索:①点击信息的类型(可选项:新闻、网页、贴吧、知道、MP3、图片、视频,系统默认为:网页)。
②在搜索框内输入需要查询的内容(例如:射雕英雄传)。若输入多个检索词搜索(检索词之间加一个空格,系统默认以“and”组配),可获得更精确的搜索结果。
③敲回车键,或者点击搜索框右侧的“百度一下”按钮,随即出现检索结果。
④点击检索结果中的某一记录,即可查看、下载或欣赏。(MP3下载要领:在检索结果界面,点击“试听”;在随即跳出的窗口,右击上方“歌曲出处”字样右侧的链接,如:“歌曲出处:http://www.zjgrcb.com/mp3/fire.mp3”,选择“目标另存为”命令;必要时文件名另取,点击“保存”按钮)。
2)高级搜索:在主页(或其他信息类型的检索界面,比如“视频”),点击“百度一下”按钮旁边的“高级”链接,即可进入相关的“高级搜索”界面。
在百度网页高级搜索界面,可选择的检索限制条件较多,但比“Google高级搜索”界面简洁,其检索方法与“Google高级搜索”相似,也可限制文档格式(可选项:“.pdf”、“.doc”、“.xls”、“.ppt”、“.rtf”、所有网页和文件、所有格式)等等。
其他信息类型(比如MP3)的高级检索界面可选择的检索限制条件则较少。
高级搜索实例:欲检索最近一年内唐诗研究方面的Word格式的文章。检索步骤如下:
①在“高级搜索”界面的“包含以下全部的关键词”栏中输入“唐诗研究”。
②在“限定要搜索的网页的时间是”栏中,通过下拉列表,选择“最近一年”。
③在“搜索网页格式是”栏中,通过下拉列表,选择“微软Word(.doc)”。
④在“选择搜索结果显示的条数”栏中,通过下拉列表,选择“每页显示100条”(这样可以提高查看检索结果时的效率)。
⑤敲回车键,或者点击页面右上角的“百度一下”按钮,随即出现检索结果。
(2)谷歌(http://www.google.com)。
Google搜索引擎由斯坦福大学博士生Larry Page与Sergey Brin于1998年9月发明的,是目前世界上最大的搜索引擎。它提供了简单易用的免费服务。Google支持包括简体中文和繁体中文在内的132种语言,它富于创新的搜索技术和典雅的用户界面设计使其成为世界上利用率最高的搜索引擎。(www.xing528.com)
谷歌搜索的方法如下:
1)基本检索:是指在谷歌主页的检索框中输入检索词,点击“Google搜索”即可。如果是多个检索词,它们之间用空格隔开,系统默认为逻辑“与”运算。如果要进行短语或专用词检索,则应在专用词上加双引号,或者用-、\、+、=等作为短语的连接符。
该系统设有为用户推荐网页的功能,可以将用户直接引导到与检索词最相关的网页。用法:输入检索词之后,点击“手气不错”按钮即可。例如,要查找德州学院,只要输入“德州学院”,并点击“手气不错”按钮,Google就会直接将用户带到“www.dzu.edu.cn”即德州学院的主页。
检索结果,每条记录显示的内容包括:网页标题、网页内容摘要(并以醒目的字体显示检索词)、网址、网页文本的大小等。点击“网页快照”可看到Google保存的该网页内容。
在检索结果的页面上,点击“相似网页”可以获得与该网页性质类似的网页。如该页是某大学的首页,则Google会寻找其他大学的首页;该页是某大学数学系,则会寻找其他大学的数学系。
2)高级检索:是指在检索中可以使用限制检索的方法,例如将检索限定在某些网站上,可以在输入检索词的后面跟site:<网站>,如site:onlinedown.net;可以使用“-<网站(或者域名)>”的形式,来排除某个特定站点的网页;将检索限定在某一类文件中,在输入检索词的后面跟filetype:<文件类型>,例如,“参政党”filetype:pdf;如果输入link:<网址>,可以查出所有链接到此网址的网页;还可以限定检索的语种;检索某个网页的所有页面,检索与某个网页相关的所有网页等。
Google只会返回那些符合全部查询条件的网页,不需要在关键词之间加上“and”或“+”。如果想缩小搜索范围,只需输入更多的关键词,只要在关键词中间留空格就行了。如果要避免搜索某个词语,可以在这个词前面加上一个“-”。但在减号之前必须留一空格。该系统支持跨语种检索和多语种检索,检索结果按相关性(与网页被链接的多寡、对网站的评价等因素有关)排序。
Google搜索不支持逻辑“或”运算,也不支持截词检索;在英文检索中,不区分字母大小写,所有的字母均按小写处理。例如,输入“george washington”(乔治·华盛顿),或是“George Washington”,再或是“gEoRgE wAsHiNgToN”,结果都是一样的。
Google会忽略最常用的词和字符,这些词和字符称为忽略词。Google自动忽略“http”,“.com”以及数字等使用频率很大的词,这类字词不仅无助于缩小查询范围,而且会大大降低搜索速度,如果要想检索这类词,则应在其前面用“+”。
(3)360搜索(https://www.so.com)
360搜索,是中国360安全科技股份有限公司开发的全文搜索引擎,2012年上线。包括导航、资讯、视频、图片、良医、地图、百科、英文、问答、翻译、音乐、软件、趋势、学术、商机等应用。下面择要介绍。
360网页搜索是奇虎360公司推出的独立搜索品牌,致力于为用户网页搜索提供更精准、更快捷、更安全的搜索服务。360搜索在搜索引擎返回结果的基础上,对搜索结果做了许多优化,包括:判断用户最可能的需求,令用户最关心的内容最先最大地得到展现;搜索结果也按照结果属性做了结构化展示,帮助用户减少决策成本。除此之外,360搜索还开发了各类完善搜索行为的功能,包括搜索词自动补全、相关搜索以及搜索推荐等,为用户营造一个准确、全面、完善的搜索体验。
360问答是一个基于搜索的互动式知识问答分享平台,致力于建立一个友好、温暖的知识分享社区,为用户打造一个干净、安全、可靠的问答环境。
360视频汇聚了全中国所有主流视频网站的影视资源,让用户一站式了解全网视频动态,并能通过搜索、推荐等工具,一键直达所需。目前360视频已经有了电影、电视剧、综艺、动漫、娱乐频道。
360图片收录500亿高清美图,搜索更精确,观赏更流畅。
360音乐是目前国内知名的音乐聚合平台。拥有超过500万的曲库资源和超过30万的mv资源。
360百科是互联网中文百科全书,收录了超过2000万词条,内容涵盖几乎所有领域的知识,帮助用户更加及时、便捷地获得准确、权威的知识与信息。
360良医是360公司涉足互联网医疗的战略业务,推出三甲医院直通车服务,通过互联网的技术和手段,在不增加现有医疗资源供给的情况下,优化现有医疗结构,将病人和专家直接对接,有效地缩减中间环节,大大提高医患双方的满意度。360良医同时郑重承诺,推出的所有服务都是由三甲医院医生提供,可放心就诊。
360趋势包含指数概况、搜索指数趋势、媒体关注度。
360软件是360软件管家的网页版,提供数十类超过十万款的软件、应用、游戏资源下载,所有内容通过360安全中心检测,无木马病毒,无诱导广告,热门资源放心下载,用户可以方便快速地安装自己需要的软件。
360学术搜索,汇聚海量中英文学术期刊、论文,在360学术上搜索文献关键词,或文献标题,会从海量数据库中调取相应的文献。用户可以根据发表时间进行筛选,也可按照相关性、引证文献和发表时间进行自定义排序。每篇文献,都追踪其印证文献,查看其相关文章,根据它进行全网搜索,查看当篇文章的更多版本。
(4)AltaVista(http://www.altavista.com)
AltaVista提供全文检索功能,并有较细致的分类目录,网页收录极其丰富,有英、中、日等25种文字的网页。搜索首页不支持中文关键词搜索,但有支持中文关键词搜索的页面。能识别大小写和专用名词,且支持逻辑条件限制查询,高级检索功能较强。提供检索新闻、讨论组、图形、MP3/音频、视频等检索服务以及进入频道区(zones),对诸如健康、新闻、旅游等类进行专题检索。
(5)Ask(http://www.askjeeves.com或www.aj.com)
Ask是一种人工的搜索服务,目标在于指向到回答你所提问题的具体页面。如果它在自己的数据库中没有找到相关答案,它会提供从其他各个搜索引擎中找到的页面。
另外,还可利用“检查语法拼写”(check my spelling)来检查你的提问句子是否有语法错误。各种提问的搜索结果不但含有ask本系统的信息资料,还包括其他一些著名搜索引擎的检索信息。
(6)About.com(http://www.About.com)
About.com是规模较小的人工操作(Human Reviewed/Manually Picked)目录索引,主要由编辑人员在互联网上寻找有收录价值的网站或网页,然后分门别类列出链接索引。当然Webmaster也可主动向其提交网站,申请About收录你的网站,但这项工作很不容易,如想登录成功,必须有充分的理由说服编辑人员你的网站值得被收录,不过一旦编辑人员同意接收你的网站,则会很快被列入目录。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。