首页 理论教育 信息检索基本语法:快速入门

信息检索基本语法:快速入门

时间:2023-08-01 理论教育 版权反馈
【摘要】:专业的搜索引擎一般都会实现一个搜索语法,基本的搜索语法有以下逻辑运算符:与:查询词必须出现在搜索结果中。除了逻辑运算相关的搜索语法,还有以下几种搜索语法。书名号是中文搜索独有的一个特殊查询语法。

信息检索基本语法:快速入门

专业的搜索引擎一般都会实现一个搜索语法,基本的搜索语法有以下逻辑运算符:

与(+、空格):查询词必须出现在搜索结果中。

或(OR、|):搜索结果可以包括运算符两边的任意一个查询词。

非(-):要求搜索结果中不含特定查询词。如果用户发现搜索结果中有某一类网页是其不希望看见的,而且这些网页都包含特定的关键词,那么用此语法就可以去除所有这些含有特定关键词的网页。

例如,搜索“康熙王朝”,希望搜索结果是关于武侠小说的内容,却发现很多关于电视剧的网页。那么就可以这样查询:

康熙王朝-电视剧

注意:前一个关键词和减号之间必须有空格,否则,减号会被当成连字符处理,而失去减号语法的功能。减号和后一个关键词之间有无空格均可。

除了逻辑运算相关的搜索语法,还有以下几种搜索语法。

1.把搜索范围限定在网页标题中——intitle

网页标题通常是对网页内容提纲挈领式的归纳。把查询范围限定在网页标题中,有时能获得良好的效果。实现的方式是把查询内容中特别关键的部分用“intitle:”限定。例如,找赵本山小品就可以这样查询:

小品intitle:赵本山

注意:“intitle:”和后面的关键词之间不要有空格。

2.把搜索范围限定在特定站点中——site

有时候,用户知道某个站点中有自己需要找的东西,就可以把搜索范围限定在这个站点中,以提高查询效率。实现的方式是在查询内容的后面加上“site:站点域名”。例如,要从软件下载网站“天空网”查找MSN聊天工具软件,可以这样查询:(www.xing528.com)

MSN site:skycn.com

注意:“site:”后面跟的站点域名不要加“http://”,另外,“site:”和站点名之间不要有空格。

3.把搜索范围限定在URL链接中——inurl

网页URL中的某些信息常常具有某种有价值的含义。因此,如果对搜索结果的URL做某种限定,就可以获得良好的效果。实现的方式是在“inurl:”后面加上需要在URL中出现的关键词。例如,查找关于Word的使用技巧,可以这样查询:

Word inurl:jiqiao

上面这个查询串中的“Word”可以出现在网页中的任何位置,而“jiqiao”必须出现在网页URL中。

注意:“inurl:”和后面所跟的关键词之间不要有空格。

4.精确匹配——双引号书名号

如果输入的关键词很长,搜索引擎在经过分析后,给出的搜索结果中的关键词可能是拆分的。如果用户对这种情况不满意,可以尝试让搜索引擎不拆分关键词,给关键词加上双引号,就可以达到这种效果。

例如,搜索上海科技大学,如果不加双引号,搜索结果被拆分,效果不是很好,但加上双引号后,即搜索“上海科技大学”,获得的结果就全是符合要求的了。

书名号是中文搜索独有的一个特殊查询语法。在有些搜索引擎中,书名号会被忽略,而在百度、Google等搜索中,中文书名号是可被查询的。加上书名号的关键词,有两层特殊功能:一是书名号会出现在搜索结果中,二是在书名号中的内容不会被拆分。

书名号在某些情况下特别有用,例如,查那些名字很常用的电影或者小说。在搜索电影《手机》时,如果不加书名号,很多情况下搜出来的是通信工具——手机,而加上书名号后,搜索《手机》的结果就都是电影方面的了。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈