1996年8月成立的搜狐公司是最早参与制作网络信息分类导航的网站,我国台湾中正大学吴升教授所领导的GAIS实验室于1998年1月创立了Openfind中文搜索引擎,是最早开发的中文智能搜索引擎,它采用了GAIS实验室推出的多元排序(Poly Rank TM)核心技术。
2000年1月,两位北大校友,超链分析专利发明人、前Infoseek资深工程师李彦宏与好友徐勇在北京中关村创立了百度(Baidu)公司。并于2001年8月发布Baidu.com搜索引擎Beta版(此前百度只为其他门户网站搜狐新浪Tom等提供搜索引擎)。2001年10月22日正式发布Baidu搜索引擎,专注于中文搜索。百度搜索引擎的其他特色包括:百度快照、网页预览/预览全部网页、相关搜索词、错别字纠正提示、MP3搜索、Flash搜索。
1.搜索引擎的发展趋势
(1)多媒体搜索。随着宽带技术的发展,未来的互联网是多媒体数据的时代,它将广泛应用于电子会议、远程教学、远程医疗、数字图书馆、电子商务、地理信息系统、文化娱乐等方面。多媒体信息检索系统应能对以文本信息为代表的离散媒体和以图像、声音等为代表的连续媒体的内容进行检索。由于多媒体信息覆盖面较广,对象较多且复杂,功能多样,同时需要把文字与图像、声音等并发处理,要求它们在时间和空间组合上相匹配,因此,需要研究一种普遍使用的信息模型,使之既适合多媒体对象的组织,又符合多媒体对象的构造,并在此基础上建立一个高层的查询机制,用来对多媒体及其成分进行统一检索。
(2)建立垂直化专业领域搜索引擎。由于社会分工的加大,互联网用户从事的职业有很大的不同,不同互联网用户对信息搜索也往往有自己的专业要求。垂直类搜索引擎只面向某一特定的领域,专注于自己的特长和核心技术,能够保证对该领域的信息完全收录与及时更新。专业化的搜索引擎在提供专业信息方面有着大型综合引擎所无法比拟的优势,专业搜索引擎和专门信息搜索引擎所采用的基本技术同综合引擎一样,而且基本上都是成熟的技术,它们的发展没有技术障碍。因此,垂直化、专业化搜索引擎是搜索引擎发展的新趋势。
(3)促进搜索引擎的本土化、结构化和个性化。①本土化搜索是指搜索引擎的搜索要符合当地用户的需求;②结构化搜索是指充分利用XML等技术使信息结构化,同时使查询结构化,从而使搜索的准确度大大提高;③个性化搜索是将搜索建立在个性化的搜索环境之上,通过对用户的不断了解、分析,使得个性化搜索更符合每个人的需求。
(4)对索引数据库的规范化组织和管理。搜索引擎的索引数据库是网络信息的一个轨迹,它要随网络信息的变化而变化,因此它除了数据增加以外还需要有数据的删除和修改功能,如何对大容量的、非结构化的信息进行增加、删除、改变操作也是一个研究重点。
(5)搜索引擎集成化。集合型搜索引擎将多个独立型搜索引擎集成在一起,提供给用户一个统一的操作界面,系统将用户的检索指令发送给各独立搜索引擎,并将独立检索引擎返回的结果综合整理后反馈给用户,集合型搜索引擎涉及多个数据库,拓宽了检索范围,起到取长补短的作用,极大地方便了用户。
(6)实现检索语言自然化。自然语言更能贴切地表达用户的查询要求,提高查询精度,易于搜索引擎和用户的交互。因此基于自然语言的检索已成为一个实际的需要。基于自然语言的检索不依附于他项的数据库,与规范语言相比它可以取消标引工作,或降低标引工作的难度和成本,容易被用户接受。
(7)在移动搜索方面,移动搜索未来的发展眼光将会聚焦在4G时代,未来将会进一步发掘移动用户的特点和需求,完成互联网搜索功能向通信网络的转移和创新。(www.xing528.com)
(8)在商业模式创新的驱使下,搜索引擎与电子商务日趋融合,行业应用的地位也会逐渐得到提升。其中金融、旅游、零售、制造等行业将会成为搜索引擎行业应用重点打造的目标。
2.搜索引擎的未来前景
(1)更普及。商家在网上搜索、桌面搜索、地址栏搜索等多方面用尽了心思,使得搜索服务几乎无处不在。同时对新闻搜索、MP3搜索、图片搜索、地图搜索等多方面给予支持,这是搜索引擎的横向发展。伴随着技术的改进,通信速度的加快,通信成本的降低,口语识别、手语识别和图像识别技术也会加入到搜索引擎当中,使用户可以更加自由地与搜索引擎进行交互,从而更舒服地进行搜索。那时候,用户就可以在任何地方掌握天下大事了。
(2)更智能。百度现在已经可以把用户输入的“才艺林”修正为“蔡依林”了,这就是一种智能。这种技术是很容易实现的,然而有人没有实现它。未来的搜索引擎会更加智能,也许,用户只需要对着麦克风说一声:“雅虎,给我搜索蔡依林。”然后网站会自动地合成蔡依林的声音对你说:“你是要搜索关于我的资料吗?”你说:“是的”。然后网站执行了搜索。这并不是遥不可及的事情,事实上,从技术上现在就可以实现,只是差成本和推广的问题。
另外,还可以想象,对着搜索引擎哼出一首歌的几句,搜索引擎就会根据歌曲的旋律把这首歌找出来。
当类似这样的技术解决了成本问题的时候,它就可以应用推广了。那时许多不会写字的人也可以进行搜索,这样,搜索引擎的用户群将瞬间成倍增长。
搜索引擎的智能还体现在对用户搜索偏好的分析上,通过分析用户的输入,进行归纳和统计,从而找出最适合用户需要的结果群。比如,一个普通人搜索“红松”,可能是要得到一些关于红松的风景图片之类的普通介绍,而一个木工去搜索“红松”,往往是要得到关于红松的防水性和坚固程度的数据。如果能够很好地分析搜索者的动机,就可以使得搜索结果群中显示在前面的项目更加符合用户的需要。
所以,人工智能技术发展到什么程度,搜索引擎的智能程度就有多高。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。