首页 理论教育 互联网大数据企业解决数据瓶颈问题

互联网大数据企业解决数据瓶颈问题

时间:2023-11-20 理论教育 版权反馈
【摘要】:21世纪以来,成功的互联网企业,无一不与互联网大数据有关,这个领域内最著名的企业包括谷歌、百度等世界级巨头公司。很多企业和个人直接在脸书、推特、微博和微信上开设账号发布信息,互联网中的大数据逐步汇聚到互联网类脑神经元网络中,事实上,作为互联网的大数据索引工具,百度和谷歌受到了严重的影响。

互联网大数据企业解决数据瓶颈问题

互联网经过近50年的发展,已经积累了天文数字级的信息和数据,是互联网大脑智能产生的源泉,也是互联网记忆系统形成的基础。对这些海量数据进行挖掘、分析和整理,成为互联网大脑中最有价值的领域之一。21世纪以来,成功的互联网企业,无一不与互联网大数据有关,这个领域内最著名的企业包括谷歌百度世界级巨头公司。

1991年万维网诞生,这个创新使任何机构、企业和个人都可以在互联网的知识海洋中分享信息和利用信息。但随着万维网的急剧发展,互联网中的信息呈爆炸式增长。人类在信息的海洋中迅速找到自己需要的数据就成为互联网大脑发育的重要需求。

这时索引擎技术出现了,从本质上说,搜索引擎就是为互联网大脑的记忆信息建立一个统一的索引。通过这个索引,人类可以很容易地在互联网大脑中找到对自己有价值的记忆信息。

21世纪初互联网的蓬勃发展,推动了千百万网站的诞生,这些网站不断产生海量信息和数据,人类如何对这些信息和数据进行索引呢?百度和谷歌就顺应了这一需求(见图2.7),成为互联网大数据优秀的探路者和影响世界的科技巨头。

图2.7 早期谷歌和百度的互联网生态

1996年4月,当时著名的搜索引擎Excite以首期200万股股票上市,李彦宏在此时想到了如何解决搜索引擎的作弊问题。一年后,李彦宏提交了一份名为《超链文件检索系统和方法》的专利申请,比谷歌创始人发明的网页权重(PR)要早一年,这是非常具有前瞻性的研究工作。在这份专利中,李彦宏提出了与传统信息检索系统不同的基于链接的排名方法。[9]

1998年10月之前,谷歌只是斯坦福大学的一个小项目。1995年博士生拉里·佩奇开始学习搜索引擎技术,他在1997年9月15日注册了google.com的域名,1998年9月27日,谷歌公司正式把这一天认作自己的生日。[10]

2017年10月18日,百度股价达到274.97美元,再创历史新高,此时百度的市值为954.15亿美元,距离千亿美元的市值只有一步之遥,与此同时,谷歌的市值达到6824亿美元。

谷歌、百度在蓬勃发展的同时也面临着同样的危机和困境,这是因为在它们诞生之后的20年里,互联网的生态发生了巨大的变化。受互联网向类脑架构进化趋势的影响,以微博、微信、脸书、淘宝为代表的互联网类神经元网络逐渐发育起来,大量的BBS网站、企业网站和个人博客网站在互联网的进化道路上消失了。

很多企业和个人直接在脸书、推特、微博和微信上开设账号发布信息,互联网中的大数据逐步汇聚到互联网类脑神经元网络中,事实上,作为互联网的大数据索引工具,百度和谷歌受到了严重的影响。谷歌和百度的发展瓶颈如图2.8所示。(www.xing528.com)

图2.8 谷歌和百度的发展瓶颈

从图2.8可以看出,由于在互联网类脑神经元领域的弱势,谷歌和百度在大数据、人工智能领域的优势无法对它们在互联网大脑其他神经系统的布局提供很强的支持,这是谷歌和百度目前面临的最大问题。

在中国,百度面临的对手是腾讯阿里巴巴,在美国,谷歌面临的风险来自脸书、推特和亚马逊等。微信、QQ和脸书等成功地制造了一个巨大的信息“王国”,用户通过社交关系获得信息,与好友分享生活。而这些信息无法通过搜索引擎来获取。如果用户可以在这座信息“王国”内获得所需要的信息,那么百度、谷歌实际上就被边缘化了。

谷歌对此做了大量的努力,“谷歌+”是谷歌于2011年6月28日推出的一个SNS社交网站,互联网用户可以通过谷歌账户登录,在这个社交网站上,用户可以和有不同兴趣爱好的好友分享好玩的东西。2014年,“谷歌+”之父维克·冈多特拉(Vic Gundotra)从谷歌离职,一位谷歌前工程师则直接宣称“谷歌+”作为一个社交网络已经失败。[11]

早在2003年,百度推出了百度贴吧,通过被搜索的关键词形成讨论社区,应该说这是一个重要的发明,在之后近十年的发展过程中,百度贴吧聚焦了巨大的粉丝群体。从官方统计数据来看,2014年百度贴吧拥有10亿注册用户和近820万个主题吧,日均话题总量过亿、日均浏览量超过27亿。[12]

虽然百度贴吧在PC(个人电脑)端取得了巨大成功,但在移动互联网时代,百度没有充分利用贴吧的社交属性为自己赢得移动互联网时代的“船票”,被今日头条通过新闻数据社交化抢走热点,两者成为同领域的竞争对手。

目前,百度和谷歌都将AI作为主攻目标,但是从图2.9来看,百度和谷歌依然需要大力培养在互联网类脑神经元网络中的势力,例如百度的贴吧、谷歌的“谷歌+”。通过这种努力,百度和谷歌一方面可以避免它们最重要的资产——数据被腾讯、脸书、阿里巴巴、推特控制,另一方面也可以为AI技术通过类脑神经元网络寻找更多应用场景奠定基础。百度、谷歌在互联网大脑中的位置如图2.9所示。

图2.9 百度、谷歌在互联网大脑中的位置

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈