首页 理论教育 大数据预测流感趋势,相关性高达百分之97

大数据预测流感趋势,相关性高达百分之97

时间:2023-05-22 理论教育 版权反馈
【摘要】:预测功能就是大数据的核心。谷歌公司为了测试这些检索词条,总共处理了4.5亿个不同的数学模型,将得出的预测与2007 年、2008 年美国疾控中心记录的实际流感病例进行对比后,谷歌公司发现,他们的软件发现了45 条检索词条的组合,将它们用于一个特定的数学模型后,它们的预测与官方数据的相关性高达97%,和疾控中心一样,它们也能判断出流感是从哪里传播出来的,而且判断非常及时,不会像疾控中心一样要在流感爆发一两周之后才可以做到。

大数据预测流感趋势,相关性高达百分之97

预测功能就是大数据的核心。大数据的预测功能并非与人力预测一般,它并非一种对于数据的“思考”,也不是单纯的“归纳总结”数据与结果的因果关系。大数据的预测功能是通过数学的算法从海量数据中寻找相关性,大数据预测功能要搞清楚的是相关关系而不是因果关系,它通过相关关系对未来进行预测。

谷歌公司把5000万条美国人最频繁检索的词条与美国疾控中心在2003年至2008年季节性流感传播时期的数据进行了比较,他们希望通过分析人们的搜索记录来判断这些人是否患上了流感。其他公司也曾试图确定这些相关的词条,但是它们缺乏像谷歌公司一样庞大的数据资源、处理能力和统计技术,它们设立的这个系统唯一关注的就是特定检索词条的使用频率与流感在时间和空间上的传播之间的联系。谷歌公司为了测试这些检索词条,总共处理了4.5亿个不同的数学模型,将得出的预测与2007 年、2008 年美国疾控中心记录的实际流感病例进行对比后,谷歌公司发现,他们的软件发现了45 条检索词条的组合,将它们用于一个特定的数学模型后,它们的预测与官方数据的相关性高达97%,和疾控中心一样,它们也能判断出流感是从哪里传播出来的,而且判断非常及时,不会像疾控中心一样要在流感爆发一两周之后才可以做到。所以,2009年甲型H1N1流感爆发的时候,与习惯性滞后的官方数据相比,谷歌成了一个更有效、更及时的指示标。公共卫生机构的官员获得了非常有价值的数据信息。惊人的是,谷歌公司的方法甚至不需要分发口腔试纸和联系医生——它是建立在大数据的基础之上的,这是当今社会所独有的一种新型能力:以一种前所未有的方式,通过对海量数据进行分析,获得有巨大价值的产品和服务,或深刻的洞见。基于这样的技术理念和数据储备,下一次流感来袭的时候,世界将会拥有一种更好的预测工具,以预防流感的传播。[13]一家科技创业公司,名为Farecast。通过预测机票价格的走势以及增降幅度,Farecast票价预测工具能帮助消费者抓住最佳购买时机,而在此之前还没有其他网站能让消费者获得这些信息。这个系统为了保障自身的透明度,会把对机票价格走势预测的可信度标示出来,供消费者参考。系统的运转需要海量数据的支持。为了提高预测的准确性,埃齐奥尼找到了一个行业机票预订数据库,而系统的预测结果是根据美国商业航空产业中,每一条航线上每一架飞机内的每一个座位一年内的综合票价记录而得出的。如今,Farecast已经拥有惊人的约2 000亿条飞行数据记录,利用这种方法,Farecast为消费者节省了一大笔钱。[14](www.xing528.com)

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈