首页 理论教育 大数据:渗透各行业,成为重要因素

大数据:渗透各行业,成为重要因素

时间:2023-07-31 理论教育 版权反馈
【摘要】:报告指出,大数据已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。3月,美国联邦政府在白宫网站发布了“大数据研究和发展倡议”[12],这一倡议标志着大数据已经成为重要的时代特征。4月,美国软件公司Splunk在纳斯达克成功上市,成为第一家上市的大数据处理公司。随后,阿里巴巴董事局主席马云在2012年网商大会上发表演讲,称从2013年1月1日起将转型重塑平台、金融和数据三大业务。

大数据:渗透各行业,成为重要因素

1.大数据的发展历程

2008年,《Nature》出版了“Big Data”专刊[7],计算社区联盟(Computing Community Consortium)发布了“大数据计算:在商务、科学社会领域创建革命性突破(Big Data Computing:Creating Revolutionary Breakthroughs in Commerce,Science,and Society)”报告[8],它使人们的思维不仅局限于数据处理的机器,并提出:大数据真正重要的是新用途和新见解,而非数据本身,此组织可以说是最早提出大数据概念的机构。

2009年[9],印度政府建立了用于身份识别管理的生物识别数据库联合国全球脉冲项目已研究了对如何利用手机和社交网站的数据源来分析预测从螺旋价格到疾病暴发之类的问题;美国政府通过启动Data.gov网站的方式进一步开放了数据的大门,这个网站向公众提供各种各样的政府数据。该网站的超过4.45万量数据集被用于保证一些网站和智能手机应用程序来跟踪从航班到产品召回再到特定区域内失业率的信息,这一行动激发了从肯尼亚到英国范围内的政府们相继推出类似举措;欧洲一些领先的研究型图书馆科技信息研究机构建立了伙伴关系致力于改善在互联网上获取科学数据的简易性。

2010年,肯尼斯·库克尔(Kenneth Cukier)在《经济学人》上发表了长达14页的大数据专题报告“数据,无所不在的数据”。库克尔在报告中提到:“世界上有着无法想象的巨量数字信息,并以极快的速度增长。从经济界到科学界,从政府部门到艺术领域,很多方面都已经感受到了这种巨量信息的影响。”科学家和计算机工程师已经为这个现象创造了一个新词汇:“大数据”。库克尔也因此成为最早洞见大数据时代趋势的数据科学家之一。

2011年,Science推出专刊“Dealing with Data”[10],重点研究大数据的科学问题;全球知名咨询公司麦肯锡(McKinsey)发布了一份关于大数据的详尽报告——“大数据:创新、竞争和生产力的下一个新领域(Big Data:The Next Frontier for Innovation,Competition,and Productivity)”,大数据开始备受关注,这也是专业机构第一次全面介绍和展望大数据。报告指出,大数据已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。报告还提到,“大数据”源于数据生产和收集的能力和速度的大幅提升——由于越来越多的人、设备和传感器通过数字网络连接起来,产生、传送、分享和访问数据的能力也得到彻底变革。12月,工信部发布的物联网十二五规划中,把信息处理技术作为4项关键技术创新工程之一被提出来,其中包括了海量数据存储、数据挖掘、图像视频智能分析,这都是大数据的重要组成部分。

2012年,在1月瑞士达沃斯召开的世界经济论坛上,大数据是主题之一,会上发布的报告“大数据、大影响:国际发展新的可能性(Big Data,Big Impact:New Possibilities for International Development)”[11]宣称,数据已经成为一种新的经济资产类别,就像货币或黄金一样。3月,美国联邦政府白宫网站发布了“大数据研究和发展倡议(Big Data Research and Development Initiative)”[12],这一倡议标志着大数据已经成为重要的时代特征。3月,奥巴马政府宣布2亿美元投资大数据领域[13],是大数据技术从商业行为上升到国家科技战略的分水岭,在次日的电话会议中,政府对数据的定义“未来的新石油”,大数据技术领域的竞争,事关国家安全和未来。并表示,国家层面的竞争力将部分体现为一国拥有数据的规模、活性以及解释、运用的能力;国家数字主权体现对数据的占有和控制。数字主权将是继边防、海防、空防之后,另一个大国间博弈的空间。4月,美国软件公司Splunk在纳斯达克成功上市,成为第一家上市的大数据处理公司。鉴于美国经济持续低迷、股市持续震荡的大背景,Splunk首日的突出交易表现尤其令人们印象深刻,首日即暴涨了一倍多。Splunk是一家领先的提供大数据监测和分析服务的软件提供商,成立于2003年。Splunk成功上市促进了资本市场对大数据的关注,同时也促使IT厂商加快大数据布局。5月,联邦政府发布“数字政府战略(Digital Government Strategy)”[14],致力于为公众提供更好的“数字化”服务,围绕数据进行的一系列措施在美国政府全面推进,大数据对美国政府的影响逐步显现。7月,联合国在纽约发布了一份关于大数据政务的白皮书,总结了各国政府如何利用大数据更好地服务和保护人民。这份白皮书举例说明在一个数据生态系统中,个人、公共部门和私人部门各自的角色、动机和需求。例如通过对价格关注和更好地服务的渴望,个人提供数据和众包信息,并对隐私和退出权力提出需求;公共部门出于改善服务,提升效益的目的,提供了诸如统计数据、设备信息,健康指标及税务和消费信息等,并对隐私和退出权力提出需求;私人部门出于提升客户认知和预测趋势目的,提供汇总数据、消费和使用信息,并对敏感数据所有权和商业模式更加关注。白皮书还指出,人们如今可以使用的极大丰富的数据资源,包括旧数据和新数据,对社会人口进行前所未有的实时分析。联合国还以爱尔兰和美国的社交网络活跃度增长可以作为失业率上升的早期征兆为例,表明政府如果能合理分析所掌握的数据资源,将能“与数俱进”,快速应变。7月,为挖掘大数据的价值,阿里巴巴集团在管理层设立“首席数据官”一职,负责全面推进“数据分享平台”战略,并推出大型的数据分享平台——“聚石塔”,为天猫、淘宝平台上的电商及电商服务商等提供数据云服务。随后,阿里巴巴董事局主席马云在2012年网商大会上发表演讲,称从2013年1月1日起将转型重塑平台、金融和数据三大业务。马云强调:“假如我们有一个数据预报台,就像为企业装上了一个GPS和雷达,你们出海将会更有把握。”因此,阿里巴巴集团希望通过分享和挖掘海量数据,为国家和中小企业提供价值。此举是国内企业最早把大数据提升到企业管理层高度的一次重大里程碑,阿里巴巴也是最早提出通过数据进行企业数据化运营的企业。

2014年,4月,世界经济论坛以“大数据的回报与风险”主题发布了《全球信息技术报告(第13版)》。报告认为,在未来几年中针对各种信息通信技术的政策甚至会显得更加重要。全球大数据产业的日趋活跃,技术演进和应用创新的加速发展,使各国政府逐渐认识到大数据在推动经济发展、改善公共服务、增进人民福祉乃至保障国家安全方面的重大意义。5月,美国白宫发布了2014年全球“大数据”白皮书的研究报告《大数据:抓住机遇、守护价值》。报告鼓励使用数据以推动社会进步,特别是在市场与现有的机构并未以其他方式来支持这种进步的领域;同时,也需要相应的框架、结构与研究,来帮助保护美国人对于保护个人隐私、确保公平或是防止歧视的坚定信仰。

2.大数据的定义和特征

(1)大数据的技术属性。大数据本身是一个比较抽象的概念,但从字面上看,它表示数据规模的大,但是仅从数据量上无法看出大数据和“海量数据(Massive Data)”“超大规模数据(Very Large Data)”等概念的区别。对于大数据的定义目前没有一个公认的定义,大多数定义侧重大数据的特征。

2008年9月美国《自然》杂志刊登了一个名为“Big Data”的专辑,首次提出大数据(Big Data)概念。大数据,或称巨量资料,是指由数量巨大、结构复杂、类型众多的数据所构成的数据集合,必须通过特殊化处理分析才能形成有规律、可预测的信息服务能力。

麦肯锡在其报告“大数据:创新、竞争和生产力的下一个新领域”中给出的大数据定义是:大数据指的是大小超出常规的数据库工具获取、存储、管理和分析能力的数据集。该定义是一个可变的定义,即不定义一个特定数字的TB[15]才叫大数据,这是因为符合大数据标准的数据集容量会随着技术及行业的发展而变化。

Amazon的大数据科学家John Rauser给出了一个简单的定义:大数据是任何超过了一台计算机处理能力的数据量。这个定义同样是一个非常宽泛的定义,对大数据的理解也不够全面和深刻。

维基百科中对大数据定义:巨量资料(Big Data),或称大数据,指的是所涉及的资料量规模巨大到无法通过目前主流软件工具,在合理时间内达到撷取、管理、处理并整理成为帮助企业经营决策更积极目的的资讯。

百度百科对大数据的定义是:大数据(Big Data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

研究机构Gartner给出了这样的定义[16]:大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。这也是一个描述性的定义,在对数据描述的基础上加入了处理此类数据的一些特征,用这些特征来描述大数据。

IBM认为[17],可以用四个特征相结合来定义大数据:数据量(Volume)、种类(Variety)、速度(Velocity)、真实性(Veracity),即用4V或V4,也即大容量、种类丰富、极快速度、真实而准确的数据。

大数据(Big Data,Mega Data),或称巨量资料,指的是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。[18]

计算社区联盟在其“大数据计算:在商务、科学和社会领域创建革命性突破”报告中,提出了大数据的3V定义,认为大数据需要满足3个特点:规模性(Volume)、多样性(Variety)、高速性(Velocity)。国际数据公司(International Data Corporation,IDC)认为大数据还应当具有价值性(Value)[19]。海量化数据(Volume)是指数据体量巨大及规模完整性。随着数据加工处理技术的提高,网络宽带的成倍增加以及社交网络技术的迅速发展,使得数据产生量和存储量成倍增长,数据规模从TB级别跃升到PB级别。多样化结构(Variety)是指数据类型繁多。随着物联网、社交网络、智能终端等的普及和应用,网络日志、视频、图片、地理位置信息等非结构化数据所占比例越来越大。高速化处理(Velocity)是指主要表现为数据流的处理速度快。数据规模的无限扩张既对高速化处理提出了新的要求,也为其带来了新的机遇,大数据的高速化处理要求具有时间敏感性和决策性的分析,要求能在第一时间抓住重要事件发生的信息。这一点也是大数据和传统的数据挖掘技术不同的本质区别所在。低密度价值(Value)是指体现出的是大数据运用的真实意义。数据规模大并不意味着价值高,相反,这些数据间更多表现为稀缺性、不确定性和多样性[20]

2014年,IBM发布了“践行大数据承诺:大数据项目的实施应用(Realizing the Promise of Big Data:Implementing Big Data Projects)”白皮书,在该报告中进一步扩展了大数据的特征,首次提出将大数据的特性由4V扩展为“Vs”。“Vs”在大数据已有特征的基础上,增加了数据粘度(Viscosity),主要用来衡量数据流间的关联性(Resistance to Flow of Data);数据易变性(Variability),主要衡量数据流的变化率;数据有效性(Volatility),主要表明数据有效性的期限和存储的期限时长。我们认为,未来随着大数据技术的发展成熟,以及人们对大数据应用的深入,大数据的“Vs”特征将会不断变化和拓展,大数据的“Vs”特征见表3-3所示。

表3-3 大数据的“Vs”特征

(2)大数据的社会属性。任何事物都具有物理和社会两类属性特征。无论是最初的“4V”还是IBM修正后的“Vs”理论,我们认为它们都属于大数据的技术属性,是大数据所具有的区别于其他事物的特征,更多关注的是大数据的物理属性。这时的大数据被贴上的是“技术”标签。事实上,现在我们所谈到的大数据概念,其范畴已经远远超过了技术领域,而是被赋予了更丰富的社会属性。在看待大数据时,要建立全面、系统的大数据意识,要看到大数据在创造社会价值、变革行为方式等社会属性方面的“大”,而不仅仅只是其物理属性方面的“大”。

艾伯特-拉斯洛·巴拉巴西在《爆发:大数据时代预见未来的新思维》一书中指出,“大数据,更强的流动能力,社会化增强;每个人都是自媒体,个性化增强;更大范围的连接,网络化增强”;涂子沛在《大数据:正在到来的数据革命》一书中指出,“大数据时代是一个更开放的社会、一个权力更分散的社会、一个网状的大社会”。综合以上观点来看,我们认为,大数据只有与人发生了关系,展示了人类行为的规律性,才真正具有了意义。大数据应该具有它的社会属性,大数据社会属性是指大数据受社会影响所衍生出来的属性。

事实上,我们认为,大数据发展到今天,其内涵已经不仅仅局限于技术维度,而是在演变过程中不断扩展,进而形成了一个语义更加丰富、维度更加多元的综合性的概念,主要可以从以下几个方面理解。

大数据是一种技术。大数据的主要特点为数据量大(Volume)、数据类别复杂(Variety)、数据处理速度快(Velocity)和数据真实性高(Veracity),合起来被称为“4V”。大数据中的数据量非常巨大,达到了PB级别,在这庞大的数据之中不仅仅包括结构化数据(如数字、符号等数据),还包括非结构化数据(如文本、图像、声音、视频等数据)。这使得大数据的存储、管理和处理很难利用传统的关系型数据库去完成。在大数据之中,有价值的信息往往深藏其中。这就需要利用可视化分析、数据挖掘算法、预测性分析能力、语义引擎和数据质量管理(Data Quality Management)等技术对海量数据进行快速处理并获取有价值的信息,这个获取信息的过程就是大数据技术。

大数据是一种能力。大数据是一种寻找确切意思的能力,在大量数据当中寻找到背后隐藏的意义,发现事先未能想到的关系、有意思的联系的能力;大数据是一种能较准确判断事物发展趋势的能力,大数据通过对行为数据、物理数据等的分析,可以找出数据之间微妙的关联关系,然后利用这些关系找到事物发展的规律,进而预测未来;大数据是一种能带来创新的能力,大数据通过对数据的整合,将看似不相关的数据进行“重组”和分析,挖掘数据的潜在价值,进而实现数据创新,这种创新有可能创新某种产品,也可能带来产业的转型。

大数据是一种思维。大数据是一种以“开放共享”为核心价值观的思维方式,在大数据时代强调从信息公开到开放数据,从开放数据到开放数据接口,随着数据开放共享程度的提高,社会的开放共享程度也在提高。2014年4月24日,百度宣布开放全球首个大数据引擎,将这一大数据引擎向外界开放,为其提供大数据存储、分析及挖掘的技术能力。

大数据是一个时代。大数据时代是一个以数据为基本元素的时代,是一个以数据为战略资产的时代,在大数据时代只要你掌握了数据就拥有了核心竞争力。在大数据时代,每个个体都是一个数据“源”,每个个体都可以发声。大数据时代是一个更开放的社会、一个权力更分散的社会、一个网状的大社会,它让社会朝着更加个性化、民主化、自由化、开放化的方向发展[21]

大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。

从技术上看,大数据与云计算的关系就像一枚硬币的正反面一样密不可分。大数据必然无法用单台的计算机进行处理,必须采用分布式架构。它的特色在于对海量数据进行分布式数据挖掘,但它必须依托云计算的分布式处理、分布式数据库和云存储、虚拟化技术。

随着云时代的来临,大数据(Big Data)也吸引了越来越多的关注。《著云台》的分析师团队认为,大数据(Big Data)通常用来形容一个公司创造的大量非结构化数据和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱。大数据分析常和云计算联系到一起,因为实时的大型数据集分析需要像MapReduce一样的框架来向数十、数百或甚至数千的电脑分配工作。大数据需要特殊的技术,以有效地处理大量的容忍经过时间内的数据。适用于大数据的技术,包括大规模并行处理(MPP)数据库、数据挖掘电网、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统。

3.大数据的结构类型

数据量大是大数据的一致特征,由于数据自身的负责性,大数据的处理主要在大规模并行处理环境中进行。大数据具有多种形式,主要包括结构化数据、半结构化数据、非结构化数据三种形式。

(1)结构化数据。结构化数据一般指存储在数据库中,具有一定逻辑结构和物理结构的数据,最为常见的是存储在关系数据库中的数据。对于结构化数据,任何一列的数据不可以再细分,任何一列的数据类型相同,且只有一种数据类型。结构化数据的数据模型主要是二维表(关系型),结构化数据是先有结构,再有数据。结合到典型场景中更容易理解,比如企业ERP、财务系统、医疗HIS数据库、教育一卡通、政府行政审批系统和其他信息管理系统所使用的数据库等。监狱十个应用系统(即监狱安全防范和应急指挥系统、监管及执法管理系统、教育改造系统、生活保障及医疗卫生系统、警察管理系统、生产管理与劳动改造系统、监狱建设与保障系统、狱务公开系统、办公自动化决策支持系统)的后台数据库中的数据属于结构化数据。

(2)半结构化数据。所谓半结构化数据有两层含义,一种是指在物理层上缺少结构的数据,另一种是指在逻辑层上缺少结构的数据。有一些结构化数据,为用于Web页面的显示而与htm l语言的标记符号嵌在一起,构成了物理上的半结构化数据。Internet中有大量丰富的数据,这些数据多存在于html文件中,没有严格的结构及类型定义,这些都是逻辑层半结构化的数据。Internet上的数据与传统数据库中的数据不同,传统的数据库都有一定的数据模型,可以根据模型来具体描述特定的数据,而Internet上的数据非常复杂,没有特定的模型描述,每一站点的数据都各自独立设计,并且数据本身具有自述性和动态可变性,因而,Internet上的数据具有一定的结构性,但因自述层次的存在,是一种非完全结构化的数据,这也被称为半结构化数据。因此,半结构化数据是自描述、数据结构和内容混杂在一起。半结构化数据的数据模型主要包括基于图的描述形式、基于树的描述形式、基于逻辑的描述形式、基于关系的描述形式以及基于对象的描述形式,半结构化数据是先有数据,再有结构。半结构化数据主要来源有3方面:

①在WWW等对存储数据无严格模式限制的情形下,常见的有HTML、XML和SGML文件;

②在电子邮件、电子商务、文献检索和病历处理中,存在着大量结构和内容均不固定的数据;

③异构信息源集成情形下,由于信息源上的互操作要存取的信息源范围很广,包括各类数据库、知识库、电子图书馆和文件系统等。(www.xing528.com)

半结构数据的特点主要有:

①隐含的模式信息。虽然具有一定的结构,但结构和数据混合在一起,没有显式的模式定义。例如HMTL文件是一个典型。

②不规则的结构。一个数据集合可能由异构的元素组成,或用不同类型的数据表示相同的信息。

③没有严格的类型约束。由于没有一个预先定义的模式以及数据在结构上的不规则性,导致缺乏对数据的严格约束。

监狱半结构化数据主要包括:

①监狱网站上的数据;②监狱各服务器上的日志;③监狱服刑人员病例数据。

(3)非结构化数据。非结构化数据包括所有格式的办公文档、文本、图片、图像、音频、视频信息,非结构化数据从内容上没有统一的结构,数据是以原生态形式(Raw Data)保存的,因此计算机无法直接理解和处理。为了对不同类型的非结构化数据进行处理,所采用的基本思路是对这些非结构化数据进行描述,基于描述性信息实现对非结构化数据内容的管理和操作。对于非结构化数据的描述,目前有3类[22]:基于关键字的语义描述、基于底层特征的描述、基于概念的语义描述。一个非结构化数据可以由基本属性、语义特征、底层特征以及原始数据4个部分构成,而且4个部分的数据之间存在各种联系。

①基本属性:所有非结构化数据都具有的一般属性,这些属性不涉及数据的语义,包括名称、类型、创建者、创建时间等。

②语义特征:以文字表达的非结构化数据特有的语义属性,包括作者创作意图、数据主题说明、底层特征含义等语义要素。

③底层特征:通过各种专用处理技术(如图像、语音、视频等处理技术)获得的非结构化数据特性,例如对图像数据而言,有颜色、纹理、形状等。

④原始数据:非结构化数据的原生态文件。

实际上,大多数的大数据都是非结构化或半结构化的,不同数据结构类型的数据变化趋势见表3-4所示。未来非结构化数据、半结构化数据、结构化数据的增长幅度将呈现金字塔式增长。结构化数据、半结构数据、非结构数据见图3-4、3-5、3-6所示。

实际上,日常业务管理系统中,上述数据类型有可能混合在一起。例如一个关系数据库管理系统保存着一个软件支持呼叫中心的通话日志[23],在该系统中,有典型的结构化数据,比如有日期/时间戳、机器类型、问题类型、操作系统,这些是在线支持人员通过图形用户界面上的下拉式菜单输入的。另外,还有非结构化数据或半结构数据,比如自由形式的通话日志信息,这些可能来自包含问题的电子邮件或者技术问题和解决方案的实际通话描述,而最重要的信息通常隐藏在这里。

监狱非结构化数据主要包括:

①监狱日常开会记录;

②监狱干警和服刑人员的谈话记录;

③亲情会见等录音数据;

④监狱视频监控。

表3-4 大数据结构变化趋势

图3-4 结构化数据

图3-5 半结构数据

图3-6 非结构化数据

4.大数据发展的高级形态(块数据)

(1)点数据。点数据是离散的孤立数据,它也是大数据的初始来源。点数据的价值随时间的推移而下降,而数据聚合的价值却在逐渐增加。例如2017年8月26日一个用户从网上购买了一部手机,这个交易数据对用户本人、电商、物流公司来说都有很高的价值,可以保证交易的顺利完成,但当货物送达用户手中后,用户、电商和物流公司可能不会再关注本次交易数据,此时交易数据的个体性价值大大降低。但如果6个月后,电商将无数条类似的交易数据进行汇集、分析、挖掘,获取数据背后隐藏的信息,就可以明确下一步的发展布局和战略。

(2)条数据。将某个行业、领域内的点数据进行整合就形成了条数据,条数据实现了特定领域、行业内纵深数据的集合。条数据造成特定行业、领域内的数据单一、封闭,进而造成信息孤岛、数据垄断和预测时的以偏概全等负面影响。目前,人们讨论的数据几乎都是“条数据”,即某个行业和领域呈链条状串起来的数据。未来,大数据发展的趋势是“块数据”,即条数据在“块”上的汇聚和融合。

(3)块数据。块数据是在一个物理空间或者行政区域内形成的涉及人、事、物等各类数据的综合,相当于将各类“条数据”解构、交叉、融合。在块数据集合过程中,包含了数据空间的填充、空间数据的重构、集合过程的组构,及组构过程中的集合,同时还有新数据的汇集和原有数据组合后的衍生数据。通过块数据的应用,可以挖掘出数据更高、更多的价值。例如,一个百货商场每天卖出许许多多的商品,每个商品有从原材料到加工成商品的生产过程的数据,也有品牌设计、广告营销和销售数量的销售数据,以及产品售后服务、商户反馈等服务数据,这些都是以产品为中心的“条数据”,而百货商场销售的商品种类、数量,男女老少在商场的购物、娱乐情况,天气、公交和停车场对商场经营情况的影响等,这些数据可以称为块数据。这个“块”是指这个商场,商场这个物理空间产生的数据总和就是商场的块数据。而一个数据的变化会带动其他数据发生改变,比如,当商场的影院播放一部聚集人气的影片时,商场的其他产品销量也会上升,这一过程又会衍生出新的数据。这个例子也充分说明了块数据的强活性,即随时随地都在进行数据更新。

因此,块数据的商业价值就在于通过对块数据的挖掘、分析,我们能够实现对事物规律的精准定位,甚至能够发现以往未能发现的新规律。可以毫不夸张地说,在这个时代,得“块”者得天下。

可以说块数据是具有高度关联性的各类数据在特定平台上的持续聚合,块数据实现数据跨行业、跨部门的集聚融合,数据关联性与其价值大小呈正相关的关系。块数据是大数据发展的高级形态,是大数据时代的解决方案。

大数据通过人的思维来观察和解释数据,而块数据则是运用数据的思维去观察和解释人的行为。

块数据的主体是人,通过以人为原点记录静态数据、意识数据、行为数据,推动人类行为和数据的交互影响以及人类自身的进步。与条数据相比,块数据的四个特征更为明显,即数据容量大、数据类型多、处理速度快、商业价值高。有人说,块数据的解决是“数据孤岛”和统一平台标准问题,但其实更多的是以“互联网思维”构建一个面向未来的数据平台,这给创新发展带来新的驱动力,将会推动产业彻底变革和再造。

块数据的一个典型应用是与区块链的融合创新。块数据是建立“绳网结构”的基础,块数据为区块链的应用提供了丰富的数据,而区块链则在块数据背后形成了一个跨企业、跨组织、跨个体的从事经济社会活动的信任体系,二者的结合将为推动经济的变革与社会的进步提供极具颠覆性的解决方案。块数据与区块链的融合创新,是实现协同共享模式的最佳技术手段。

块数据的融合并不仅限于某个特定的区域、场景和部门,而是打破了时空的限制,实现了自然要素和人文因素的融合。当块数据与区块链进一步融合创新,人类将实现又一次跃升,迈向共享社会。块数据在城市中的应用,表现在建成一个生活便捷化、经济绿色化、治理精细化、政务协同化的块数据城市,在一个坚实和立体的数据防护体系下,辖区群众的安全感和幸福指数能够获得更大程度的提升。

在未来的块数据城市里,人类的每一个行踪和行为都会得到效率最大化的配置,整个社会的运转效率将得到极大的提升。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈