大数据是近年来才兴起的一个新学科,作为它的一个分支,大数据治理更是一个崭新的研究领域。经过广泛的文献调研,目前该领域的研究成果很少。对于“大数据治理”这一概念的定义,也基本都是在“数据治理”现有定义的基础上,将“数据”替换为“大数据”,稍作改变得来。这样的定义显然是不严谨、不完整和不准确的,没有揭示出“大数据治理”的完整内涵和本质特征。
目前业界比较权威的“大数据治理”定义是由国际著名的数据治理领域专家Sunil Soares(桑尼尔·索雷斯)在2012年10月出版的专著Big Data Governance:An Emerging Imperative中提出的。
1)Sunil Soares给出的大数据治理定义[27]
大数据治理(big data governance)是广义信息治理计划的一部分,它通过协调多个职能部门的目标来制定与大数据优化、隐私和货币化相关的策略[28]。
该定义可以从六个方面做进一步的解读:
(1)大数据治理应该被纳入现有的信息治理框架内;
(2)大数据治理的工作就是制定策略;
(3)大数据必须被优化;
(4)大数据的隐私保护很重要;
(6)大数据治理必须协调好多个职能部门的目标和利益。
该定义提出了大数据治理的重点关注领域,即大数据的优化和隐私保护,以及服务所创造的商业价值;明确了大数据治理的工作内容就是协调多个职能部门制定策略;同时希望国际信息治理组织将其纳入现有的信息治理框架内,促进它的标准化进程。
Sunil Soares给出的定义非常清晰和简洁,抓住了大数据治理的主要特征,但也有一些不足,主要体现在以下两点:一是认为大数据治理的方法就是制定策略,这一提法显然不够全面;二是没有将大数据治理提升到体系框架的高度。因此,本书在Sunil Soares定义的基础上,给出了更为全面的定义。
2)本书给出的大数据治理定义
大数据治理是对组织的大数据管理和利用进行评估、指导和监督的体系框架。它通过制定战略方针、建立组织结构、明确职责分工等,实现大数据的风险可控、安全合规、绩效提升和价值创造,并提供不断创新的大数据服务。(www.xing528.com)
为了方便理解,从以下四个方面来解释大数据治理的概念内涵。
(1)需要在哪些领域做出大数据治理的决策?
我们提出的大数据治理框架描述了大数据治理的关键域,即治理决策层应该在哪些关键领域(范围)内做出决策,共包含六个关键域:战略、组织、大数据架构、大数据质量、大数据安全、大数据生命周期,这些就是大数据治理的主要决策领域。
(2)哪些角色的人应该参与到决策过程中?
根据国际数据治理研究所(Data Governance Institute,DGI)提出的数据治理框架,在企业或机构中参与决策的人,即数据治理团队,通常可分为三类:一是数据利益相关者,二是数据治理委员会,三是数据管理者。
数据利益相关者通常来自具体的业务部门,负责创建和使用数据,并提出数据的业务规则和需求。数据治理委员会是数据治理的中心决策层,负责制定数据使用原则、监督实施、协调各部门的不同利益和需求,解决问题并做出最终决策。数据管理者是数据治理的执行层,负责将决策和规定落实到具体的数据管理工作中。
显然,在大数据治理团队中上述三种角色应该被继承。但是,大数据与普通数据有着本质不同,如数据量超大、类型多样、系统架构复杂、技术难度高等,如果不了解大数据架构和相关技术,就很难做出正确的决策并加以落实。因此,必须引入具有丰富大数据管理与技术经验的数据专家来参与决策。
因此,参与到大数据治理决策过程的人应该分为4类:一是大数据利益相关者,二是大数据治理委员会,三是大数据管理者,四是数据专家,并且数据专家应该加入到治理委员会中辅助做出决策。
(3)这些角色的人如何参与到决策过程中?
对一个企业而言,大数据治理是一个需要长期坚持并反复迭代优化的系统工程。治理要想见效并最终获得成功,必须保证治理决策的正确性和连续性,并被坚决贯彻和落实,必须依靠集体的智慧和力量,依靠制度、规范和组织的力量,从而最大限度地消除个人意志对决策的左右和影响。
因此,必须建立一套包括战略方针、制度规范、组织结构、职责分工、标准体系、执行流程等方面的大数据治理决策保障体系,确保治理团队中各种角色的人能够顺利、高效地参与到决策过程中。
(4)大数据治理的最终目标是什么?
首先要问大数据的最大价值在哪里?人们为什么要花那么多的人力物力来研究大数据?回答是大数据能够为人类提供以“决策和预测支持”为代表的各种不断创新的大数据服务。
在一个组织内,大数据治理能够在提升大数据各项技术指标的同时,产生一系列创新的大数据服务,并创造出商业和社会价值。这既是大数据治理与数据治理的根本区别,也是大数据治理的最终目标。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。