大数据(Big Data)一词最早出现在apache org的开源项目NUTCH中,当时科学家用大数据这个术语来描述在更新网络搜索索引的同时进行批量处理或分析的大量数据集。1980年,当代著名思想家阿尔文·托夫勒在其《第三次浪潮》中提出了大数据,并且把其比喻为“第三次浪潮的华彩乐章”,从此“大数据”这个词就走进了人们的视野。1996年大数据被美联社再次提及,但这时的“大数据”还仅代表它的字面含义,即数据量大,并不涉及它的处理技术和类型等方面。此后,大数据的发展开始备受关注,关于如何使用大数据进行经济预测,以及大数据的相关特征和定义也更加明确。人们对于数据的海量挖掘和大量运用,不仅标志着产业生产率的增长和消费者的大量盈余,而且也明确地提示着大数据时代已经到来。因此,大数据正在影响着社会和科技的每个角落层面,成为不可忽视的重大问题。
大数据概念创造于天文学和基因学,“大数据”(Big Data)之所以能够在最近几年成为人们关注的热点,要归功于物联网和云计算技术的出现。EMC公司在“云计算邂逅大数据”大会上(2015)明确提及“big data”在云计算环境下的新发展。同年许多世界著名企业或者研究机构相继表示自己在“big data”领域取得了令人惊喜的进展。计算机领域的各个行业纷纷投入大数据的相关研究,深具实力的IT研究机构不断的阐述自己的研究成果,一次次的刷新人们对“big data”概念的理解。“big data”已经受到Nature和Science等世界顶级科学刊物的重视。Nature曾经于2008年出版专刊,进行了专门探讨“Big Data”相关问题,主要介绍了新的环境下,信息爆炸给各个领域带来了海量的数据,如何依靠互联网技术迎接大数据带来的机遇等问题。随之Science在3年后推出专刊“Dealing with data”,主要对信息飞速增长带来的数据洪流进行分析,指出如果能对纷繁复杂的数据加以利用,人们有可能极大的推动社会的进步。次年欧洲ERCIM News,通过一期专刊“BigData”,深入的对大数据的管理、应用以及欧洲在大数据领域的研究进展进行了讨论,该刊为欧洲信息与数学学会会刊。
关于“大数据”的定义,众说纷纭。例如,麦肯锡全球研究所对大数据概念的解释是:大数据是一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。维基百科的表述是:大数据是难以用现有数据库管理工具处理的兼具海量和复杂性特征的数据集成。国内专家涂子沛将大数据定义为那些大小已经超出传统意义上的尺度,一般的软件工具难以捕捉、存储、管理和分析的数据。
如图所示,究竟什么是大数据,在概念诞生初期,一般比较共识的定义为具有4个V特征的数据可以称之为大数据。大数据初期的4V定义相对狭隘,如果从广义的角度拓展,其实大数据是一种思维范式。维克托?迈尔-舍恩伯格认为,大数据的本质在于分析过程中需要全部数据样本而不是抽样,重点在关注效率而不是精确度,目标上关注相关性而不是因果关系。大数据与以往的信息处理方式有所不同,传统数据处理时代的特点,是对数据进行抽样的、截取式处理和分析,也就是说在传统方法中,更多的从样本的角度考虑问题,“量”的获取相对片面,同时分析数据的手段和能力相对局限,为了保证分析结果的准确性,通常是有意识的收集可量化的、清洁的、比较准确的数据,对数据的质提出了很高的要求。在大数据时代,数据分析和处理从样本角度思考,更多的考虑从总体出发,尽可能的获取所有的数据,对所研究的问题进行完整的数据覆盖,强调数据的量,并不刻意注重数据的质,希望以全面的数据真实的反映所研究对象的全貌,形成对同一个事物多维度、全方位的认识。相对于海量数据对质有着严格的要求而言,大数据通过类似并行算法的分布式技术,利用数据的量来弥补数据在质方面的不足。而到底多大才能算是大数据?这是一个被反复讨论的问题。事实上这个问题的本质并不是量的层面上绝对标准,大数据不等同于数据大,因为量的大小是相对于特定时期的技术处理和分析能力而言的。另外一个大数据的本质特征就是大数据的来源问题。在商业环境中,企业或者一些机构中一直关注的往往是ERP系统和CRM系统中的数据。这些数据有一个共性,就是它们都是一个或者若干个机构有意识、有目的收集到的数据,这些数据质量很高,格式种类相对简单。大数据则不同,互联网技术和可携带设备的广泛应用,大量由人机互动所产生的碎片数据是大数据最主要的来源。这些人们在互联网世界里留下的各种“数据足迹”,并不是有意识地留下的数据,而是机器之间相互处理交互时沉淀下来的数据。从社会学角度来看,当数据不随个人的意愿改变,或者无意识数据能够反映一定规律的时候,无意识程度越大,就越接近真相,这些数据源源不断地在线产生,当人们意识到这些数据可能具备很大的挖掘价值,并且具备进行价值挖掘的方法和技术,能够把格式多样的数据通过某种手段利用起来,创造出商业价值,进而影响到商业模式乃至于人的思维模式,这个时候,大数据才真正的诞生。
(二)信贷经营视角下的大数据思维
大数据包括大数据思维和大数据两个方面。一般来讲,大数据思维具有全局性、颠覆性、概括性等特点。维克托·舍恩伯格、肯尼斯·库克耶在2011年末出版的《大数据时代》一书中认为,大数据思维是一种意识,在这种意识的驱动下,我们的思想发生了转变,不再探求难于捉摸的因果关系,转而关注事物的相关关系。从银行信贷经营角度分析,大数据思维具有独特的特征。随着外部经济环境的改变,商业银行在传统信贷业务中的存贷利差优势日趋缩小,拓展业务格局、完善业务体系、创新业务模式已成为银行打造核心竞争能力的重要要素。而大数据、云计算、智能整合等对接互联网技术优势的发展路径,则是银行谋求变革、创新发展、拓展利润空间、提升经营管理水平的重要抓手。(www.xing528.com)
1.大数据思维的价值论
李国杰院士在《对大数据研究的科学价值》一文中提出,大数据的价值主要体现在它的驱动效应,即巨大的经济利益驱使下企业不断扩大数据处理规模。商业银行树立大数据思维,主要有三方面的价值:第一,以大数据思维拓展信贷客户渠道。商业银行引入大数据思维,可对存量客户进行深度分析、整合,更有助于获取新客户。通过对客户的结构化、半结构化、非结构化信息进行集中分析,可使银行更理解客户的真实需求,进而优化服务体验与营销内容,构筑起交互式双向互动链条,获取更多有效信贷客户。第二,细化信贷经营管理模式。随着金融脱媒趋势加速,互联网与科技对银行业的影响日趋深入,客户面临的产品选择日趋丰富,客户对产品消费与资金管理的需求日趋多元,传统的以存贷利差为利润核心的粗放式经营管理模式已难以适应当下的激烈竞争。商业银行将大数据思维贯穿于覆盖资产端、负债端的全面链条,可助力银行将资产规模化管理转变为资产效率化、增值化、精细化、品牌化管理,剥离低效率资产,强化产品输出,打造核心实力。第三,提升信贷风险管理水平。在现代银行经营管理工作中,客户存量丰富,且客户的信息变化速度很快,其核心业务、财务指标、关联企业、资产质量、未来现金流预期等要素的变迁均存在较强的时效性特征。商业银行应用大数据思维,则可以整合历史情况、平衡当前数据、挖掘未来信息,进而构筑起纵横联动的立体化、多维度风险管理体系,有效管控风险源头,提高信贷风险管理水平。
2.大数据思维的策略论
大数据思维就其本质而言,是一种整合思维、颠覆思维、创新思维和智能思维。在信贷实践中,商业银行运用大数据思维主要包括以下几方面具体的策略:第一,打造“集成式”产品线。商业银行要立足自身在产品设计、资金管理、风险防控等方面的优势,打造集成式产品线,可为客户提供开放、多元、立体的产品与服务,有效整合“信息流”与“资金流”。比如,工商银行推出的“电子供应链”产品、中信银行研发的“上下融通”产品、中国银行的供应链金融等,就是通过整合企业在供应链中的交易信息,动态管理其现金流量,以上下游企业的核心商品为授信着力点,打造贯穿整条供应链的集成式授信产品,实现了价值共享。此外,商业银行还可以对接大数据思维,打造“商圈类”集成式授信产品,即在存量客户中挖掘出某个商业集合体中的核心企业,以其自身所有的产品资源与资金流为主导,对接其周边企业,围绕此客户生态圈,整合海量数据,并利用数据分析结果高效筛选新客户,科学防控风险,打造出轻资产产品线。通过构筑此类集成式产品线,为客户提供产品增值、资产管理、融资保理、综合授信、信息咨询等综合服务,以开放的产品体系有效降低沟通与营销成本,提高授信效率,简化产品审批环节,加快客户资金回流速度,形成集成优势,节约管理资源。第二,全面整合客户信息。商业银行要科学地获取、分析客户,打造交互式沟通模式,进而使客户对银行整体品牌产生认同感、建立忠诚度,才能使产品营销、品牌价值输出、内控与风险管理等其他环节成为有本之木、有源之水。而大数据具有数量大、数据类型多样、时效性强、价值密度低、真实性难保证这五个显著特征,在应用大数据思维整合客户信息、描摹客户蓝图时,要格外注意对数据进行科学收集、筛选、加工、分析、分享,保证数据整合的系统性、专业性、精准性、有效性、时效性、实践性。第三,构筑智能驱动体系。商业银行要将大数据思维应用于银行经营管理的多个环节,使智能分析、数据整合成为银行发展的内在驱动力,可更好地发挥信息化优势。一方面,要纵向联动产品设计、客户营销、风险管控、定价管理等多个内部经营环节,将量化分析思维贯穿于多个环节,做到数据采集、加工、分析、反馈一体化,实现交互管理。另一方面,要横向联动多个职能部门,强化沟通机制,不断对产品模式和客户评级进行动态调整,构筑实时化、智能化业务驱动体系。
【信贷反思录】商业银行如何运用大数据思维指导信贷实践?
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。