关联词:人工智能、替代数据、个人信息保护、信用评估、复杂网络分析、压力测试、物联网
大数据是利用高级分析技术来处理大规模、结构复杂和高频的数据集,以获得高价值信息的工程领域。大数据分析技术所处理的数据集包括结构化、半结构化和非结构化数据,数据规模从万亿字节(TeraByte,TB)到泽字节(ZettaByte,ZB)不等。
随着人工智能、移动互联网、社交网络(Social Network)和物联网等新经济领域的发展,来自各种传感器、事务性应用程序、社交媒体等新数据源的数据规模越来越大,数据形式越来越复杂,并且大部分数据还是实时产生并需要立即计算的。
在这样的形势下,大数据应运而生。大数据是一个用于描述数据集的术语,其大小或类型超出了传统关系型数据库以低延迟捕获、管理和处理数据的能力。
大数据的概念最早于2001年由信息技术研究和分析公司高德纳咨询公司(Gartner)提出。尽管如此,直到2009年,大数据这个概念才逐渐在互联网行业传播开来。知名数据科学家维克托·迈尔-舍恩伯格(Viktor Mayer-Schönberger)总结了大数据的“4V”特征,即高容量(Volume)、高速度(Velocity)、高多样性(Variety)、高价值(Value)。6
大数据分析技术使分析师、研究人员和商业用户可以使用以前无法访问或无法使用的数据做出更快、更好的决策。企业可以使用先进的分析技术,例如文本分析、机器学习、预测分析、数据挖掘、统计和自然语言处理,单独或与其他企业一起从以前未使用的数据源中获取新的信息。
金融领域是大数据分析技术应用的理想场景,大数据分析技术不仅可以用于微观信用风险分析,还可以辅助进行系统性金融风险分析和经济决策。7,8,9
图2.5展示了大数据在金融领域的应用及其市场参考份额。其中,组合投资和资本市场分析、风险模型构建、信贷和信用卡办理、实时安全监测是大数据在金融领域的重要应用。10(www.xing528.com)
图2.5 大数据在金融领域的应用及其市场参考份额
案例 知名互联网金融公司ZestFinance由谷歌和第一资本金融公司(Capital One Financial)的前员工组建。ZestFinance凭借其大规模数据量及大数据分析技术,将贷款放给信贷记录差或无信贷记录的客群。大多数美国的银行依赖费埃哲(FICO)的信用评估,该信用评估基于15~20个变量。然而,ZestFinance则能够监测成千上万个指标,并在250毫秒内得出分析结果。
ZestFinance对消费者的信用评估与费埃哲一样,也是基于两个基本面的信息:消费者的还款能力和消费者的还款意愿。不同之处在于,传统征信依赖于银行信贷数据,而ZestFinance大数据征信的数据不仅包括信贷数据,还包括与消费者还款能力、还款意愿相关的一些描述性风险特征数据。对这些相关描述性风险特征数据的抽取与筛选是ZestFinance的核心技术。不过,这些数据和消费者的信用状况的相关性较弱,ZestFinance凭借强大的技术引擎收集更多的数据维度来加强对这些弱相关数据的描述能力。这使大数据征信不依赖于传统信贷数据,对传统征信无法服务的信贷记录差或无信贷记录的人群进行征信,从而实现对整个消费人群的覆盖。11基于大数据的信用评估思路如图2.6所示。
图2.6 基于大数据的信用评估思路
案例 美国三大征信机构之一益博睿(Experian)开发出跨渠道身份识别(Cross-Channel Identity Resolution,CCIR)引擎,利用大数据技术挖掘消费者购物行为、在线浏览方式、电子邮件回应和社交媒体活动等数据所包含的有效信息,可以满足营销人员应对社交网络、网页浏览等消费者接触点实时更新的需求。例如,跨渠道身份识别可以判断商场中的某一特定消费者与关注该商场在脸书(Facebook)和推特(Twitter)上的营销账号的某一消费者是否为同一个人。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。