(一)互联网大数据征信概述
1.大数据征信的概念
近年来,伴随互联网金融和大数据技术的发展,大数据征信开始兴起。大数据征信是指通过对海量的、多样化的、实时的、有价值的数据进行采集、整理、分析和挖掘,并运用大数据技术重新设计征信评价模型算法,多维度刻画信用主体的“画像”,向信息使用者呈现信用主体的违约率和信用状况。
传统征信在方便个人信贷、辅助金融授信决策、防范信用风险和提升金融获得性等方面发挥着关键作用,但其在互联网金融领域的局限性也不容忽视。一是全国还有超过6亿的人口没有信贷记录,传统征信难以评价其信用状况。二是随着“互联网+”的发展,互联网上产生、沉淀了大量与个人征信相关的数据,为大数据征信的提供了数据基础。与传统征信相比,大数据征信强调数据量大、刻画维度广、信用状况动态交互等特点,可作为征信体系的有益补充。
为加快大数据部署,推进落实“互联网+”国家战略,2015年国务院印发的《促进大数据发展行动纲要》中,提出开放政府数据和推动产业创新,鼓励大数据在征信业的应用和发展。大数据和云计算技术的进步为大数据征信的发展提供了支撑和便利,人工智能算法模型为全面刻画用户违约概率和信用状况提供了有力补充。一方面,借助大数据和云计算技术对互联网上产生的大量与征信相关的数据进行采集、记录、储存和分析成为可能。另一方面,以机器学习为代表的人工智能技术相继被采用,不仅可以分析、归纳和汇总各种渠道获取的结构化和非结构化数据,还可设计多种预测模型(欺诈模型、身份验证模型、还款意愿模型和稳定性模型等),预测信用主体的履约意愿和履约能力,减少违约风险和坏账率。
2.大数据征信特点
从表面上看,大数据征信和传统征信似乎只是数据的获取渠道不同,前者主要来自互联网,后者主要来自传统线下渠道,但是二者存在较大的差异。大数据征信创新主要表现在覆盖人群广泛、信息维度多元、应用场景丰富及信用评估全面四个方面,由此带来征信成本的降低和征信效率的提高。
首先,覆盖人群广泛。传统征信主要覆盖在持牌金融机构有信用记录的人群。大数据征信通过大数据技术捕获传统征信没有覆盖的人群,利用互联网留痕协助信用的判断,满足P2P网络借贷、第三方支付及互联网保险等互联网金融新业态身份识别、反欺诈、信用评估等多方面征信需求。
其次,信息维度多元。在互联网时代,大数据征信的信息数据来源更广泛,种类更多样。大数据征信数据不再局限于金融机构、政府机构以及电信提供的个人基本信息、账单信息、信贷记录、逾期记录等,还引入互联网行为轨迹记录、社交和客户评价等数据。这些数据在一定程度上可以反映信息主体的行为习惯、消费偏好以及社会关系,有利于全面评估信息主体的信用风险。
再次,应用场景丰富。大数据征信将不再单纯地用于经济金融活动,还可将应用场景从经济金融领域扩大到日常化、生活化的方方面面,如租房租车、预订酒店、签证、婚恋、求职就业、保险办理等各种需要信用履约的生活场景,在市场营销支持、反欺诈、贷后风险监测与预警和账款催收等方面具有良好的应用表现。
最后,信用评估全面。大数据征信的信用评估模型不仅关注信用主体历史信息的深度挖掘,更看重信用主体实时、动态、交互的信息,以信用主体行为轨迹的研究为基础,在一定程度上可以精准预测其履约意愿、履约能力和履约稳定性。此外,大数据征信运用大数据技术,在综合传统建模技术的基础上采用机器学习建模技术,从多个评估维度评价信用主体的信用状况。
3.大数据征信的主要问题
大数据征信借助大数据技术能够更全面地了解授信对象,减少信息不对称,增加反欺诈能力,同时更精准地进行风险定价,从数据维度和分析角度提升传统征信水平。但从数据范畴和内涵的效用性、征信机构独立性及隐私保护等方面看,大数据征信仍存在诸多问题,须加以重视。
第一,数据范畴和内涵突破“金融属性”,效用性尚待验证。传统征信的数据主要来源于金融机构和公共部门构成的数据循环,以银行信贷信息为核心,包括社保、公积金、环保、欠税、民事裁决与执行等公共信息,数据相对完整且权威性高。大数据征信采集数据的范畴突破“金融属性”,数据主要来源于电商类平台、社交类平台以及生活服务类平台等,涵盖网上交易数据、社交数据及互联网服务过程中生成的行为数据,这些数据多与借贷行为关系不大,权威性较弱,且各平台的数据完整性各有不同,因而能否作为判断信用主体信用状况的主要指标,尚待市场验证。
第二,数据整合难度大,强相关数据稀缺。互联网企业虽然通过各自产品和服务间接获取了多元化的数据,但很多数据资源均来源于公共事业机构和垄断性国企。类似于移动通信协议用户的缴费记录、公共事业费的缴费记录等公共事业部门的数据,不仅是对互联网征信企业公关
能力的考验,还包括能否利用手中的核心资源换取公共事业部门的数据,实现双赢的效果。而金融交易数据高达80%的比例掌握在国有机构手中,即传统金融机构、运营商以及税务、公安、法院等政府公共部门,包括芝麻信用在内的8家首批试点的民间个人征信机构,都面临着难以获取全面数据的困境。
第三,数据采集和使用未遵循“独立第三方”基本原则。传统征信坚持独立第三方征信原则,征信机构是“市场中立”的——既不与信息提供者或信息使用者有直接的商业竞争关系,也不介入或影响信息提供者或信息使用者在各自细分市场的竞争。而大数据征信突破“独立第三方”的边界,征信机构数据的采集和使用多源于并应用于自身开展的业务,这样征信报告的有效性得不到保障,公信力备受质疑。而且如果信息提供者或信息使用者控制征信机构,也很难约束其不滥用征信数据,或者损害个人征信权益。另外,征信机构无形当中会获取一定的市场影响力,可能扭曲信息提供者和信息使用者的行为,并对收费有操控力。因此,大数据征信的发展应坚持独立第三方征信基本原则,保持“市场中立”。
第四,隐私保护形势日趋严峻。大数据时代,数据挖掘和抓取技术广泛应用,信用主体全方位信息数据得以被全盘收录,海量信息数据的收集给信用主体隐私带来巨大挑战,隐私防护变得更加困难。比如用于特定场合的信息数据被用于其他商业用途,不同机构之间信息数据的交叉验证,隐私侵犯的风险大大增加。此外,存储在云端的大量数据可能会成为黑客攻击的目标,一旦黑客入侵系统,窃取重要的用户信息,造成数据的丢失或损坏,将会给用户带来无法估量的损失。
(二)国内大数据征信的发展
随着近年互联网技术的日益成熟,大数据征信得到了较快发展。在企业征信领域,启信宝是我国企业大数据征信的代表。
启信宝(苏州贝尔塔数据技术有限公司)是一家聚合了多维度、多层次企业信息的征信企业,拥有全量工商数据及全景企业数据,通过互联网技术手段更新及挖掘数据件的相关信息,能够提供全国7500万+企业的工商、司法、知识产权、舆情等信息查询服务,并通过数据分析、处理,为用户降低执业风险、经营风险、投资风险、借贷风险等提供建议。目前,贝尔塔旗下有启信宝微信公众号、启信宝APP、启信宝网页端qixin.com。与传统征信企业相比,启信宝在数据收集、数据处理、产品及服务提供上都有所升级。最新信用数据随时查看,信用报告提供时间缩短,而传统企业征信提供信用报告通常需要4~5个工作日。
在个人征信领域,在首批入围的八家个人征信机构中,都是以大数据征信为主。每家企业都具有各自的优势和劣势,针对的市场也不同,蚂蚁金服的芝麻信用是电子商务平台征信的代表,依托阿里集团电商平台数据,在数据挖掘上可以依托任何旗下的多个领域和产品拓展;腾讯征信则是支付业务征信和社交平台征信的代表,拥有8亿QQ账户、超过5亿的微信账户和超过3亿的支付用户,庞大的用户和数据处理能力,也为其发展征信业务提供了无限可能;前海征信是全牌照金融企业平安集团下属子公司,平安集团旗下陆金所作为P2P网络信贷的领头羊,曾联合多家P2P企业实行黑名单共享机制。
互联网大数据征信企业依托自身独特优势,一方面提供各具特色的征信产品;另一方面通过信用评价体系,提供个性化的增值服务,与互联网平台其他产品进行捆绑营销,最终实现互联网产品与征信产品的叠加销售。
(三)国内大数据征信的主要模式
互联网大数据征信模式以互联网企业为核心,融合多种资源和数据展开征信业务。根据互联网企业的核心业务,可将互联网征信细分为电子商务平台征信、支付业务征信、网络信贷征信、社交平台征信等。
1.电商平台征信模式
电子商务平台模式的大数据征信是以电商平台交易数据为基础的征信采集模式,比较典型的例子是阿里集团旗下的芝麻信用。
芝麻信用,是蚂蚁金服旗下独立的第三方征信机构。芝麻信用基于阿里巴巴的电子商务交易数据和蚂蚁金服的互联网金融数据,并与公安网等公共机构以及合作伙伴建立数据合作,与传统征信数据不同,芝麻信用数据涵盖了信用卡还款、网购、转账、理财、水电煤缴费、租房信息、住址搬迁历史、社交关系等等。芝麻信用通过分析大量的网络交易及行为数据,可对用户进行信用评估,这些信用评估可以帮助互联网金融企业对用户的还款意愿及还款能力做出结论,继而为用户提供快速授信及现金分期服务。(www.xing528.com)
早在21世纪初,阿里巴巴就推行“诚信通”计划,通过身份认证、客户反馈等信用数据形成可视化的信用评分建立了企业会员信用体系。2004年设立第三方支付平台——支付宝,对资金进行监控和管理,解决资金纠纷隐患。阿里巴巴旗下淘宝、天猫也同时获得了卖家的商品交易量、商铺活跃度、用户满意度等数据。阿里小贷依托阿里巴巴集团的电商平台交易数据,积累了庞大的客户群体,也在原有电商数据基础上增加了信贷业务的数据。四年时间,阿里小贷累计投放贷款额超过1700亿元,服务小微企业超过70万家,不良贷款率小于1%,低于银行等传统金融机构的不良贷款率。
2015年,芝麻信用评分系统正式上线,其数据来源包含五个维度——信用历史、行为偏好、履约能力、身份特征、人脉关系。信用历史,是指过往的信用账户还款记录和信用账户历史;行为偏好是指在购物、缴费、转账等活动中的偏好和稳定性;履约能力是指使用各类信用服务并确保及时履约;身份特质是指在使用相关服务中留下丰富和可靠的个人基本信息;人脉关系是指好友的身份特征以及与好友的互动程度。用户在这五大维度的成绩体现在图像上,具有一定警示作用,可根据自身情况调整相关行为,实现不断提升芝麻分的目的。
电商模式的大数据征信,需要征信企业将自身业务的营销与互联网征信相结合,提高电子商务平台业务的用户粘性和使用率;同时,通过提供定制化的征信产品和服务,包括偿债能力预测、收入预测等风险评估产品,扩展征信的应用场景,为社会经济发展服务。目前,芝麻信用已开放五大模块功能,包括出行、住宿、金融、购物和社交,提供免押金租车、免押金入住、借款、分期等服务。
2.支付平台征信模式
第三方支付是介于银行、电子商务企业、互联网企业的关键环节,拥有大量的支付交易记录,特别是贷记卡交易对个人信用水平的评估具有十分重要的意义,支付平台开展征信业务的优势显而易见。
第三方支付公司不同于电子商务企业,它的数据种类较为稳定和单一,主要包括两类:其一,是商户信息,包括订单信息、买方身份信息、送货信息等;其二,交易信息,包括支付方式、支付金额等。因此,支付公司具备了互联网征信的基础数据和资源,与电子商务平台的大数据相比,这些数据资源更具逻辑性和结构化。
考拉征信是第三方支付平台模式的大数据征信代表。考拉征信是由拉卡拉牵头,联合蓝色光标(A股上市公司,全球第六大传播集团,是大数据营销的代表企业)、拓尔思(A股上市公司,中国互联网行为数据挖掘领先公司)、旋极信息(A股上市公司,中国两家营改增服务商之一,拥有全国企业税务数据)、梅泰诺(A股上市公司,三大通信运营商通讯数据,全国企业工商数据)共同出资成立。在第九届金融科技与支付创新2017年度会议上,考拉征信荣获“最具影响力征信服务平台”奖。
考拉征信的数据来源依托大数据和互联网平台,既有拉卡拉十年积累起来的便民、电商、金融及近亿级个人用户和百万线下商户日常经营的相关数据,同时蓝标、拓尔思、梅泰诺和旋极等四家上市公司也同步共享其数据,此外还有公安、法院、航空、通讯、学历、学籍、工商等公共部门及其他行业合作的数据。
考拉的征信产品主要有两类:一是考拉信用分。考位信用分根据个人用户信息进行加工、整理、计算后得出的信用评分,是考拉征信对海量信息数据的综合处理和评估,主要包含了用户信用记录、履约能力、身份属性、社交关系、交易行为五个维度。从形式来看,考拉分与美国的FICO信用评分类似,采用了国际上通行的信用分直观表现信用水平高低,可以应用于各类生活服务商户与金融机构提供信用评估服务,有助于改善用户服务体验。
二是考拉商户分。考拉商户分是中国第一个面向小微商户的信用评分,是考拉征信根据商户信息进行加工、整理、计算后得出的信用评分,商户可以通过登录拉卡拉微信商服平台查询自己的商户信用分,进而直接向拉卡拉小额贷款公司或其他合作伙伴申请信用贷款,无须任何抵押。
作为国内领先的大数据征信机构,考拉征信致力于征信技术和产品创新,助力合作伙伴准确量化信用风险、远离欺诈,提供风控全周期一站式服务,让企业和个人体验信用带来的价值。其率先推出个人、职业、科技金融、商户等全领域征信服务平台,开创出考拉征信APP、信用直贷车、考拉云智风控引擎系统、考拉职信APP等产品,在互联网金融、普惠金融、消费金融等新金融细分领域取得了显著成就,搭建起独具特色的征信服务体系。
3.网络信贷征信模式
我国网贷行业发展中,面临着较大的风险,包括诈骗跑路、提现困难和资金链断裂等。因此,做好风险控制是国内网贷平台稳定发展的关键环节。建立基于大数据的网络信贷征信平台,将有利于解决类似问题的出现。在央行批准准备设立个人征信机构中,前海征信就是网络信贷平台模式的征信代表。
前海征信中心股份有限公司是世界500强企业——中国平安保险(集团)股份有限公司旗下全资子公司,于2013年8月在深圳前海深港合作区注册成立,公司股东为深圳平安金融科技咨询有限公司和深圳市平安置业投资有限公司。2015年1月5日首批获得人民银行批准开始个人征信业务试点工作。
前海征信植根于平安集团,积极探索多样化和创新性的数据采集、存储、处理与分析方式,拥有大数据时代要求的海量线下和线上数据,前海征信已自主研发并成功推出覆盖贷前、贷中、贷后全流程的10大征信产品,并自建了拥有5000核超强计算能力的国内金融业界的大数据“最强大脑”,其数据多为金融类数据,质量高。
前海征信已建立起全面的产品体系,包括反欺诈、信用风险、数据开放平台和综合报告四大类,先后推出 30余款产品,向市场提供大数据征信产品和服务。前海征信的安全云系统,包括信审云、催收云和反欺诈云,是根据平安集团多年积累的风控经验,设计出针对‘贷中、贷后’的云系统,主要针对P2P和小贷公司。针对互联网金融领域大量爆发的欺诈问题,前海征信推出了一系列反欺诈产品。其代表性产品好信盔甲,是一款基于大数据的反欺诈系统产品,由前端埋点,后端规则引擎+管理系统,以及前海征信大数据组成,可以为机构用户提供一整套的反欺诈解决方案。目前,已有陆金所、宜信、拍拍贷、好贷网、分期乐、鹏金所、搜易贷等互联网信贷平台与前海征信开展了合作。
除前海征信外,针对网贷平台的征信服务还有NFCS和安融惠众。2013年6月,上海资信开发并上线了网络金融征信系统(NFCS),与三十余家P2P网贷企业建立了合作关系,收集P2P网贷平台的贷款申请、发放、偿还等信用交易信息,为P2P网贷行业提供全国性的电子信息服务。截至2014年7月25日,NFCS共接入P2P平台203家,日均查询量达到2000次。这是我国互联网征信行业在企业征信业务上的一次成功的尝试。
北京安融惠众征信有限公司创建的“小额信贷行业信用信息共享服务平台”(MSP)于2013年3月上线。截至2014年9月15日,MSP征信平台接入机构达到405家,接入机构涉及的共享信用信息查询量达到日均9 000余次,具有有效信用交易信息的自然人信息主体人数达100余万人。
4.社交平台征信模式
社交平台积累了大量用户的场景信息记录,包括用户的基本信息、朋友圈、兴趣爱好、生活与工作区域、交通信息等,特别是目前一些规模较大的社交软件还建立了支付平台,各种线上线下丰富的支付场景记录,为建立大数据征信提供了海量数据资源。社交平台征信模式的主要代表是腾讯征信。
腾讯征信是首批经人民银行批准开展征信业务的机构之一,专注于身份识别、反欺诈、信用评估服务,帮助企业控制风险、远离欺诈、挖掘客户,切实推动普惠金融。早在2012年就曾上线了“腾讯信用”网站,2015年还获得了央行发出的征信牌照,但之后一直不见动静。据悉,是由于马化腾以“保护用户隐私”为由叫停了产品开发。直到2016年,马化腾在“云+未来”峰会上表示,为保障合作伙伴的权益,腾讯会将每一个用户的信用长期记录下来,之后腾讯信用开始加速发展,2017年8月开始公测,2个月后就正在上线了。
腾讯凭借QQ、微信、财付通、QQ空间、腾讯网、QQ邮箱、微博等多种服务聚集了海量的个人用户,截至2017年9月底,单是微信及Wechat的用户数就达9.8亿,腾讯开展个人征信业务无疑具有极大的优势。这些用户大部分在人民银行个人信用信息基础数据库中无记录或者记录很少,但是用户在腾讯体系留下大量有价值的信息,凭借在人群覆盖、用户活跃及产品特点上的显著优势,依托社交、支付、金融、社会等多维度数据综合评估,通过海量数据挖掘和分析技术来预测其风险表现和信用价值,为其建立个人信用评分,并能通过实时监控,更为有效的判断出用户的还款意愿和违约概率。
腾讯信用评分及报告来自腾讯社交大数据优势,全面覆盖腾讯生态圈8亿活跃用户,通过先进大数据分析技术,准确量化信用风险,有效提供预测准确、性能稳定的信用评分体系及评估报告。对于个人用户不但可以查询个人信用报告,还可以提高和完善自身信用情况,形成良性循环;对于银行等商业机构,该信用评分体系可以与自有体系形成交叉比对,帮助机构更准确地对用户个人信用做出判别,挖掘更多价值用户。通过多家金融机构实用验证证明,腾讯信用评分体系预测效果适用于银行,且评分性能稳定。
除了信用评分外,腾讯征信的产品还有人脸识别技术、反欺诈核查产品等,主要服务对象是银行/P2P/小贷公司/保险等机构。能帮助企业识别用户身份,发现恶意或者疑似欺诈客户,避免资金损失。
(四)构建中国特色大数据征信体系
央行下发《关于做好个人征信业务准备工作的通知》,腾讯征信(微信)、芝麻信用(支付宝)、前海征信(平安)等八家单位参与了央行组织的个人征信试点。通过试点,国内个人大数据征信领域取得了较大进展,初步建立了电商平台、社交平台、支付结算、网络借贷等领域的个人征信数据库,但不同领域的数据仍未能有效共享,“数据孤岛”问题较为突出,征信机构之间的数据存在隔阂。
2017年末,中国互联网金融协会发起设立“信联”个人信用信息平台,由互金协会与首批8家试点机构共同出资10亿元注册成立“百行征信”。“信联”的组建参与机构具有非常丰富、稳定并可持续获得数据的入口,通过这些丰富的数据,可以对用户进行精准的定位。百行征信主要在银、证、保等传统金融机构以外的网络借贷等领域开展个人征信活动,与人民银行征信中心运维的国家金融信用信息基础数据库形成错位发展、功能互补的市场格局。组建百行征信有利于共享个人征信信息,化解信息孤岛的困局,缓解个人征信产品有效供给不足的问题;有利于防范系统性金融风险,有效遏制“过度多头借贷”“诈骗借贷”等乱象,促进互联网金融行业的健康有序发展;有利于贯彻个人信息隐私权益保护原则,防止个人信息被过度采集、不当加工和非法使用。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。