首页 理论教育 大数据对保险公司的挑战与应对

大数据对保险公司的挑战与应对

时间:2026-01-24 理论教育 卡哇伊 版权反馈
【摘要】:大数据给保险公司提供了很多新的机遇,充分利用大数据能够为保险公司带来巨大的商业利益。保险行业对大数据商业价值应用的敏感程度还不高,大多数保险公司并没有将大数据列为公司的基础能力进行建设,因此保险公司也面临许多挑战。对可购买的大数据,以什么价格来购买也是保险公司面临的一大难题。大数据只是一些资源,要对数据进行清洗、分析、建模、可视化之后才能帮助保险公司分析事务,提供信息。

大数据给保险公司提供了很多新的机遇,充分利用大数据能够为保险公司带来巨大的商业利益。然而我们更应该看到,保险业大数据战略规划才刚刚起步,相对于银行、证券公司等其他金融机构,保险公司在电子化、数据化、移动化、平台化方面的建设上还处于相对落后的状态。保险行业对大数据商业价值应用的敏感程度还不高,大多数保险公司并没有将大数据列为公司的基础能力进行建设,因此保险公司也面临许多挑战。

1.如何获取和存储大数据

获取大数据可以从内部、外部两方面着手。保险公司整理和累积自身以往数据是获取大数据的方法之一。保险公司自身的数据主要包括保单数据及保单维持数据、核赔理赔数据、投资理财数据、定价数据、风险管理数据、再保险公司数据。经营数据以及客户基于险种的相关数据保险公司能够从自身获取。然而目前大部分保险公司自身内部的数据还没有完成整合,数据还处于信息孤岛状态。由于对内部数据价值认识不完整,大部分内部数据的价值并没有被充分挖掘,大数据价值变现缺少应用场景。保险行业内部也没有形成完善的数据共享机制。从行业发展来看,保险公司亟须建立起反欺诈信息、车险信息、健康险信息、中介信息、养老保险信息等各种业务数据共享平台。2013 年成立的中国保险信息技术管理有限责任公司,旨在了解保险行业信息交互共享需求,建设和运营集中统一、设计科学、功能完善、安全高效的保险业数据信息共享和对外交互平台。目前已经建成和正在规划建设机动车辆保险、农业保险、健康保险、保险中介平台和保单登记等平台,其中车险平台基本实现了全国范围内机动车辆保险数据信息的汇集利用和交互共享,可在车险保费定价、车船税联网征收、代位求偿、反欺诈等方面发挥作用。但是从数据共享规模和共享量来看都还比较小,大部分数据共享只限于同一业务系统间的数据交换使用,系统之间提供的基础数据种类和数量都非常少。况且各保险公司在收集数据的同时,往往会保护自己的数据,也限制了数据的共享。另一方面,由于现阶段保险行业数据标准体系才刚形成,数据标准化程度较低,即使将数据拿出来共享,也存在标准不一致的问题。比如对某个客户是否存在欺诈可能性的判定,如果选择的标准不一致,有可能得出不同的结论。

另外,对客户其他的个人信息,例如客户的兴趣爱好、教育需求、理财需求和位置轨迹等,以及对未参保客户的有关数据,保险公司无法从内部获取,因而从外部获取数据是一条重要的途径。在现阶段,可以从开放平台免费获得的数据还存在很多技术或是法律上的限制。根据对上海、北京、无锡等地开放数据平台的调查显示,各地的开放数总量和可机读数据量相去甚远。截至2016 年1 月,上海的开放数据总量达705 个、可机读数据量达691 个,均列全国第一,而很多城市虽然开放数据总量较高,但可机读数据量却只占很小比例。而在数据更新方面,这些平台平均只有13.25%的数据被标注为动态数据,实际更新频率甚至更低。2015 年,这些被标明为动态的13.25%的数据中真正按承诺实现更新的比例仅为17.2%,所以实际上真正的动态数据只有2%。而且开放数据的协议并没有对免费予以明确的保证,有的平台只说现阶段免费,以后是否免费还未可知。

对可购买的大数据,以什么价格来购买也是保险公司面临的一大难题。影响数据价格的因素有很多,如数据品种、时间跨度、数据深度、数据完整性、数据样本及数据实时性等,不同品种的数据的定价原则是不一样的。保险公司需要了解如何以合理的价位购入数据。而且不管是免费获取还是通过交易购买,保险公司都不能保证能获取最全面的数据,例如国家机密、他人知识产权、商业秘密、个人信息等数据,国家会禁止流通和交易。

另一大难题是,储存大数据也需要成本。随着大数据时代的到来,储存数据的硬盘容量没有随着数据的爆炸性增长而增长,我们面临着数据存储的难题,不仅如此,传统的数据存储方式也越来越不能满足依赖大数据分析的企业的需要。要达到低成本、低消耗、高可靠性的目标,需要用到冗余分配、分布化和云计算技术,并且在储存时需要按照一定规则对数据进行去重、归类以减少存储量。寻找新的存储硬盘以及研发新的存储方式无疑会增加大数据使用的成本。只有充分有效利用大数据,让大数据产生的价值高于成本才是有利可图的。

2.如何保证大数据的质量

随着数据量的大幅增加,一些错误的数据可能会混进数据库中,不同来源的数据混杂在一起,也会加大数据混乱的程度。大数据只是一些资源,要对数据进行清洗、分析、建模、可视化之后才能帮助保险公司分析事务,提供信息。传统的方法难以对多源异构、多实体、多空间的交互动态性数据进行描述与度量,对这些复杂的数据需要采用新的技术将数据进行降维处理,综合分析后才能得出可用信息。数据的质量影响着数据的利用,尽管有很多提升数据质量的措施可以提高数据的准确性、完整性、一致性和减少冗余,但是数据质量问题是不可能完全根除的。如果个人对隐私保护意识提高,可能会在社交平台上减少个人信息的透露或提供一些虚假的信息,这就可能会使搜寻到的数据失真。

假设一个高风险客户想要投保,他也知道保险公司对自己的情况越清楚,可能收取的保费就越高,因此他可能会刻意制造出一些有利于自己的数据。比如保险公司通过可穿戴设备采集数据,那么他就有可能将记名于自己头上的设备转让给其他人使用。保险公司不可能对客户的日常生活实时监控,数据的失真在所难免。即使保险公司通过第三方来获取数据也不一定能保证数据的完全真实。数据的提供者同样可能因为各种原因提供不全面或者虚假信息。

3.大数据预测可能会出现偏差

即使能够获取较高质量的数据,要从这些数据中找出有价值的信息也并非易事。社会科学领域的统计模型依赖于“相关性”,虽然“相关性”可以帮助我们预测下一次行为的可能性,但它却并非下一次行为的真实原因。如果把“相关性”等同于“因果关系”就可能出现错误的判断。

谷歌在2008 年成功预测到了流感的爆发,然而2011 年到2013 年连续3 年谷歌一直高估与流感相关的就医量,特别是在流感季节的高峰期这个预测尤其不准确。在2012—2013年的流感季节,它预测的就医量是美国疾控中心最终记录结果的两倍。在2011—2012 年流感季节,它高估了超过50%的就医量。谷歌预测失灵可能是因为其只注重研究数据之间的相关性,而忽视了数据之间的因果关系。流感关键字的搜索频率同流感爆发之间可能存在相关性,但未必是因果关系。与流感相关的搜索可能基于一部热映的电影或是因流感去世的名人,而与真正的流感爆发并没有因果关系。而如果预测到有流感爆发的迹象,媒体、群众都可能会更加关注流感预防常识,因此增加的搜索量会导致对流感预测的高估。但谷歌流感趋势系统在预测小面积的区域时仍然是有效的,可以帮助个别城市和国家做准备。

只关注数据间的相关关系,而忽视因果关系,在统计学上被称为“数据挖掘误区”,这是早已被批驳过的错误做法。大数据不是万能的,盲目相信大数据的指向而得出结论是不可取的。和任何统计模型一样,用大数据建立模型同样需要合理假设和分析推理。

另外,大数据的预测也有可能会因为人们之后的行为选择而出现偏离。如我们利用百度地图规划路线时,为了避免进入拥堵路段而选择走另外一条道路,当很多人都做出同样的选择时,原本拥堵的路段可能不堵了,而原本不堵的路段反而堵上了。虽然路况可以实时更新,但是已经进入拥堵路段的人却无能为力了。又如健康大数据预测某人患某病的概率小,保险公司予以承保,承保后该人觉得自己身体很棒,因此放任自己,对健康疏于管理,反而可能增加患病的可能性。

4.如何安全、合法地利用大数据

虽然大数据发展迅速,但兴起的时间并不长,在大数据的采集、存储、开发、应用、交易等方面存在不少问题,相关的法律规范也很缺乏。直到2016 年1 月15 日,贵州省通过了《贵州省大数据发展应用促进条例》才填补了我国大数据立法的空白。保险公司在运用大数据的同时应考虑如何减少因规定不明引起的纠纷。随着大数据相关的法律法规以及政策的逐步完善,还需要及时了解相关规定,合法地利用大数据。(https://www.xing528.com)

目前有关大数据的政策法规面临的一大关键问题就是安全与隐私。过去个人的身份信息构成比较简单,主要包括姓名、身份证号码、税收记录等,要保护个人隐私只要保护好这些信息就可以了。而现在,只要采集到足够数量的数据,即使看起来是一些无关紧要的数据,也能汇集起来寻找到有效的个人信息。央视曾经报道过一些售卖个人隐私的非法组织只需要一个电话号码就可以查询到该电话号码登记人大量的信息,如车牌号码、房产、住宿信息和通话记录等。大数据打开了侵犯个人隐私的方便之门,如果不对大数据的获取、使用采取措施加以约束,个人的隐私将不复存在。如今各国都在保护隐私方面做出了努力。美国对用户信息泄露造成的损失有明确规定,因此通常企业不会将用户的银行卡等信息存储在自己的服务器上,以避免难以承受的高额索赔诉讼。欧盟法院支持公民可以要求互联网公司删除个人留在网上的信息。加拿大卫生部立法禁止本国电子病历数据在美国境内处理。俄罗斯规定所有收集俄罗斯公民信息的互联网公司,包括苹果、谷歌这样的互联网巨头,都必须将这些数据存储在俄罗斯境内的服务器上。保险公司在使用数据时不只要保证合法采集而且不能泄露个人隐私。如果企业或个人的隐私通过保险公司这个渠道被泄露出去,会给保险公司带来声誉风险,降低民众对保险公司的信任。因此,如何安全交易大数据,如何防止网络攻击,提升大数据的安全技术水平成了保险公司面临的又一项挑战。

5.相关人才缺乏

在经营中,保险公司可能会和各种各样的行业打交道,会运用到金融、会计、精算、法律、医学、工程、化工、互联网等方面的专业知识。要想利用大数据为保险经营服务,必须要有懂得大数据技术的专业人才;而既懂得保险专业又懂得大数据技术的复合型人才更是难得。现在保险公司的各个部门是既独立运作又相互协调的,每个部门有自己的专业分工。将来,信息技术和数据应用渗透到公司各个部门时,要求有一批能够将保险经营理念和大数据思想及技术结合起来运用的人才。就如计算机的兴起,逐渐替代了原有的手工作业,保险公司员工都通过计算机来处理日常事务,计算机操作成为公司员工必备的基本技能。

具体来说,大数据时代下保险公司需要的人才包括这几类:①具有大数据思维的管理型人才。管理型人才能够把握全局并且具有前瞻性眼光,能了解行业的基本技术框架,有较强的沟通协调能力,促使团队达成共识。只有当一个保险公司的领导者具备了大数据思维,才可能重视大数据带来的变革,从战略的高度将大数据转化为生产力。②大数据分析人才。要从大量的数据中找到保险公司所需要的有用信息并不是一件容易的事,特别是在数据量不仅庞大,而且形式也多样化的情况下。保险公司需要专业的数据分析人员熟练地运用数据分析工具进行分析,同时还需要具备保险的专业基础才能从保险的角度审视哪些是有用的信息。③具有创新思维的保险产品研发人员。风险总是在不断变化的,随着大数据时代的到来,一些人们习以为常的生活方式会发生改变,因而会催生一些新的风险。还有一些以往存在的,但由于保险技术的限制而不能承保的风险,随着大数据技术的发展变得可保。这些都需要具有敏锐的观察力和洞察力的保险产品研发人员发现风险,创新保险产品,将大数据的成果转化为保险公司的利润。④互联网销售人才。在保险经营中,目前大数据运用最多的领域就是保险营销。与传统的销售方式不同,大数据的发展带来了营销方式的改变,以客户关系管理为中心,精准营销、互联网营销正取得越来越多的成绩。具有大数据和互联网思维的销售人才也将成为未来保险公司最需要的人才。

复合型人才的获取可以通过对内部员工进行培训或从外部引入人才这两种途径。不管哪种方式,都面临着大数据人才培养困难的问题,毕竟大数据兴起的时间尚短,技术上还存在很大发展空间,一些国内的保险公司已经开始探索建设大数据团队。根据2015 年的一项调查表明,国内拥有大数据团队的保险公司只有37 家,这意味着近八成的保险公司并没有专门的大数据团队。在复合型人才匮乏的情况下,多数保险公司在建立大数据团队的时候采取的方法是对具有交叉学科知识及经历背景的人员进行组合,将业务人员、IT 部门人员、精算部门人员等组成团队,通过交流讨论、取长补短,达到相互促进的目的。根据现有保险公司大数据团队人员构成情况来看,占比最多的是计算机专业学科的人员,占到29%,其次是数学与统计学学科,合计占比31%,而经济及管理学类的仅占12%。

6.主动权掌握在信息量更大的一方

大数据可以帮助保险公司识别客户风险的高低,反过来,如果客户掌握了大数据则可能会做出对自己有利的选择。也就是说即使有大数据预测,保险公司也可能会遭遇逆向选择。随着健康管理技术的不断进步,未来人们对自身的健康状况会比现在更加了解,可以根据可穿戴的各种监测设备对身体各项指标进行评估并整理成可分析的大数据。利用这些数据可以推算出自身患病的概率,将这些概率与平均水平进行对比,如果低于平均水平,就选择风险自留;如果高于平均水平,就选择投保,将风险转移给保险公司。当大部分投保人的出险概率都超过保险公司计算保费所用概率时,保险公司必然是亏损的。

类似的情况还可能出现在农业保险领域。2012 年8 月30 日《纽约时报》报道了一家叫气候公司的创新公司。这家公司计划购买亚马逊提供的气象云服务,在美国全境采集100万个地点的实时气象数据,为客户提供临时、短期和中期的气象预报服务,并可结合客户所在地的土壤、水质等情况,为客户提供气候风险报告。客户根据报告,可以选择是否在保险公司投保农业气候保险。当客户对未来气候有足够的预测之后,就掌握了购买保险的主动选择权。对于一些洪涝、旱灾等常规性农业保险险种,客户要么不投保,一旦投保通常都是高风险业务。同样的,中国气象局公共气象服务中心也致力于气象数据的建立与预测,2014年5 月27 日,该中心与阿里云达成合作,其海量气象数据将通过阿里云计算平台,变成可实时分析应用的“活数据”。阿里云计划将气象数据嵌入阿里来往、支付宝、高德地图等产品,多渠道传播气象等灾害预警信息,同时为服装、饮料、空调、旅游等领域客户提供季节性生产、经营建议。

几十年后,人人都成为自身健康的精算师,生产者们都能够对常规风险做出较为准确的预判,保险公司可能面临着越来越高风险的积聚。

【注释】

[1]1 EB =1 024 PB,1 ZB =1 024 EB。

[2]1 亩≈667 平方米。

[3]参见:娄岩.大数据技术概论[M].北京:清华大学出版社,2017 年版,第21 页。

[4]参见:保险区块链项目组.保险区块链研究[M].北京:中国金融出版社,2017 年版,第3 页.

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈