数据挖掘技术最先起源于美国,在信息技术发达的先进国家中,保险业都已建立了较为完善的保险数据库系统,因此,从数据积累、技术推动与需求拉动三个方面,都推动了保险数据挖掘技术的研究和应用在美欧各先进国家的快速发展,国际上对保险数据挖掘的研究主要集中在两大领域,即保险行业进行数据挖掘的可能性和保险行业数据挖掘技术的实际应用。
Kietz、Reimer和Staudt基于瑞士人寿(Swiss Life)的数据,通过OLAP技术,建立了数据仓库,应用机器学习的方法,实证研究了数据挖掘的有效性和知识发现能功,并得出结论——数据挖掘是改进商业运营流程的有效方法。Staudt认为数据同质化处理和信息抽取是对数据挖掘应用起关键作用的两大因素,并对此分别进行了论述。他指出,保险行业由于积累了大量的客户数据、产品数据以及理赔的数据,在保险行业应用数据挖掘技术,不但可能而且必要。Staudt还基于数据表达理论与机器学习理论实证研究了如何从关系数据库中抽取信息。Inna Kolyshkina和Richard Brookes(2002)演示了如何用数据挖掘技术进行保险风险建模,并实证研究了员工养老金申请风险模型、健康保险医院费用预测模型。Apte和Grossman等将数据挖掘技术集成到承保利润的分析模型中去,他们分别应用财产保险公司和人寿保险公司的数据,实证研究并证明了基于数据挖掘的风险预测模型可以满足保险企业的风险管理要求,为保险风险的概率预测提供了一种可靠的方法。Yeo、Smith、Willis和Brooks(2002)基于数据挖掘技术,通过对客户风险进行分类,用神经网络技术对价格的敏感性进行了测试,并采用 K-Means 方法对各组索赔金额进行预测,采用编程方法对保险年金定价进行了优化,以平衡利润与市场份额之间的关系。Viveros、John Nearhos和Rothman应用数据挖掘的神经网络技术与关联规则,抽取了健康保险信息系统中的治疗项目分类模式和理赔客户分类模式,发现了采用传统的统计分析方法无法发现的理赔客户规则与模式。Vincent Cho和Ngai(2003)基于数据仓库技术和数据挖掘技术提出如何建立保险代理人甄选模型,通过对香港保险市场代理人的流动进行分析,提出了基于神经网络技术、决策树技术和判别分析技术的数据挖掘模型,采用服务年限、销售佣金、代理机构运营年限三个指标,对代理人的类型进行了区分,为保险企业选择代理人提供了参考。
相比国际上其他发达国家保险行业数据挖掘的丰硕研究成果,国内数据挖掘研究则显得严重滞后,但是国际上许多成熟的数据挖掘技术为国内保险数据挖掘研究提供了有益指导,国内关于保险行业数据挖掘的研究文献主要集中在两个方面,分别是保险数据挖掘可行性与应用研究和保险数据挖掘基本流程与软件开发研究。(www.xing528.com)
第一方面是国内保险数据挖掘可行性与应用研究,宋向平(2003)指出了现阶段保险公司构建数据仓库存在系统可用性不高、系统灵活性不够和系统的不稳定性等问题,并提出保险公司构建数据仓库的思路应从应用需求和模型建立两个角度入手,才能使数据挖掘的结果更具针对性与成效性;张劲松(2004)介绍了数据挖掘的特点,指出了数据挖掘技术与传统统计分析方法、数据仓库技术和在线分析处理技术(OLAP)的联系与区别,认为保险信息化为保险公司应用数据挖掘技术奠定了基础,数据挖掘工具应作为管理手段引入保险行业;朱曦(2005)研究了数据挖掘在非寿险定价方面应用的意义和可行性,为非寿险费率的厘定提供了数据挖掘的思路。
第二方面是国内保险数据挖掘基本流程与软件开发研究,谢友辉和蒋新华(2003)概述了数据挖掘系统的基本框架,提出了数据挖掘的基本流程为数据准备、数据挖掘、模型表述和评价三个阶段,数据准备阶段又可细分为数据集成、数据选择和预分析三个步骤;毕建欣(2004)认为数据挖掘流程可分为数据准备、挖掘知识信息、模式的解释与评价三个阶段,数据准备阶段又可细分为数据集成、数据选择和数据压缩与转换等三个步骤,挖掘知识信息阶段又可细分为确定挖掘任务的类型、选择合适的挖掘技术、选择算法和挖掘数据等四个步骤;陈永强和胡雷芳(2004)认为数据挖掘技术在人寿保险客户关系管理系统中应用的基本流程为确定挖掘主题、建立挖掘数据库、分析数据、准备数据、建立模型、评价模型、实施和评价结果七个阶段;唐淑君和张红鹰(2006)认为利用数据仓库进行数据挖掘的基本流程为概括分析、数据抽取、建模分析和分类处理四个阶段;毕建欣(2006)针对团体医疗保险客户的理赔风险,提出数据挖掘的流程为目标定义、创造目标数据集、数据预处理、数据转换、模型的建立与评估,以及模型的解释与应用五个阶段,其中数据转换阶段又可细分为数据规范化、数据类型变换、属性与实例选择三个步骤;宾宁(2007)基于某保险公司部分医疗保险业务的数据,利用SPRINT算法减少了决策树算法运行时所需的数据结构,采用Jbuilder 9开发工具,使用weka开发平台实现了SPRINT算法的数据挖掘功能,并验证了该算法能够快速细分客户的风险程度;王伟辉和陈莉(2008)基于数据挖掘方法论CRISP-DM,改进并提出数据挖掘的基本过程为理解业务与确定主题、理解并准备数据挖掘、数据挖掘算法的设计、执行算法生成知识四个阶段。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。