首页 理论教育 金融科技知识图谱:机器学习、ML

金融科技知识图谱:机器学习、ML

时间:2023-08-04 理论教育 版权反馈
【摘要】:机器学习是人工智能的核心子集。机器学习流程如图2.2所示。图2.2机器学习流程机器学习与计算统计学紧密相关,其基于训练数据建立数学模型,以便进行预测或决策,而无须明确编程以执行任务。在实际应用中,机器学习与数据挖掘通常采用相同的方法,有很多重叠之处。4此外,机器学习的前沿研究和应用还包括集成学习和联邦学习。

金融科技知识图谱:机器学习、ML

关联词信用评分、欺诈检测、量化投资、反洗钱、监管科技

机器学习是专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能的计算机应用领域。机器学习是人工智能的核心子集。

机器学习是人工智能的热点研究方向。在图像识别、语音识别、自然语言处理、天气预测、基因表达、内容推荐等方面都有重要应用。机器学习的核心思想是通过输入海量训练数据(也称样本数据)对模型进行训练,使模型掌握数据所蕴含的潜在规律,进而对新输入的数据进行准确的分类或预测。这与人的学习过程类似,人通过分析以往的经验,获得新的方法,从而对未来的新问题进行预测。机器学习流程如图2.2所示。

图2.2 机器学习流程

机器学习与计算统计学(Computational Statistics)紧密相关,其基于训练数据建立数学模型,以便进行预测或决策,而无须明确编程以执行任务。

数据挖掘(Data Mining,DM)是机器学习中的一个研究领域,专注于通过无监督学习进行探索性数据分析。在实际应用中,机器学习与数据挖掘通常采用相同的方法,有很多重叠之处。两者的区别在于,机器学习侧重于预测,从训练数据中获知已知知识的属性,而数据挖掘则侧重于从大规模数据中发现新知识。

机器学习在金融领域的应用是近年来的热点领域,包括市场营销获客、信用风险评估、反欺诈、金融数据质量检测、量化投资和监管科技应用等。(www.xing528.com)

案例 ZestFinance信用评估模型 美国金融科技公司ZestFinance采集与信贷相关的70000个信号,如图2.3所示,在10个分散的模型上运行,每一个模型都需要成百上千个变量,都有不同的预测功能。这10个模型以如下方式进行投票:让你最聪明的10个朋友坐在一张桌子旁,然后询问他们对某一件事情的意见。这种机制的决策性能远远好于业界的平均水平。4

此外,机器学习的前沿研究和应用还包括集成学习(Ensemble Learning)和联邦学习(Federated Learning)。

图2.3 基于集成学习的信用评估模型

集成学习是使用一系列算法模型进行分析预测,并使用某种规则对各个模型的分析结果进行整合从而获得比单个算法模型更好的预测效果的一种机器学习方法。如果把单个模型比作一个决策者的话,那么集成学习就相当于多个决策者共同进行一项决策。由于融合多种信息和综合多种决策机制,经过集成学习得到的分析预测要明显优于单一模型。不同角度的信息存在关联,各自包含互补信息,多角度学习过程相当于一个不断收集证据的过程,加强信息互补,进行信息融合。

假设两个独立的评估模型关于利润率提升的结果分别是提升至16.9%和9.4%,传统信用评估中,第二个模型可能被弃用,但如果发现这两个模型包含互补信息,那么将这两个模型的结果融合,可以将利润率提高至38%。

联邦学习是机器学习的应用话题,这是由于金融行业的数据源往往分散在不同的互联网公司,这些数据是互联网公司的核心资源,它们并不愿意与其他商业实体进行交换。并且,大规模的数据交换也会产生个人隐私问题、数据泄露和信息安全事件。金融科技行业为解决这一问题,提出了联邦学习的概念。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈