首页 理论教育 GBDT模型框架体系在软件工程领域有重要成果

GBDT模型框架体系在软件工程领域有重要成果

时间:2023-11-06 理论教育 版权反馈
【摘要】:通过机器学习中基于集成学习的梯度提升树分类及回归算法模型可以对该类多特征的问题进行监督学习,实现对样本特征的分类及回归分析和评分。类似的,GBDT 回归模型则是迭代多棵回归树来共同决策以输出为特征的回归结果。GBDT 模型框架如图1。在模型计算中,综合采用GBDT 分类和回归模型,实现黄牛侦测和评分。在筛选后对模型进行进一步训练,并在此基础上,利用GBDT 回归模型,实现对黄牛商户交易行为严重程度的量化评估。

GBDT模型框架体系在软件工程领域有重要成果

通过上述对黄牛商户交易的特征画像的充分认识可知,黄牛商户交易涉及商户、持卡人以及商户和持卡人之间关系的多种交易特征,由于以往侦测已经获得了部分商户是否黄牛的样本标签,故对其的侦测及评分可以看作是基于监督学习的分类和评分问题。

通过机器学习中基于集成学习的梯度提升树(GBDT)分类及回归算法模型可以对该类多特征的问题进行监督学习,实现对样本特征的分类及回归分析和评分。GBDT 分类模型在计算中将产生多轮迭代,每轮迭代产生一个弱分类器。每个分类器在上一轮分类器的残差基础上进行训练,并通过降低偏差来不断提高最终分类器的精度。类似的,GBDT 回归模型则是迭代多棵回归树来共同决策以输出为特征的回归结果。GBDT 模型框架如图1。

图1 GBDT 模型框架

除此之外,GBDT 模型在输出基于特征的标签分类和回归结果的同时,还可以对学习过程中的特征变量决策树中的重要度进行排序,能有效应用于特征筛选。

结合黄牛商户评分的实际侦测场景,本文研究提出以下模型技术路线,如图2所示。

(www.xing528.com)

图2 模型技术路线

图3 交易特征画像

在输入端,首先结合已有专家规则挖掘的特征和黄牛商户画像特征对原始交易数据进行特征工程处理,筛选和清洗出相关的模型学习特征变量,并利用原有交易历史数据识别的黄牛商户作为交易标签,制作模型训练样本,以供后续模型计算和分析。

在模型计算中,综合采用GBDT 分类和回归模型,实现黄牛侦测和评分。具体的,首先利用GBDT 分类模型,对数据样本进行学习,根据学习结果得出的特征权重排名,对特征变量进行筛选和优化,即对GBDT 中的决策树进行剪枝处理。在筛选后对模型进行进一步训练,并在此基础上,利用GBDT 回归模型,实现对黄牛商户交易行为严重程度的量化评估。

最后,根据量化评估的结果,实现对商户黄牛的评分结果输出,并在此基础上对相关交易实体特征进行进一步挖掘,并由此抓取黄牛商户交易的确凿证据。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈