首页 理论教育 时间序列交易特征工程分析成果

时间序列交易特征工程分析成果

时间:2023-11-06 理论教育 版权反馈
【摘要】:持卡人侧则存在手机号、支付模式、卡属性、卡等级、APP 版本、IP 地址、设备号等特征信息。以上对于特征的分析主要基于当前时间窗口下的交易特征进行的抽取,而对于黄牛商户,其交易特征在较长的时间窗口内,具有很强的时间序列关系,对其侦测不可忽视时间序列的分析。图5特征筛选与多层次体系划分

时间序列交易特征工程分析成果

通过上文黄牛特征画像的分析,结合公司已有的基于人工经验的专家规则,本研究从商户、持卡人及相关交易三个层次入手,建立多层次的特征体系。

如图3所示,云闪付二维码交易场景中存在如下几个层次的特征:商户侧特征、持卡人侧特征、商户-持卡人用户交互特征、商户-持卡人交易实体特征。

(1)商户侧的有效特征包括:商户类别、商户地理位置等特征信息。

(2)持卡人侧则存在手机号、支付模式、卡属性、卡等级、APP 版本、IP 地址、设备号等特征信息。

(3)商户-持卡人用户交互特征有异地占比(基于IP 的统计,即IP 分散度)、集群特征(基于设备号-手机号-卡号的统计)、常用支付模式、APP 旧版本率(旧版本量/总交易量)、主要卡属性、主要卡等级、主要接入APP(app_ins_id_cd)等。

(4)商户-持卡人交易实体特征如:一定时间窗口内的交易量、交易金额、优惠金额、交易时间差,连续相同金额交易笔数、金额、时间间隔等特征信息。

以上对于特征的分析主要基于当前时间窗口下的交易特征进行的抽取,而对于黄牛商户,其交易特征在较长的时间窗口内,具有很强的时间序列关系,对其侦测不可忽视时间序列的分析。本研究综合考虑商户当前交易及历史交易记录的影响规律,将历史周交易数据特征赋予权重叠加至当前周交易,作为模型学习的特征变量

如图4所示,在对当前周交易进行黄牛侦测时,以该周为一个时间窗口,综合考虑近三个月(12 周)的交易记录,将历史周交易数据特征根据时间间隔赋予不同的特征权重,以用于建立具有时间序列特征的特征变量。其相关表达式如下:

(www.xing528.com)

其中Xj 表示叠加权重后的第j 个时间片段内交易特征以作为模型学习的特征变量;xjj′ 表示在考虑第j个时间片段黄牛交易情况时,第j′个时间片段的交易特征;λj-j′ 为第j′个时间片段对第j 个时间片段的影响权重。按照间隔时间长短,其权重系数可按图4 及对应的表1 进行赋值,该表表明离考察的时间窗口时间间隔越近的交易窗口其影响权重越高。

图4 历史交易数据权重影响曲线

表1 历史交易数据权重影响对应数值

通过上述交易特征时间序列分析处理,在考虑12周交易时,可将原有基于规则和交易画像抽取的交易特征159 个精简至49 个进行特征分析(其中部分特征如连续交易特征等,无须按周进行窗口划分提取,较长的时间片段下的特征统计效果更明显),如图5。

图5 特征筛选与多层次体系划分

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈