首页 理论教育 如何选择合适的变量:完整指南

如何选择合适的变量:完整指南

时间:2023-06-04 理论教育 版权反馈
【摘要】:如表7-4因变量行所示,研究以样本农业转移人口是否获得蚂蚁花呗授信为模型的被解释变量;其中,没有获得花呗授信为0,获得花呗授信为1。研究确立了21个解释变量,解释变量按经济学含义分为5类。变量的选择遵循以下四项原则:第一,解释变量必须是“双显变量”。表7-5变量的定义续表

如何选择合适的变量:完整指南

如表7-4变量行所示,研究以样本农业转移人口是否获得蚂蚁花呗授信为模型的被解释变量;其中,没有获得花呗授信为0,获得花呗授信为1。需要特别说明为何研究以二元变量(即是否获得蚂蚁花呗授信)为被解释变量,而不使用样本农业转移人口获得蚂蚁花呗的实际额度为被解释变量,主要原因是花呗额度随自变量变动而相应变动的机制并不灵敏。蚂蚁花呗对用户的授信额度在较长的时期内保持稳定,这一数值往往与开通花呗的时间有关;据不完全调查显示,相同条件下,开通花呗越早的用户获得授信额度越低,可以认为在花呗推出的早期,对授信额度的设置更为审慎。研究亦没有使用每月调整的芝麻信用分分值为被解释变量,主要原因是使用花呗后芝麻信用分的调整速度较使用花呗前更快,即存在越获得授信的用户越具备授信条件的马太效应

研究确立了21个解释变量,解释变量按经济学含义分为5类。变量的选择遵循以下四项原则:第一,解释变量必须是“双显变量”。所谓“双显变量”,是指该变量的实际情况需同时被受信方(样本农业转移人口)和授信方(阿里巴巴小额贷款有限公司)明确知悉,且双方均了解对方对该变量的知悉程度。举例而言,样本农业转移人口在人民银行征信中心的征信情况可以被阿里巴巴小额信贷有限公司获取并用于授信决策,但是绝大多数样本农业转移人口并未在征信中心平台注册并查阅过自己的征信记录,因此该指标并不引入模型。同理,样本农业转移人口个人信息以身份证所能显示的资料范围为限,婚姻、子女、受教育程度等户籍信息虽然向授信方授权使用,但户籍信息的更新速度较慢,因此被调查者不了解授信方对这些信息的知悉程度,这类指标不引入模型。第二,解释变量排除了相关合同中指出的影响花呗授信且对花呗授信的影响方向明确的变量,主要包括(作为个人用户的)收入、存款、有价证券、商业保险、不动产的信息和纳税数额信息[《芝麻信用服务协议(2015年6月4日版)》第五条第(六)款]、征信记录和报告、财产及负债信息等[《蚂蚁花呗用户服务合同(2015年3月18日版)》第四条第4.2.5、4.2.6款]。第三,解释变量排除了导致花呗绝对无法被开通的因素,如年龄不足16岁、未认证真实身份、未绑定银行卡等。第四,解释变量重点考察与样本农业转移人口消费行为相关的变量,主要包括在阿里系电商平台的支付宝淘宝和天猫网站及移动客户端的行为数据[《蚂蚁花呗用户服务合同(2015年3月18日版)》第四条第4.2.4款]。具体的变量选择如表7-5所示。

个人信息主要包括年龄(AGE)和性别(GEN)等2项。金融信息主要包括支付宝绑定银行卡的数量(BCN)、购买余额宝或招财宝等线上理财产品的行为(BB)、使用支付宝转账的行为(BTB)、付款时使用代付的行为(IS)、线下使用支付宝付款的行为(TDC)和使用支付宝自动还款功能绑定信用卡自动还款的行为(CCP)等6项,其中,购买余额宝或招财宝等线上理财产品的行为(BB)分为两个虚拟变量BB1和BB2,付款时使用代付的行为(IS)分为两个有序变量IS1和IS2。流动信息主要包括使用阿里系电商平台以来手机号变动情况(PHN)、家庭邮寄地址变动情况(HDC)、单位邮寄地址变动情况(WDC)和所在地与出生地差异(RID)等4项。消费信息主要包括被调查者是否在平台上购买过图书类(BOO)、游戏类(PLA)、家装类(DEC)、车品油卡(CAR)、母婴用品(INF)等商品、每月购物金额(AMO)和每月购物次数(FRE)等7项。社交信息主要包括被调查者是否曾在购物网站内分享商品链接(BUD)和被调查者是否曾向购物网站外分享过商品链接(LNK)等2项。(www.xing528.com)

表7-5 变量的定义

续 表

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈