【摘要】:新用户,指的是第一次访问的用户,之前没有任何的行为,但这些用户也是有个性化信息的,信息包括:用户的访问时间,白天、晚上,还是深夜,是工作日还是周末。用户所在的地域,一线城市或者二线城市。有了用户属性这些信息,就可以给新用户进行推荐。一开始使用的方式是对上面的信息进行交叉组合,通过历史数据挖掘交叉组合后的用户偏好。
新用户,指的是第一次访问的用户,之前没有任何的行为,但这些用户也是有个性化信息的,信息包括:
(1)用户的访问时间,白天、晚上,还是深夜,是工作日还是周末。
(2)用户所在的地域,一线城市或者二线城市。
(3)APP 用户的手机型号,是安卓,还是IOS,是小米还是华为,或者是OPPO。
(4)PC 用户的浏览器类型,如IE 或者Chrome,分辨率1 024×768 还是800×600。
(5)用户的登录页,首页还是某个活动的页面。
(6)一些应用在用户注册的时候,还会填写用户信息以及兴趣偏好。(www.xing528.com)
有了用户属性这些信息,就可以给新用户进行推荐。一开始使用的方式是对上面的信息进行交叉组合,通过历史数据挖掘交叉组合后的用户偏好。比如,深夜从北京访问,使用小米手机,通过首页访问的新用户最可能偏好哪些物品。通过实践发现,这种方式可以一定程度上提升新用户推荐的效果,但也有不足之处,主要有2 点:
(1)上面用户信息的交叉组合后,维度会比较高,造成满足这些维度的数据在一些情况下质量不高,置信度不够。
(2)对于一些时效性应用场景,比如资讯类,该算法计算出来的往往是过去的文章。
所以我们对个性化推荐引擎进行了升级,使用机器学习的方式获得新用户的偏好。目前使用的机器学习方法是逻辑回归(Logic Regression)。
该模型中的X 就是我们需要输入的特征,β 是训练得到的特征权重。所以其中最核心的是特征的选择,会把上面提到的单维特征、多种组合特征,以及item 的标签、类别都加入模型,通过训练得到特征权重,再对新用户进行预测。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。