首页 理论教育 实验中使用的数据集:hetrec2011-lastfm-2k

实验中使用的数据集:hetrec2011-lastfm-2k

时间:2023-06-11 理论教育 版权反馈
【摘要】:表3-2hetrec2011-lastfm的统计信息实验采用hetrec2011-lastfm-2k数据集作为实验数据集[147]。在hetrec2011-lastfm-2k数据集中,并没有用户之间的交互信息,因此,我们采用用户之间共同聆听过的艺术家数量作为交互次数,而将用户对艺术家的聆听次数作为对艺术家的评分。

实验中使用的数据集:hetrec2011-lastfm-2k

目前尚未见到可直接应用于O2O服务商推荐的公开数据集,但Hetrec2011的hetrec2011-movielens数据集包含的数据较为丰富,该数据源自于著名的IMDB和Rotten Tomatoes电影评论网站,包含有2113名用户对10197部电影的855599条评价信息和13222条标签信息。由于影视娱乐也属于O2O服务行业,具有线上购票、线下观看的性质,所以该数据集可以作为实验数据集使用。通过对hetrec2011-movielens数据集的分析,我们发现其部分主要演员数据有错误,如编号为1482的电影的主演为Chonrada Makratree,但在IMDB网站上,该电影的主演为Hugh Jackman,因此,不宜将主要演员作为O2O服务商家来研究。但我们发现每部电影的导演只有一个,不存在歧义性,且考虑到电影导演的拍摄风格在不同的时期有不同的特点,因此,本章将电影导演映射为O2O服务商家,而将电影导演所拍摄的电影映射为O2O服务商家所提供的服务。(www.xing528.com)

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈