具体来说,数据跟画像之间应该怎么建立关联呢?这需要我们赋予冷冰冰的数字一个所谓的特征标识,这些特征聚焦的就是用户人群,每个人群都有一个画像。
比如,我们看到有许多加入群组的行为数据,这些数据意味着什么呢?单看数据没有任何意义,我们要看有哪些群组能够赋予特征含义。对于“加入高端信用卡交流”这个行为来说,我们就可以赋予其“高收入”的特征含义。许多“高收入”特征的聚集,就能够聚焦一些用户。
所谓聚焦往往就是建模的过程。“高收入用户”可能需要一个模型公式来计算,我们分析一个最简化的情况。一个用户是不是高收入用户的可能性为P=αA+β B:A是他在“高端信用卡交流”群组的行为特征,在就是1,不在就是0;B也类似,是他在“私立幼儿园交流”群组的行为特征。我们不能直接做加法,还要判断这两个特征与高收入用户的关联度有多大。
最科学的方法是做实地调研,我们可以搜集1 000个用户的行为特征,然后用可靠的调研方法确认这1 000个用户是否真的是我们认为的高收入用户。用这个做模型,最后就能得到α和β的值。与此同时,我们也有了统计学上的置信度的判断,即假如我们得到了一些用户的P值,我们认为他们很有可能是高收入用户,并判断出这个概率到底是100%,还是80%。(www.xing528.com)
建模是最有效的方法,不过并非每个团队都有这么好的资源做建模。如果没有条件做建模,我们也不需要对特征和用户的关联准确度有太高要求,只需用比较粗糙的加减法做判断就可以。
加入两个群组的用户比加入一个群组的用户更有可能是高收入用户,当然这不是很确定的判断。A是用户在“高端信用卡交流”群组的行为特征,B是用户在“私立幼儿园交流”群组的行为特征,可以根据A+B的值为特征把用户划分成三个群体——2,1,0。我们可以针对性地发掘每个群体的用户画像,并做定向的研究和需求分析。
不管用什么方式,我们打通了可量化数据、用户特征与用户群体画像的一个通路。这个通路可能比较简单,也可能比较复杂,但都能够让我们从数据里分辨人群,进行有效的人群划分。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。