首页 理论教育 视频上传后的算法分析

视频上传后的算法分析

时间:2023-06-14 理论教育 版权反馈
【摘要】:抖音作为“头条系”下的当家软件,它的算法自然是头条系的一贯风格:以用户为中心。这个过程是实时的机器算法。“头条系”会打通所有平台的数据库,看看你在每个平台的“偏爱标签”并记录下来。当我们发布视频后,平台会进行一次审核,这时主要是审核我们的作品有没有违规。初始推荐优先分发给附近的人与关注我们的粉丝,然后才是配合用户标签与内容标签进行智能分发。

视频上传后的算法分析

为什么别人玩抖音,随便一发就能轻松获得10万以上的点赞,而自己精心准备的内容怒拍几十条也枉然?抖音的游戏规则是什么?推荐算法是怎样的?是不是上抖音的热门,靠的是运气?

接下来这部分就详细地给大家介绍下抖音的算法逻辑。到底什么样的内容,更容易被官方认可,获得更高的曝光呢?

学习算法机制的目的,并不是告诉大家可以忽略作品的质量问题。毕竟新媒体传播,内容永远是根基。但只有学会如何触发机制,让内容符合算法,才能让优质内容得到更好的传播。也只有根据算法机制去调整作品细节,才能让作品触发机制后快速上升。

抖音区别于其他视频软件的“护城河”就在于它特有的算法机制,这种筛选后的高质量内容用15秒的单刀直入,让人们在视觉、听觉、情境的共振里感受美好,从而产生上瘾机制。

抖音作为“头条系”下的当家软件,它的算法自然是头条系的一贯风格:以用户为中心。只推送你喜欢的内容,如果你被一个娱乐类型的视频所吸引并点击观看,达到一定完播率后你的内容主页就可能被定制成了娱乐类型。而在日后的观看过程中,机器算法会不断细分、采集并记录你的行为标签,从而让你喜欢看的内容越来越精准,可能最后细化到只给你推送“某个明星”的相关新闻或视频。

简单而言,就是你越常看什么,系统越会更多、更密集地给你推荐什么。

你喜欢看明星八卦,就会得到越来越多的明星八卦;喜欢看小剧场的相声,就会出现各种类型的小剧场相声。

抖音流量分发的基础逻辑流程分为3部分:给内容贴标签、给人物贴标签、按标签智能个性化推送。

图8-3、8-4为2015年“今日头条”的一份关于“男性与女性关心的主要内容类目”的数据报告。

图8-3 男性的15大阅读标签

图8-4 女性的15大阅读标签

基于这些大品类继续细分,可以再次细化出非常多的小标签。比如娱乐,可以细化到明星,继而细化到八卦,甚至最后精确到“XX明星结婚”的标签。

说到给人物贴标签,就是每个平台都会做的,建立用户画像。

图8-5 用户画像分析

平台首先会根据你在使用APP时的习惯进行行为路径分析,再进行贴标签、优化标签等操作。这个过程是实时的机器算法。

详细过程为:通过你个人资料的填写、关键词搜索的记录、浏览较多的视频类目、点赞视频数据、评论数据及通讯录的圈子关系等来建立用户的个人画像。通过越来越多的标签,确定用户的社会关系和个人生活状况,甚至能精确到你住在哪个城区,今年多大了,是不是独生子女,平时几点睡觉,喜欢什么品牌的化妆品

可能很多人会感到好奇:“为什么我明明没有刷很多的视频,也没有点赞、评论,但是系统会很详细地知道我的喜好?为什么推荐的内容基本上都是我感兴趣的内容?”

这也曾是困扰我的问题,直到询问过字节跳动(抖音母公司)的工程师朋友后,我才明白了其中的原理:这就是“头条系”产品越做越好的另一个主要原因,“头条系”的产品完成了各个软件之间的数据共享。

“头条系”会打通所有平台的数据库,看看你在每个平台的“偏爱标签”并记录下来。你在单一平台访问痕迹有限,标签过分单薄,但是在多个平台上的活动轨迹交汇后,会形成一个很鲜明的个人特质。

一个记录不够全面,就多个一起融合,不断精细你的个人信息,然后推荐给你更多你感兴趣的东西,让你入迷。

抖音的审核由机器+人工双重审核构成。

抖音作为一个去中心化的平台(弱化关注页面,内容随机滚动),任何一个账号都有拥有百万粉丝甚至千万粉丝的机会。即便我们没有一点儿流量,只要我们的内容受欢迎,就会被越来越多的人关注。

图8-6 抖音算法模型 来源《短视频热门研究院》

在我们的作品发布完成后,会经历以下几个流程。

当我们发布视频后,平台会进行一次审核,这时主要是审核我们的作品有没有违规。

例如,有没有出现广告、有没有带水印或LOGO、内容是否不雅或血腥等,如果出现平台禁止的内容,我们的视频就会被打回或被限流(只有你自己可以看见你发布的内容)。如果没有出现任何违规行为,平台就会通过,这时内容才会正式出现在用户面前。

在经过“可以公开播放”的认证后,平台会根据我们账号的权重给予我们新发布的视频一定的初始推荐流量。初始推荐优先分发给附近的人与关注我们的粉丝,然后才是配合用户标签与内容标签进行智能分发。(www.xing528.com)

平台将我们的作品进行初始推荐后,会根据初始流量的反馈来判断我们的内容是否受欢迎。如果受欢迎平台会将我们的作品分发给更多流量,反之就不会再给我们分发流量。

这里的重要反馈指标有:点赞率、评论率、转发率、完播率、粉丝量、进入主页数和查看音乐量。

·点赞率:用户的点赞数量和播放数的占比也会影响推荐。点赞源自用户对内容的认可,犒赏和收藏是用户表达喜爱的方式。

·评论率:不仅包含用户评论数量,还包含用户查看评论数量、评论点赞数量。

·转发率:不同渠道的转发,包含是否在评论里面@好友;如果再细化的话,还会涵盖粉丝量、主页打开比率、查看音乐动作。

·完播率:不仅仅是视频的播放完成率,还有用户多次播放的数据。重复播放次数也会加入基数分值。

·粉丝量:包含现有粉丝量、新增关注粉丝量及取关粉丝量。

·进入主页:通过作品进入用户主页也有加分;预览其他作品数量及次数等。

·查看音乐:通过作品查看音乐也会有基数,以及背景音乐是否原生。

这些反馈指标的层阶顺序是:

完播率>点赞率>评论率>转发率>进入主页>粉丝量>查看音乐量。

抖音视频的第一次推荐,会根据账号的权重不同给大概200~500的流量,如果被推荐的作品以上数据反馈较好(有10%的点赞和几条评论及60%完播率等),平台就会判定我们的内容是比较受欢迎的,便会给第二次推荐。

第二次推荐大概会给1000~5000左右的流量,如果第二次推荐的反馈较好平台将推荐第三次,第三次就是上万或几十万的流量,一直以此类推。要是反馈依然较好平台就会以大数据算法结合人工审核的机制,衡量你的内容可不可以上热门。

一般一个视频发布1个小时内,视频播放量达到5000次以上,并且点赞数高于100,评论数高于 10 ,基本上就会给下一级推荐了。

之前也有人问:“为什么自己的视频一直很冷,很多内容都是很久以前发的了,结果最近又莫名其妙地火了起来?”

这是因为抖音会发掘历史数据。

什么是历史数据的挖掘?历史数据的挖掘是指即使你前面发布的视频反馈不是很好,但是突然有一条视频的反馈很好、用户很喜欢,平台就会认为你的视频受用户喜欢便会扶持你。而喜欢你视频的用户往往会去你的主页看其他视频,点击的人越多,平台就会认为你的其余视频也很受欢迎,所以还会推荐你的老视频。

与之相反的是,即使前期你的视频反馈很好,流量很大,但只要有一条视频违规,你的账号就会被降低权限从而被限流或封号。

曾经我们为了明确抖音的各个流量池入池数据到底是多少,做了大量的测试检验。后来发现,其实通过对播放量的自查,就可以基本明确自己的作品到底是进入了哪个组。

我们把作品从上传到热门优质池状态这个路径划分为3个阶段,并用播放量作为对标的方法。

播放量小于1000次时,这1000次播放量就是你的作品的种子用户,系统会匹配用户数据中标有关键词的受众,完成第一次分发。

比如男篮世界杯期间,假如你发了一个带有“姚明” “男篮” “周琦” “李楠”等标签的内容,那么这些标签所对应的“体育”“篮球”“男篮”“易建联”就会成为第一批测试用户,小量级试探推荐,观察用户是否感兴趣观看并有良性反馈。

通过机器数据观察用户反映后,继而扩大量级推荐,一万到10万播放量,并根据“姚明”“男篮”关联更多关键词及标签用户,如“NBA”“ CBA”“奥尼尔”等。

如果你的作品通过了小爆炸阶段,就将会进入优质池状态,我称它为“王者流量池”。

你的作品进入优质池状态,已经上热门了,抖音会给你100万以上的播放量。

简单而言,抖音的算法推荐,更像是一个池子的进阶之路,先把作品投放在一个小池子里,有绝大多数人喜欢,那就再放进一个大池子里,大池子里还是有很多人喜欢,那就放进大海中。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈