即刻App年轻人的同好社区
下载
App内打开
奔跑的小笼包
8关注8被关注0夸夸
大道至简,和而不同。INFP | 颅内小剧场。
奔跑的小笼包
1月前

兔撕鸡大老爷: 最近,抖音弄了个算法公开日,把它家神秘莫测的算法公开了,还公布在了抖家的安全官网上(95152.douyin.com),引发了一堆内行人的学习兴趣。 我逐字看完咯,写的很通俗易懂。 但普通人仍需要我这样的中译中闲人翻译。 抖音算法主要是Wide&Deep模型和双塔召回模型。 Wide&Deep模型是谷歌提出的混合推荐模型,wide是宽度的意思,deep是深度,什么意思呢,前者是挖掘你跟一支视频的直接联系,譬如你在看运动鞋,它就给你推同款。后者是挖掘你跟这支视频的泛联系,你在看鞋,那么你可能会去旅游,想要买运动手表。 充分挖掘你人生的宽度与深度。 双塔召回模型很有意思,一座是用户塔,一座是内容塔,两个都是深度学习模型,把一些内容特征做了数字转化。 譬如你是用户,爱看游戏,做菜,唱歌,熊猫,用户塔便赋予她们数学代号为0,1,2,3。短视频为X,长视频为Y。 做菜短视频就变成了(1,X),又做菜又唱歌的短视频是(1,2,X),像搞怪、诗意、科技、玄学都是可以被数字化的内容特征。 抖音还有座内容塔嘛,识别到了你家用户塔的数学特征后,会粗筛一批口粮给你,搞笑大厨,薄肌体育生,宫斗短剧,杀死比尔等等,排序到了你的预存储空间里。 上下一划,大概率是你想看的。 抖音总结推荐算法,就是以数学计算学习人类行为。 抖音还公布了推荐优先级,设定了一些行为的“推荐价值”,不再是只看完播率了,在中长视频+短剧生态繁荣后,发展出来了多目标建模,让推荐更加均衡。 除了把算法黑盒拆开给大家看,还讲了怎么治理内容。 建立有专门的标准管理团队,已对违法违规、色情低俗、公序良俗、危险行为等十余大类、数百种风险设置了独立标准条款,每条标准条款都匹配典型违规案例及对应执行手册。 流量越高的内容经过评估的次数越多,标准也越严格。所以我们会看到一些违规内容,很快就被限流或处理掉了。 在这块是“机器+人工”的审核,又有一点Wide&Deep的味道,机器主要负责宽度,主动对所有投稿进行评估,筛掉最直观的问题点。人工主要负责深度,确保疑难问题尽可能精准研判,减少错判,毕竟算法不是真的懂内容。 这个安全网站还会更新。。。 甚至聊到了APP会“窃听”用户谈话吗? 它的副标题是:平台“窃听”在技术上不“划算”,在法律上不被允许。 里面聊到了跨平台营销推荐,是造成用户被窃听的主要幻觉。 例如,用户在A电商平台搜索了一款猫粮。关闭A平台后,打开了B社交平台,发现B平台也在推荐猫粮。这并不是B平台对用户做了监控,是A平台作为B平台的广告主,通过程序化广告利用A平台的数据定向给用户展示了广告,实现跨平台的广告营销。 这个举动是符合我国法律法规的一种广告形式。 啊...这个算法公开日太有意思了,人的行为啊,才是算法的根本。

00