算法作为一种工具,若使用不当,就会像脱缰的野马一样难以控制;然而,如果平台能够精准地进行把控,并且不断地进行迭代升级,那么它就会成为技术领域的良驹。
拍张照片属于小的方面,智能机器人属于大的方面,算法已经在不知不觉中全面地“融入”到了我们的生活之中。
算法从简单规则到复杂的自我学习,不断赋予机器更接近人类的智能。在这种推动下,以 DeepSeek 为代表的生成式 AI 得以迅速发展。
不仅如此,社交平台的短视频能精准判断用户喜好,完成“猜你喜欢”,这是靠着算法的推动;新闻能精准判断用户喜好,完成“猜你喜欢”,这也是靠着算法的推动;电子书能精准判断用户喜好,完成“猜你喜欢”,同样是靠着算法的推动;购物软件能精准判断用户喜好,完成“猜你喜欢”,还是靠着算法的推动。
一方面,算法促使技术不断取得进步。同时,关于算法“技术阴谋论”的想象一直存在。在互联网上,一直不乏对“信息茧房”和“算法造神”的批评。并且,很多关于“算法阴谋”的想象最终都指向了平台们的商业行为。
最近,抖音的安全与信任中心网站已经上线了。并且,该网站首次公开了抖音的推荐算法原理,详细介绍了其推荐算法是如何预估用户行为概率的。那么,“信息茧房”到底是否存在呢?所谓的推荐算法“有罪论”,究竟是真实的情况呢,还是被冤枉的呢?
爆款视频真存在所谓的 “流量密码”?
多年前,抖音凭借音乐卡点短视频而在全网迅速走红。这使得很多人对抖音内容的认知一直停留在“短平快”的层面。然而,去年在抖音上最为火爆的作家并非那些头部网红,而是史铁生。
抖音发布了《2024 抖音读书生态数据报告》。在抖音上,时长大于等于 5 分钟的读书类视频总数量达到了 1143.43 万个,其收藏量达到了 3.91 亿次。读书类直播累计有 730 万场,每场直播的观看人数为 3076 人。读书书评相关内容共有 541 万个,总评论量为 2306 万次。《我与地坛》成为抖音最受欢迎的名著经典。报告显示,抖音上史铁生相关视频累计 18.6 万个,增长了 192%,总时长增长了 415%,总分享量增加了 51%。
这似乎与民间总结的所谓的“流量密码”背道而驰。
不少“教人做内容”的博主,他们科普的内容大致是首先得了解“内容平台的算法逻辑”,接着才能把握住“流量密码”,从而做出爆款。
民间总结出很多算法逻辑,这些逻辑是给内容和用户贴标签,接着算法就能把相匹配的视频推送给具有特定品位的观众。另外,算法是依据完播率、点赞率、分享率、粉丝转化率和评论率等各种指标来评估内容的质量水平,之后再推进内容进入流量池。
如果依据上述逻辑去判断一个视频能否成为爆款,那么关于“史铁生”的相关内容明显与大众认知中的“热点”和“流量”不相符。然而实际上,民间所总结的那些所谓的“流量密码”,大多都较为简单,不够客观,甚至还存在事实错误。
抖音安全与信任中心把算法的推荐详细地解释了出来。
算法通过数据收集、特征工程以及模型训练等复杂流程来预测用户的行为,其本质属于数学模型的运算过程。推荐算法的本质实际上是一个极为高效的信息过滤系统。个性化推荐算法就如同给每个人专门定制了一个信息“快递员”,能够更加高效且准确地把合适的信息推送到用户面前,以满足每个用户独特的需求。
观众打开抖音是一次反馈动作,观看视频是一次反馈动作,划过视频是一次反馈动作,点赞收藏视频也是一次反馈动作。抖音公开的推荐算法核心逻辑可简化为:综合预测用户行为概率与行为价值权重相乘,结果等于视频推荐优先级。
在打开抖音的内容推荐方面,采用的是多目标推荐系统。通过极为复杂的体系,对内容价值进行优化评估,评估内容不仅仅局限于点赞和收藏,还包括不同用户以及作者的行为价值权重等,这些因素共同构成了视频推荐的优先级。
抖音有自己的价值模型评估。简单而言,借助价值模型,能对用户的互动行为进行价值计算。并且通过持续调整参数,可对各类价值进行加权。它既会关注内容本身以及用户反馈,也会考虑到作者收益以及平台生态。
这解释了为何史铁生能成为抖音上最火的作家。创作者进行了精彩的输出,用户给予了积极的反馈,平台推动了优质内容,这些因素共同起了作用。
打破信息茧房,才是算法的目标
每当提到算法,必然会有人提及现代网络世界里的“信息茧房”。
“信息茧房”一词,最为人所熟知的出处是美国法学教授凯斯·桑斯坦的《信息乌托邦》。它指的是个体如果只关注自己选择的或能让自身愉悦的内容,同时减少对其他信息的接触,那么随着时间的推移,就会像蚕那样逐渐被自我编织的“茧房”所束缚。在当下的互联网环境中,这一没有经过实证的假说,逐渐被进行了概念泛化,并且被用于营销炒作。
一方面,这个“茧”或许会被技术加强;但必须承认,这种现象在很大程度上是由个人的喜好所引发的。简单来讲,人类天生就有倾向于接触符合自身喜好信息的特性,而这正是最终导致所谓“信息茧房”的最主要缘由。
算法存在的意义在于,在当下这个信息过载的时代,能够让用户以更为高效的方式获取信息。
让我们来看一组数据对比。
在信息时代,大部分人获取信息主要依靠亲朋好友,其次是报刊、书籍。如今,据 IDC(国际数据公司)发布的《数据时代 2025》报告可知,全球每年产生的数据在 2018 年为 33 ZB(1 ZB 等于 10 万亿亿个字节),到 2025 年将增长到 175 ZB。以 25Mb/秒的下载速度来计算,一个人下载全人类 2025 年产生的数据需要 18 亿年。对于每个人来说,我们每天所面对的各个平台的信息增量,是远远超过个人能够处理的极限的。
算法从海量数据中精心挑选,通过计算得出更优质的内容来进行推送。从某种程度而言,它也能够成为打破信息茧房的一种存在。从商业理性的角度来看,让用户看到更多元的内容,对平台的长期价值是有利的,所以这与用户的利益是一致的。各个平台早已进行了不少打破信息茧房的实践。
现在许多平台都具备“关闭个性化推荐”的这种选项。并且各个平台一直在持续地对算法逻辑进行优化,就像从最开始的仅仅是单一的点赞行为,逐步发展到对“负反馈机制”进行完善,把“不感兴趣”之类的数据纳入到模型训练当中。
小红书之前强调,用户能够通过“内容偏好调节”这一方式,掌握对内容的自主选择和管理权。如此一来,用户便更便于主动打破“看过什么就一直推送什么”的循环,从而使算法更加高效。
抖音算法处于多目标建模体系当中。它设置了特定的探索维度。借助多样性探索以及兴趣探索等目标。能够引导算法打破“茧房”。
实际上,在各个平台持续对算法进行完善以及实践的过程中,我们大致已经能够认识到,算法尽管复杂,然而同样是可以被“调教”的。抖音总裁韩尚佑曾表明:“要真正让算法实现‘向上’和‘向善’,就需要回归到算法的原理以及生效机制的层面去持续加以改进。”
抖音曾经尝试过直接对知识、历史、科技等内容进行简单加热,然而这种做法改变了模型正常的计算逻辑,进而使内容的后续推荐受到了干扰。
为解决此问题,抖音改变思路,特地训练了预估收藏及重复观看概率的模型,同时把收藏按钮放置在首页最易点击的位置。经过反复实践与不断试错,在 2024 年,一条时长 450 分钟解读《红楼梦》的超长视频,在抖音获得了超过 3 亿的播放量以及 700 万的收藏。
这意味着算法在各个平台的努力之下,变得更加适配当下的网络环境。同时,也意味着算法在各个平台的努力之下,更加适配当下的用户心态了。
当算法走进生活
前文提到算法在发展中不断完善,平台会阶段性根据市场反馈主动采取举措进行调整。更重要的是,在算法不断完善的过程中,其带来的社会价值正逐渐显现。
推荐算法的基本原理是进行高效分发,它能够把信息以及人原本孤立的点相互连接起来。当不同的信息与不同的群体相遇时,就会产生不同的效应,并且能够带来更大的社会价值。
2015 年,大部分实体书店都处于走下坡路的状态。电商巨头亚马逊却开出了一家实体书店,仅用一年半的时间就实现了盈亏平衡。所有传统书店都感到震惊,大家随后发现,这家书店最出色的设计在于能够依据线上的读者评分、预售情况以及销量排行等,通过算法得出“推荐书单”。很多读者正是通过这种高效的推荐方式,在货架上买到了自己想要的书。
现在,抖音算法通过精准分法来推动实现知识普惠,通过兴趣连接来推动实现知识普惠,通过生态共建来推动实现知识普惠。
抖音上有个例子很有趣。去年,一颗长着蘑菇的苹果在抖音上变得很有名。一位浙江网友分享了在黄梅天里自家苹果长出蘑菇的事情,这件事被中国科学院昆明植物研究所的许博士注意到了。许博士买下了这个蘑菇样本进行研究,还在抖音上实时向网友汇报研究进度。有不少网友在评论区展示自己见到的菌落并向博士请教。6000 多万网友一同围观了这场全民知识接力。
现在,抖音的算法在协同过滤算法以及知识图谱推理的共同作用之下。它能够依据用户的行为来推荐相关的科普内容。并且能够拓展到相关领域,从而形成“知识链式反应”。甚至对于一些诸如甲骨文、弦理论这样的小众知识,都能够通过算法找到相应的受众。
再比如,算法正在推动更为实际的惠民举措。淄博烧烤走红了,哈尔滨、天水等小众城市也走红了,农产品走出了大山,这些都离不开背后算法的积极作用。
抖音算法在召回、过滤、排序等环节发挥作用,重点对用户的兴趣爱好、浏览历史、购买行为等进行学习。通过分析数据,能够把大山里的农产品精准地推送给对农产品感兴趣且有需求的用户。同时,算法还助力打造“新农人 IP”,使大众可以通过关注农人故事而关联到土特产。
抖音电商发布的《2024 丰收节抖音电商助农数据报告》显示,在 2023 年 9 月至 2024 年 9 月这段时间里,抖音电商总共销售了 71 亿单农特产品。平均下来,每天有 1740 万单农特产包裹被运往全国各地。并且,这持续推动着优质农特产品从农村走向城市。平台全年的农货商家数量比去年同期增长了 63%,三农创作者的数量也比去年同期增长了 52%。
总之,算法是一种工具。如果使用不当,它就会像脱缰的野马一样难以控制;但如果平台能够精准把控并且不断迭代升级,它就会成为技术的良驹。值得肯定的是,抖音公开算法,这是一个积极的实践。至少让公众明白,有人工运营和平台治理作为导航,算法会一直向上向善,为人们的数字生活增添美丽的色彩。