用户在图文、短视频平台连续阅览某类话题内容时,平台推荐算法会持续推送相关内容,由此产生的“信息茧房” 问题一直备受行业质疑 。4月15日,抖音“安全与信任中心开放日”现场,相关负责人拆解抖音算法逻辑与审核流程。
推荐算法作为人工智能机器学习技术的应用场景,本质是一套高效信息过滤系统。现场采访环节,抖音算法工程师刘畅表示,抖音推荐算法与国内外大部分内容推荐平台相似,包含召回、过滤、排序等环节,重点是学习用户行为。
目前,抖音基于用户行为的推荐方法包括协同过滤、双塔召回、Wide Deep等多种技术模型。算法可以在完全“不理解内容”的情况下,找到兴趣相似的用户,将其他人感兴趣的内容推荐给该用户。
但同质化选题的密集推送容易造成“信息茧房”现象,对此,抖音相关责任人回应称:“信息茧房”概念在推荐算法成熟之前就出现了,算法不是“信息茧房”形成的先决因素。现在行业对“信息茧房”的担心本质是“信息偏食”,即信息来源单一。
当前各渠道分发信息都存在一定局限性,此前包括小红书、微博、美团、哔哩哔哩等平台均发布了算法治理相关内容。北京师范大学新闻传播学院教授喻国明表示,“信息茧房”一直存在,本质是海量信息差异化消费的必然结果。
为引导算法打破“信息茧房”,抖音算法在多目标建模体系下,设置了专门的探索维度。一是尽可能推荐更多样的内容,通过多样性打散、多兴趣召回、扶持小众(长尾)兴趣等方法控制相似内容出现的频次。二是采用随机推荐、基于用户社交关系拓展兴趣、搜索推荐联动、“不感兴趣”不再展现等方式,让用户的主动行为影响推荐系统,使推荐更加个性化和多样化。
但需注意的是,算法能学习、预估用户行为,但无法理解内容语义,对内容的理解存在不足,可能导致违法违规、不良内容被推荐传播。因此,算法必须由平台治理对其进行约束和规范。抖音生态运营经理陈丹丹表示,抖音内容治理体系实行“人工参与+机器学习”模式,包含异常感知、标准定义、机器识别、人工研判、风险处置等过程。
创作者将内容上传至抖音后,先进入机器识别环节。如果内容被识别出含有高危特征,将被直接拦截;若未命中高危特征但模型判断有问题,会被送至人工审核;若问题概率较低,获得基础流量进入下一环节。当视频被举报、评论区出现集中质疑、流量激增等情况发生,则可能触发“人工+机器”审核。相关内容在上述任一环节被处置,系统都会立即停止进一步推荐和分发。
0 条