曹欢欢一张图揭秘今日头条内容安全机制

2018-01-12 15:48 来源:中国网 
2018-01-12 15:48:01来源:中国网作者:责任编辑:刘超

  “2014年1月我来头条的时候,研发所有人加起来才不到40人,头条就已经有专门的审核团队和审核模型来做内容安全了”

  在1月11日,今日头条召开的《让算法公开透明》交流会上,资深算法架构师、中国科学技术大学计算机博士曹欢欢面向业公开算法原理,消除社会各界对算法的一些误解,同时接受意见和建议。

  曹欢欢介绍说,头条的主要内容来自PGC和UGC两块,两块内容都走共同的审核机制。

  对于UGC内容,审核流程第一步是风险模型过滤,算法直接做色情谩骂、非法信息的识别,审核之后,没问题先小范围推,搜集用户反馈。如果有负面反馈或者用户分享数阅读数比较大,头条人工审核会干预。否则就会大范围推,这个阶段如果有负面反馈或者用户阅读量超过一个阈值人工审核会再次干预。

  对于PGC内容,每一篇文章都会由专业审核人员审核,如果没有问题,就进入推荐候选。如果有负面反馈或者用户阅读量超过一个阈值人工审核会再次介入,二次确认。

  曹欢欢表示,头条风险过滤模型中包括鉴黄模型、低俗模型和谩骂模型,这些模型的样本库建得非常大,更注重召回率,甚至为了保证识别出问题内容,会牺牲准确率。

  曹欢欢表示,目前整个内容审核机制已经很完整,但内容增长和业务发展非常快,团队压力还是很大,头条是是行业领先者,必须在这块用最高的要求来要求自己。

  分享过后,曹欢欢在现场解答了社会各界人士对算法的疑问,包括今日头条如何实现冷启动,广告和内容该怎样平衡,怎样准确地拓展用户兴趣图谱等切实的工程性问题。同时,听取接纳了大家对今日头条算法的意见和建议。

[责任编辑:刘超]

手机光明网

光明网版权所有

光明日报社概况 | 关于光明网 | 报网动态 | 联系我们 | 法律声明 | 光明员工 | 光明网邮箱 | 网站地图

光明网版权所有