一、从头条停服事件说内容审核——互联网公司后防线
北京时间2017年12月29日晚,今日头条打开后,出现更新维护一天的提示。一时间,炸开了锅。不确切估算,头条至少损失1亿元广告收入。第二天有消息称,头条计划在天津扩招2000名内容审核人员,党员优先。
坊间有传闻,是网信办约谈了今日头条和凤凰网,指出其部分内容涉嫌低俗,传播情色等信息。
2018年1月14日,北京市网信办就“百万赢家”活动将香港、台湾作为国家列入答题问题依法约谈花椒直播相关负责人,责令全面整改。
从网信办密集的约谈和整改动作可以看出,国家对app中的涉政和色情内容的关注度在逐步加强,这就引出了各大互联网公司尤其是内容输出类app,必备的“内容审核”业务。
二、用“产品思维”重建“内容审核”
恰恰公司的审查业务刚起步,半年以来,以审查业务负责人的角度,我基本经历了“内容审核”业务从0到1搭建的全过程。没有任何内容审核业务经验的我,只能从产品经理的角度,摸着石头过河。我面前的问题是这样的:
- 背景
公司的app类似于内涵段子,用户发帖发评论,数据按推荐流和话题两种形式展示。 - 目标
我的目标就是,“把用户发布的帖子和评论中的有害部分删掉”。比如,用户每天在app中发布100条帖子或评论,如果其中有1条色情或政治负面,就要想办法把这条内容删掉。
有人说,这个多简单呀!但是。。。上面只是为了描述方便,我们实际面对的是另一个问题,从百万级以上帖子评论中,一个不落地删掉那近万条帖子。 - 效果
最后我们用30人+ 一双“天眼”做到了如下效果:
365天7*24小时保证,用户每发布100w条内容中的10000条有害内容,4小时内清除其中9100条。
有人要问,那漏过的900条违规内容怎么办?答案是,通过用户举报和专人随机巡查发现并处理;另外,“天眼”是一套业界领先的审核系统,由我们自研。
- 疑惑
如何达到上述效果的?难道1个人每天审33000条帖子吗?No,一人每天的上限是10000条。这里先卖个关子,我是用“数据驱动问题解决”的思路设计系统,并达成上述效果的。
三、“数据驱动问题解决”的“三环四步法”
解决问题三个环节和四个步骤
问题、业务、产品或系统是解决问题过程中的三个核心环节,产品经理的职责从来都不仅仅是设计产品,那样对自己定位太低。这样定位自己,经常出现产品自嗨,到头来要么业务不落地没法落实,要么产品上线了问题却没解决,所以,我一直主张产品经理的目标——解决实际业务问题。
“三环四步法”可以有效解决问题,看图:
发现了问题(现状与目标状态的差距),问题“驱动” 实现业务,业务需求“驱动”产品设计,产品实现业务需求,业务解决问题。
举个例子,比如发现了社区用户发布违规色情内容,那么会驱动实现内容审查业务环节,最终需要进行审查系统的设计与上线;接着,系统承载了审查业务,最后解决了色情内容泛滥的问题。
百分问题及量化现状
根据现状的易量化程度,可以将其分为易量化和不易量化两种。而 问题 = 目标 - 现状,从而,易量化和不易量化的现状分别对应“百分问题”和“零一问题”。
产品经理遇到最多的应该是“百分问题”,比如如何改进推荐效果,让条目平均ctr从A提升到B;而像搭建今日头条的推荐系统,这样的“零一问题”只有少数人会碰到,所以本博专注更通用的“百分问题”展开讨论。
下节预告
而解决“内容审核”问题的关键就是如何量化现状?用什么指标衡量?具体讲,就是知道审核过程实际过滤掉了多少有害内容,还遗留多少有害内容?
下一篇我们用“天眼”内容审核系统为例,回答上述关键问题。