01
今天就是一年一度的七夕节,又会有无数单身汪在这一天饱受狗粮的折磨,这段时间社交软件的活跃度相比也有大幅增长的现象,想必这一定是单身汪们在做着垂死挣扎,期望在这一周中收获另一半。
对于社交平台来说,“机遇与挑战”并存,日活跃用户大幅增加带来变现和盈利的可能性也增加,同时,垃圾用户及恶意营销也有机会乘虚而入。
02
一直以来,经常会有平台被强制下架,其中社交软件或者带有社交属性的软件占了很大一部分份额,下架原因无外乎是涉黄。
尽管社交软件或者带社交属性的软件本身合规合法,但是一旦被扣上涉黄的帽子,就会被勒令下架或者整改。
03
为什么社交软件总是容易充斥涉黄信息呢?
因为社交软件内容发布的门槛是最低的。事实上只需要手机号,任何人都可以进入到社交平台发布信息,而且正因为社交平台特有的包容性,例如不强制实名、不要求对身份验证等,无疑给垃圾用户提供了便利,内容失控也成为了足以“溃千里之堤的蚁穴”。社交平台中,包括头像、用户昵称、评论区、私聊,只要是有文字和图像的地方,都必须严加防控。
04
4个月前,国家网信办宣布启动针对即时通信工具专项整治行动,针对后者传播违法违规信息、匿名注册、欺诈诱骗、为线下违法违规活动提供平台服务等行业乱象,进行深入巡查和测试。
根据网信办公开的信息,首批清理关停“比邻”“聊聊”“密语”等9款传播淫秽色情信息,或为招嫖卖淫、售卖淫秽色情音视频等提供推广和平台服务的即时通信工具。
05
社交平台已经成为因涉黄涉骗被下架的重灾区,那么有什么方法可以遏制这股“下架潮”?
社交平台必备的内容输出属性,决定了平台在内容管控这方面不可撼动的地位。
那么无论是UGC社交内容运营 APP还是陌生人交友婚恋平台 APP,都亟需内容管控的加持。
内容管控相对来说,最完备的一个思路就是:“账号准入+敏感词策略+决策引擎+举报机制”。
06
账号准入体系:用户在注册阶段拦截黑产用户。
基本上微商、博彩引流、以及涉黄涉政内容发布的这些账号,都是通过卡商和接码平台批量注册使用,获取数百万的验证码。这就表明这些手机号本身,就有足够的特征和维度。卡商或者黑产获取手机号都是多次利用,所以这些手机号一般都是被标记过的。
因此,在注册的时候,建议对手机号加一层准入规则,常规的手段是禁止小号和虚拟号,进一步的话就需要采购第三方账号侧反作弊套件,大多就是输入手机号+IP,可以返回一个标签,关于手机号的画像,也会有风险分。
业务可以根据返回的值判断风险,现在阿里有的是电商黑库,腾讯有社交黑库,网易有游戏黑库,雷木数据数据有运营商维度黑库,都是T+0实时更新。
同时黑产获取手机号成本较高,黑产的手机号做不到实时更新,所有基本通过手机号就可以识别98%以上的黑产,企业只需要拿着手机号去测各家的数据的准确率和误杀率即可。
在用户注册的阶段添加一个护城墙,基本上黑产是没有越过的,因为绝大多数黑产没有这样的技术实力。
07
敏感侧策略:现阶段企业主要使用的是外采词库和内部自己维护的动态词库。
外采一般是通过第三方的安全厂商API接口使用的,可以嵌入用户录入的文本,这样就可以快速识别违禁词语。
不过建议企业还是自己组建词库,需要一套应用策略,包含敏感词收集策略、敏感词应用策略、敏感词处置策略。
图片违规主要分为两种,第一种是黄恐暴类图片,图片本身就有问题,第二种是图片本身没问题,但是图片里面水印或者信息会有加微信引流的信息。
08
决策引擎:基础逻辑就是通过算法和策略提取用户的特征,在用这些特征计算独有的风险分。
例如如何判断一个人是美女,我们就需要对注册进来的女孩子提取特征,可提取的特征维度有很多,最简单的就是身高、体重、三围等等,一般的算法工程师通过这个三个维度来计算个分值,就用这分值来判断是否是美女。当然也会有算法工程师提取更多维度,比如容貌、身高、年龄、三围等等,再通过这些维度计算一个分值,用来计算是否美女。
理论上,企业提取的维度越多就判断的越准确。一般企业的风控分析师会提取数十万个特征,再通过这些特征判断用户是否违禁。
09
举报机制:企业需要一个有效的举报机制,通过忠实用户的举报来防范这些违禁用户。忠实的用户看到违规内容都是会去举报的,然后再转到人工审核机制,就可以及时地封禁这些用户和内容。
10
说起来简单但是做起来却是很难,这也是为什么持续会有企业被“安排”。小微企业一般外采账号准入体系和文字图片识别就足够企业使用,中型企业和小微企业比较类似,只不过需要账户准入体系的维度加大,就可以足够去攻防,大型企业就需要添加行为特征和设备的一些信息去攻防。
今天的夜话接近尾声,雷木数据在此再次祝大家节日快乐!