原创作品,转载请注明出处。
关注公众号「热薯条」获取更多精彩文章。
前言
上一期我们介绍了如何对单个维度的数据提取异常值,并应用到了我们的模型上。
这一期我们将介绍通过定义找到的猫币黑市黑产规模,并对我们的定义/甄别手段的准确率进行评估。
猫币黑市黑产规模
我们将上一期的定义加入到全局中,甄别出来:
人数规模
可以看到少数的用户为多数的用户提供猫币
经过调查,多数用户在黑市上收到猫币前有充值活动,而其中绝大多数用户在黑市上收到猫币的周期里停止充值,或减小充值。这对平台的损失很大。
案值
通过对大R,“银行”,贷方经手的猫币进行统计,我们得到他们平均接手的猫币金额超过两千万猫币。
货币乘数
我们还可以从另外一个角度来看待这个问题,引入经济学上的货币乘数概念到我们的猫币体系中:
货币乘数概念
正常场景:
在上图中,用户A和用户B分别与平台进行交易,需求分别得到满足,这个时候 m=1
用户通过红包转移资金时场景:
在上图中,用户B的需求是由用户A来满足的,而平台内流转的猫币是平台发行猫币的两倍,这个时候 m=2
我们可以理解为在这种情况下,平台少赚了 50% 的猫币抽成。
货币乘数运用
而我们上文提到的案值——两千万猫币,实际上就是在平台内多次流转的。
我们再使用公式,最终得到在猫币黑市加入后的货币乘数为 1.33, 也就是说,如果我们杜绝了猫币黑市的行为,我们将会有 33% 的额外收入。
甄别手段评估
我们通过将以下五个维度来评估一下甄别手段是否准确。
刷接口行为
上图中,1为未刷接口,2、3、4为刷接口,可以看到右边三类(分别为“银行”,贷方,储方)刷接口的比例
竞猜次数
登陆次数
使用pdft个数
发废弃弹幕次数
由于原始数据过于离散,我们对以上所有数据都进行log处理,从而加强可视化 。
由以上四张图我们可以看到,全局样本频率最高的数据都集中在较小的区间内,而贷方是三大类角色中最接近全局样本的,储方和“银行”的行为数据最偏离全局样本,且都集中在较大的区间内。
我们可以看到猫币黑市角色的定义确实是甄别了一些在行为数据上有异常的用户,这更加确凿了这些角色用户的嫌疑程度。
总结
至此,我们的研究就结束了。
我们发现红包场景中黑产情况恶劣,深入调查以猫币黑市为形态的黑产,其中涉及金额巨大,人数较多。
同时,在挖掘过程中还发现了其他种类的黑产,未来还可对刷人气、刷礼物等不同形态的黑产作更深入的针对性研究。
参考文献
[1] Krugman & Wells. (2009) Macroeconomics. Chapter 14: Money, Banking, and the Federal Reserve System: Reserves, Bank Deposits, and the Money Multiplier. pp. 393–396
[2] Mankiw. (2008) Principle of Macroeconomics. Part VI: Money and Prices in the Long Run: The Money Multiplier. pp. 347–349)
更多精彩推荐:
猫币黑市第一期——通过大数据,机器学习揭露互联网直播行业黑产
原创作品,转载请注明出处。
关注公众号「热薯条」获取更多精彩文章。