总括
SLR 是对特定研究领域内问题和解决方案的系统性概括,它能够帮助我们对感兴趣的研究领域在短期内建立起相对系统的认识。
通过文献检索,阅读理解所在研究领域的高价值文献及其引用,并从中归纳总结出问题和解决方案便能帮我们完成对 SLR 的撰写。
领域介绍
我曾供职于某知名社交网络公司,在产品的研发和运营中遇到的反垃圾(anti-spam)问题,让我对社交网络的反垃圾研究领域产生了兴趣。
我将通过完成 SLR,系统地认识该领域的关键问题和高价值解决方案,从而帮助我更好地理解、归纳、总结我在工作实践中遇到的相关问题,将解决方案应用到实践中的问题上,以及对解决方案进行改进
问题难点
- 反垃圾算法的识别率和误伤率
- 反垃圾系统的实时性和对整个系统的影响性
解决方案
基于用户行为的反垃圾算法
通过用户的操作及操作的先后顺序来判断一个用户是否是 spammer。例如,正常用户的行为模式是注册后开始浏览,spammer 的行为模式则是注册后立即发布内容。
基于用户上下文的反垃圾算法
通过用户在社交网络中特定场景下的固有特征,判断一个用户是否为 spammer。例如,用户是否设置了头像,spammer 通常不会设置头像
参考文献
[1]: NB Ellison, et al. Social Network Sites: Definition, History, and Scholarship[J]. Journal of Computer‐Mediated Communication, 2007
[2]: Ho-Yu Lam, Dit-Yan Yeung, et al. A Learning Approach to Spam Detection based on Social Networks. Conference on Email and Anti-Spam (CEAS), 2007