之前有句网红语,说你要了解一个人,要看他的朋友,看他的对手,看他的配偶。其实这句话背后讲的是,透过一个人的社会关系网,你可以了解一个人的真实情况。
真实情况很重要,在需要人与人接触的场景中,真实能提升效率,避免风险。
1、知识图谱的优势
以前反欺诈只采用基于规则的方法,而没有使用关联分析技术去侦测身份和关系风险。
知识图谱利用大数据收集的大量异构、多样化的信息,包括可交叉验证信息主体所提供的信息以及第三方信息来源的真实性,使用关联分析技术,全方位描绘一个人的真实数据与社会关系网,使得反欺诈识别能力更高。
2、场景应用
行业应用包括但不限于:
招聘,相亲,借贷,征信,刑侦,投资,融资,招标。
也就是银行、保险、电信、零售、公安、政府等各行业中的企业。
场景应用包括但不限于:
1)识别数据造假:
当融合来自不同数据源的信息构成知识图谱时,有一些实体会同时属于两个互斥的类别(如如同时在两个不同的城市工作),或某个实体所对应的一个属性(如同一个人的住址)对应多个值,这样就会出现不一致性,这个不一致性即可判定为潜在的可疑点。
通过这种不一致性检测,我们利用绘制出的知识图谱可以识别潜在的欺诈风险。
在P2P行业,欺诈风险主要的骗术包括个人信息造假、工作单位虚假、代办包装、虚假联系人、组团骗贷等。
2)识别组团欺诈
图结构带来的天然关联检索的特点,知识图谱可以识别潜在的代办包装或是组团骗贷。
组团欺诈有个特点:部分信息会被团体共享,那么共享的信息使得他们的知识图谱会有比较多的关联关系,从而识别出风险。
比如利用征信公司提供的欺诈数据,拥有的代办包装公司数据,互联网公开欺诈黑名单,行业黑名单联盟等数据开发了大量的标签数据,对实体(包括公司和人)贴上标签,例如逾期,虚假手机号,代办包装或是组团骗贷等标签。
当借款人进行申请贷款时,如果我们发现他和黑名单的人具有较多的关联关系,那么这个人有很大的可能是欺诈,从而识别出风险。
3)辅助信贷审核:
基于知识图谱数据的统一查询,全面掌握客户信息;避免信息孤岛造成信用重复使用、信息不完整等问题。
4)失联客户管理:
挖掘出更多潜在新的联系人,从而提高催收的成功率
3、知识图谱的数据展示
数据展示人物实体之间的关系结果、风险警告以及可视化社会关联。反馈内容包括但不限于:
人物的基本信息、社会关系结果、风险警告、不同实体之间的关联,是否有可疑的共享身份信息网络,对隐蔽关系的搜索,是否有过欺诈行为等。
针对不同行业,可以给出关系驱动的预测性分析模型,如欺诈团伙的模型分析。
4、落地场景举例(来自FICO案例)
1)面向保险的索赔欺诈:
帮助医疗保险、财产和意外伤害险及车辆保险公司检测串谋式索赔欺诈。 通过检测和关联共享身份信息,跨孤立数据发现欺诈团伙之间的联系,从而揭露个体欺诈犯以及他们之间的关联。
2)面向医疗的服务欺诈:
主动识别潜在欺诈团伙之间的关系、关联、互动及隐藏的信息共享模式,其中包括:共享的病患、提供商和不当关系,以及收款人、企业、资产、亲友和同事之间的关联。
3)面向零售商的退货欺诈:
通过构建客户、组织、地点、产品和事件的360度视图,以及关系驱动的预测性分析主动识别有组织的欺诈。
5、数据源
数据源包括但不限于:
银行、征信公司、保险行业、互联网公开欺诈黑名单、行业黑名单联盟、社交媒体信息等。
6、信用评分标准
以FICO和芝麻分举例说明,以大数据为基础的信用评分考量维度和信用等级划分。
FICO(全称Fair Isaac Corporation,中文名为费埃哲公司)致力于利用大数据和算法预测消费者行为,通过提供FICO评分和决策管理系统的方式,为企业提供决策依据。
支付宝的芝麻信用考量维度有:
身份特质、履约能力、信用历史、人脉关系、行为偏好。
身份特质的收集内容包括:
1)基本信息
- 学历学籍
- 地区
- 院校名称
- 当前状态(在读/ 毕业)
- 最高学历
- 毕业时间 / 入学时间
单位邮箱
职业信息
绑定职场社交账号(领英、钉钉、名片全能王、脉脉、赤兔)驾驶证
2)资产情况
- 车辆信息
- 房产信息(房产证/不动产证)
- 公积金
3)信用消费
- 信用卡消费
添加账单邮箱