决策引擎近几年听得比较多,那么优秀的决策引擎到底是怎样的呢?它包括以下几点:
灵活可配——不但可配规则,还可配规则的字段和权重。业务友好就不用说了。
快速部署——配置好的规则模型可实时生效,如果涉及一般规则修改时,可做一个灰度部署。
决策流——可把不同的规则和模型串到一起,形成一个决策流,实现贷前、贷中、贷后的全流程监控。它要可实现对数据的按需调用,比如把成本低的数据放到前面,逐步把成本较高的数据放到后面。因为有些决策在前面成本较低的数据下已经可以形成,就不必调用高成本的数据。
AB测试和冠军挑战——对于规则修改、调优时尤其重要。两套规则跑所有的数据,最终来比较规则的效果。另一种是分流——10%跑新规则,90%跑老规则,随着时间的推移来根据测试结果的有效性。
支持模型的部署——线性回归、决策树等简单模型容易将其变成规则来部署,但支持向量机、深度学习等对模型支持的功能有更高的要求。
经过以上手段,基本可具有一个很强的力度来排除信用风险,以下便是信用评估阶段。
评分卡模型
评分卡分为申请、行为、催收评分卡。申请评分卡用于贷前审核;行为评分卡作为贷中贷后监控。它可通过历史的数据和个人属性等角度来预测违约的概率。信用评分主要用于信用评分过程中的分段,高分段可以通过,低分段可以直接拒绝。
因行业、客群与业务不同,评分卡标准也有所不同。对有历史表现的客户,我们可将双方的XY变量拿出来,进行模型共建,做定制化的评分。构建评分卡模型,目前传统方法是银行体系中使用的:数据清洗、变量衍生、变量选择然后进行逻辑回归这样一个建模方式。
核心技术与挑战
在目前围绕大数据、大数据决策为核心的风控技术体系中,整体的数据量达到一定水平,存在的挑战将会是数据的稀疏化。随着风控业务覆盖的行业越来越多,平台间的数据稀疏问题就越明显。
此外,对于大数据来说,具有数据和大数据决策,却没很稳定的落地平台也不行。大数据应用要做到完整,还需要符合以下要求的平台:1.容纳量,能容纳特别多的数据;2.响应:任何决策都能实时响应;3.并发,在大量数据并发时也能保持调用。