背景介绍
随着经营环境日益复杂、支付渠道不断丰富以及线上化支付习惯的形成,金融机构面临的风险也更加多样和隐蔽 ,因此对金融机构的反欺诈、风控能力的要求不断提升。反欺诈是交易的第一道安全防线,风控能力则是企业放大或收缩风险敞口的直接体现
在数字化转型浪潮下,完全依赖专家规则来进行风险把控的传统模式已经无法满足全面风险管理的诉求。随着大数据、人工智能等技术的不断发展,此类新技术为风控领域相关问题的解决提供了很好的支撑。为充分释放新技术红利,更好地满足风控需求、解决现有问题,中原银行结合自身技术优势自研了企业级智能决策平台。
传统风控系统所显露的不足
● 使用成本偏高。传统风控系统往往存在逐年购买授权的问题,增加了基础运行成本;系统运行缓慢和卡顿、数据处理慢等问题,无形中又增加了使用成本;软件厂家售后服务跟不上,致使企业运维成本增加。
● 缺少定制化服务。在应对企业独特管理模式、业务模式的时候,传统风控系统难以满足企业的个性化定制。
● 架构融合困难。随着信息系统的演进、架构发展、业务需求的复杂化,系统间的协作程度越来越高,传统的风控系统往往缺乏融入新架构的能力。
智能决策系统能力模型
传统的风控系统运行往往是单点的,很难结合大数据、人工智能、云原生等技术。专家规则实现了业务经验的表达、监管原则的落地,可以认为是底线,而结合大数据和人工智能可以实现不同目标客群的个性化风险防控、精准营销、智能客服等新生场景。因此在大数据和人工智能的加持下,风控系统变得更加博学和聪明,进而形成了决策能力。所以笔者认为智能决策系统至少具备以下几方面能力。
● 融合智能化能力。智能决策系统在满足传统专家规则表达业务逻辑的能力之上,应能利用大数据、机器学习、深度学习能力来实现对专家规则盲区的补充。不排除未来在专家规则的基础上实现决策的智能化与自主化。
● 数据及指标引用能力。规则模型的生效往往需要内外部数据(AUM、交易行为、征信、税务、社保……)的支撑,好的数据及指标能力的融入需要能够带给用户信手拈来的体验,而不是大海捞针的感觉。
● 多场景支持能力。完备的智策平台不仅要具备支持全链路风控体系的能力,还需要具备包括决策、开发、管理、运维以及后端分析、监控、跟踪等功能,以通过业务闭环能力来支撑营销、数据安全等业务场景。
● 系统协作能力。智能决策系统在批量规则模型下应能感知数据准备状态,在对接和发布服务接口时要有规范可依,甚至实现一键发布,还需具备在接口更新、删除时的回馈机制、应对方式、生命周期管理等等。
● 便捷运维能力。“人、圣贤、过错”之间有一套逻辑,“开发、漏洞、稳定性、运维”之间也是唇齿相依。好的运维能力可以提升服务在线率和用户使用体验,也是企业级产品的基本要求。
智能决策平台自主研发实践
企业级智能决策平台(以下简称“智策平台”)是中原银行自主研发的企业级决策服务开发和管理平台。在数据支撑方面,通过大数据平台数据的引进,丰富了客户评估维度,提升了对客户评估的精准度;在AI方面,通过引入人工智能算法,提升风控模型的精准度和覆盖度,提高了风险识别效率;在指标方面,通过对指标预计算,实现了跨渠道多指标的加工,满足了时间跨度指标的诉求;在交互方面,通过“拖拉拽”的方式将业务决策快速转换成可在线决策服务,降低了使用成本,适用于贷前、贷中、贷后、营销等多种场景。
1. 系统架构
智策平台由“三大引擎、一项能力”组成,如图1所示。“三大引擎”:规则引擎通过决策流进行执行顺序和逻辑定义;指标引擎实现了实时指标的定义、预计算,同时具备调用其他系统(如:反欺诈)指标结果的能力;模型引擎具备本地化运行PMML模型文件、Python文件的能力,同时可以调用现有机器学习平台发布后的模型服务。“一项能力”:服务编排能力是智策平台的又一项核心能力,组合了数据来源、数据归宿,以及三大引擎的运算能力。
2. 三大引擎
● 规则引擎:提供了决策集、决策树、评分卡、决策表等多种决策表达形式,提供了全生命周期的开发、测试、部署、运维能力。规则引擎底层基于RETE匹配算法来构建,执行过程中采用正向推理的高效模式匹配,具备效率高、吞吐量大的特点。使用完全可视化的规则定义方式,让不懂代码开发的业务人员也能轻松快速上手,提高了风险的应对能力和响应速度。
● 指标引擎:内存计算引擎采用了预计算的思想,具备对数据集进行模型构建的能力,实现了对跨系统数据进行不同维度、自定义时间段内的指标求和、占比、平均值等多种计算方式。此外,指标引擎还支持对接其他系统指标进行远程调用。
● 模型引擎:通过对用户上传的PMML模型文件、Python文件进行解析和运行,使智策平台具备模型算法的本地化服务能力,能够减少系统间服务调用,提升模型服务的实效性,充分发挥AI的价值。此外,模型引擎还支持直接调用机器学习平台发布后的模型服务。
3. 一项能力
一项能力是指对三大引擎的计算能力及数据进行编排的能力。编排能力支持多种数据源(如RESTful、MySQL、Oracle、Kafka等)的数据读取与写入,并提供了拖拉拽式的交互方式。底层对Java中的“Future”进行了封装和重写,打造了一个具备强大的并行执行、线程隔离、数据传递能力的DAG,完美解决了服务调用过程中的超时、重试、回调、分流、聚合等问题。
图5 任务开发能力
4. 云原生架构
智策平台是基于微服务的架构、以容器为运行载体、利用K8s作为容器编排的云原生的平台,除了具备支持资源弹性扩缩容能力外,还有很多自研的特色功能,比如:
● 流量动态管理。为了适配银行两地三中心架构,智策平台对SpringCloud Gateway核心功能进行重写,允许运维人员对机房整体流量进行动态调整,实现了系统升级完全不影响用户使用,提升了系统7*24服务的能力。
● 数据反压。结合缓存、梯度算法等技术,智策平台实现了微服务架构中数据发送方对数据接收方的处理压力感知,必要情况下数据发送方可以自动调整数据发送速率,有效避免接收方压力过大导致的数据处理失败、超时、丢失等问题。
● 服务平滑升级。规则模型上线过程中旧版本的删除与新版本的提交往往存在一定时间的服务不可用,智策平台通过计算模块分组、流量自动调整、滚动更新等一系列技术实现,保证了规则模型上线时候的业务零中断。
● 其他特色功能。为了提供更好的稳定性、使用体验、安全性,智策平台还有很多特色功能,比如:计算资源隔离、任务一键上线、权限多维管控等等。
5. 投产效果
目前,智策平台仍处在应用推广的初期,主要应用在信用卡、营销、贷后管理、运营、授信审批等场景,每天处理实时风控请求约5万次,每天处理批量数据约1000万条(12000条/秒)。
未来展望
智策平台的功能比较聚焦,通过与企业内部的机器学习平台、实时计算平台、数据服务平台等系统进行协作,组成一整套的解决方案,但还需在一些功能上面进行增强,比如:
● 增强智策平台全栈式风控能力,减少对相关系统的依赖,比如在数据的分析、案件分析等方面;
● 巩固三大引擎计算能力,进一步丰富决策能力,比如通过引入图计算、知识图谱等。
智策平台在近一年半的时间里经历了33次优化迭代,实现了从无到有、从能用到易用的蜕变,现已经承接了中原银行部分存量和全部新增的需求,也逐步实现了与AI、数据服务的融合。