中国早年的消费金融市场基本是银行消费信贷一家独大,消费形式主要以信用卡为主。近年来,随着电商平台和互联网消费金融的迅猛发展,消费金融市场呈现百花齐放的格局。
消费金融行业的早期发展也出现过授信过度、息费过高、个人信息保护不足等问题。在崛起的信贷市场中,很多新技术得到越来越多的应用,要在消费金融领域立足并长远发展,风控是关键。
本文详细介绍了每个环节中需要注意的风控点,以及“冠军挑战”理念在金融风控中是如何被应用的。
01 人、商户、场景的风险点:层层把控
用户在消费时,一般会涉及消费者、商户和场景三个元素。风控也可以把这个消费链条通过这三个元素拆开,分别探讨针对每一个元素应该怎么做。
从消费者角度来看,消费者的风险一般可分为欺诈风险和信用风险,简单来说,就是这笔钱消费者“想不想还”(欺诈风险)和“能不能还”(信用风险)。
衡量欺诈风险的一个核心环节是,判断一笔信用消费申请是否由信用申请人本人完成的,这时,常见做法是,让消费者提供一些身份证明相关信息,以及一些的第三方数据授权。相对越复杂的授权方式,如人脸识别等。核实的可信度越高的同时,对于客户体验的影响也会增加,这可能导致客户流失。所以选择一个可靠、体验好、流失率低的授权核身方式,是一个需要综合考虑的问题。
从经营风险角度来看,例如,用户通过分期完成了一笔交易,但是分期周期还未结束,这家商户就倒闭了——这种情况在教育、美容、健身场景下比较常见。如果一个12期的课程,消费者只上了3期该店就歇业了,消费者有时会认为,之后课程的钱就不用还了。
虽然法律上这种行为是违约的,机构可以对其进行催款,但是从实际情况和社会舆论的角度来看,大多数情况下去做这样的催收是“不好”的事情。企业的经营风险往往是做风控时需要前置考虑的点。
从场景风险角度来看,场景风险就是判断这个消费环境是否是真实的。通过一个虚拟的、伪造出来的交易场景套取交易激励甚至授信额度,是防控的重点。这类似于传统信用消费的场景,如果一张信用卡在国内不常被使用,却突然有一天在国外一家奢侈品店有一笔巨额消费, 此时大概率情况下这笔交易会受到限制,或者银行会通过电话等方式,核实这笔交易的真实性。
02 数据、策略、模型的“冠军挑战”
信用消费风控中的每一项打分、每一个预测都应该是“数据驱动”的,这也意味着数据源本身非常重要。风控方可以对所采用的数据源(以及相应的策略和模型)用“冠军挑战”的方式筛选。
在接进数据时,风控方会和数据方做一些测试,但是这个测试通常是拿历史数据来测的。这就伴随一个问题:以往测试有效果的数据,是否在今天判断新进来的客户上同样有效。任何情况下基于历史做出的假设,以及在以往获得的经验,不一定完全适用于未来。为了控制未来和以往经验之间的差别所导致的决策风险,就需要设计一种“冠军挑战”机制。
“冠军挑战”是这样操作的:把目前表现理想的策略、数据和模型定义成“冠军组”,这个数据可能在以往半年的时间内、在几批用户上是有效果的。要判断这个“冠军组” 是否适用于一批新的客户,就在这个数据源接进来之后,用测试组来测试其在当前这批客户上的表现。
测试开始之后, 业务在测试组里自然增长,一段时间之后,这策略的效果就能体现出来了,这时就可以根据这个策略的实际效果来判断其是否真的在新客户上有效。
在当前策略、模型、数据的产出实际表现之前,它都是“挑战组”。“挑战组”如果能达到预期,或是比现在的“冠军组”表现更优,就可以正式把这个“挑战组”的内容升级,与“冠军组”做对比。
这样就永远会存在一些组不停地挑战现在的“冠军组”,它们要拿出更好的表现才能击败“冠军组”成为新冠军,而最后被智能信贷数据决策系统使用。持续保持冠军挑战的策略机制,可以形成内部竞争,提升策略效果,形成持续优化的有效机制。
03 思考:风控的过去、现在和未来
当然,这些实践是我们基于目前国内的数据可获得性、互联网生态环境,并结合金融风险的本质特征所探索出的道路。
基于数据和技术驱动的方式管理风险,是行业发展的一个不可逆转的大方向,金融机构要主动拥抱这个发展趋势。同时也要认识到,目前国内的征信体系、大数据体系和数据环境正在逐步建设完善,各种数据的质量、可靠性也各不相同,参差不齐,这对于模型能力和技术能力带来很大的挑战。
一方面,需要有收集、整理、汇总海量数据的能力,同时也要有识别、清洗“脏”数据,沙里淘金的能力。直到现在有观点认为,风控可以完全依赖于数据和模型,不需要人的经验——这显然是一个极端。
笔者认为,现在的环境还没有完全达到机器决策能完全替代人为判断的程度。对于一些问题,比如控制数据偏差或控制由于数据本身不佳而导致的模型风险,人为的调整和决策是很有必要的。
消费信贷这个行业已然存在几百年,银行家们积累锤炼出来的风险管理的理论和原则现在看来仍是行之有效的。这种原则和理念对于发现和纠正数据偏差带来的模型风险和决策风险还是非常有用的。
观察风控发展的另一个角度,是模型技术和模型能力的演进。从传统的基于经验的专家模型,到量化的线性评分模型,到现在复杂结构的非线性模型,越来越复杂的模型能够越来越精细地刻画客户的风险特征,但同时模型本身复杂度增加导致模型的可解释性越来越有难度。
如当下被热议的机器学习、深度学习的模型基本上是“黑盒子”。多层神经网络结构复杂以至于没有办法直观理解其效果的来源。虽然这些模型目前的结果可能是“好的”,但这样的模型和结构是否能够复制和随着时间变化延续,有很大的不确定性。
对于模型策略的稳健性、可扩展性无法把握,甚至于监管要求的可解释性都无法很好的满足。这也是现在业界和监管机构都需要探索和解决的一个难题。
来源 | 本文节选自PINTEC读秒首席风控官童海为《清华金融评论》第1期封面“消费金融”专题的供稿,略有修改删节。
免责声明:转载内容仅供读者参考。如您认为本公众号的内容对您的知识产权造成了侵权,请立即告知,我们将在第一时间核实并处理。
微信公号【金融科技安全】专注金融科技安全领域,分享有价值的行业风控干货,多角度洞察行业热点,发布最新行业安全资讯。