信用评分工具

在传统的信贷审核中，通常由信贷审批经理根据自身经验同时基于借款人提交的资料进行审批判断，显然随着计算机及互联网的普及人工审批在时效上和效率上显出弊端。信用评分正是出于解决这些问题。

信用评分模型是评估贷款申请人的资信状况来预测申请人未来验证拖欠或坏账概率的模型。

CAB414A6-4844-4F1C-827A-A3A59F41440C.png

最有效的风险管理莫过于把风险过高而收益不能对称的申请者拒之门外，因为一旦高风险的申请人获得信贷，其他管理手段只能减少损失而不能避免损失。有研究表明，80%的风险来自申请阶段，而申请后（贷中、贷后）风险管理只能管理到20%的风险。

信用评分模型的含义

信用评分模型实际上是一种用于个人信用风险控制的数学模型，它利用数据挖掘技术，对金融机构大量客户的历史数据进行分析，寻找有关客户信用风险的特征和规律，建立相应的数学模型，对新申请者或已有客户评估风险。如申请风险评分模型、行为评分模型、催收评分模型、欺诈风险评分模型等。

信用评分卡的开发流程

模型样本

选取好的样本是开发模型的首要环节。建立预测模型的前提是客户未来的行为模式与过去相似，而且这种行为模式可以用恰当的统计技术提炼和总结出来，所以可以用过去的数据来预测未来。

随机抽样：是在确定样本规模后从总体中完全随机的抽取，每种类型的个体在样本中的比例与在总体中的比例是一样的。

分类抽样：首先根据模型的需要确定样本的类别，对每一类别的样本分别确定其抽样个数，然后在每一类别内部随机抽取所需的样本。由于每一类别的抽样比例可能不一样，所以必须给每个样本类别设置相应的样本加权数。例如：有100万个账户，“坏”的账户占2%（98万个好账户，2万个坏账户），从中分类抽样“好”账户7000个作样本，样本加权数为980000/7000=140（每个“好”的样本个体代表总体中140个同样的好个体）；从“坏”账户里抽取3000个作样本，样本加权数为20000/3000=6.67（每个“坏”的样本个体代表总体中6.67个同样的坏个体）。

在绝大多数的模型开发中，所用的方法都是分类抽样。为了使样本量充足，一般“好”的样本在2000-3000个以上，“坏”的样本在1000-1500个以上。

模型变量

评分模型的变量主要有两种：表现变量（因变量Y）和预测变量（自变量X）。

表现变量是模型所要预测的结果。预测变量体现着与目标变量的相关性和逻辑因果关系，来源于申请表中的原始数据及征信记录。

以申请评分模型的为例：

1.表现变量

3期拖欠以上、呆账、破产的账户定义为“坏”；
未拖欠或1期拖欠的账户定义为“好”；
2期拖欠的账户定义为“不确定”，被排除于模型之外；
具体

2.预测变量

反映申请者未来还款能力、还款意愿及稳定性。

一是申请表上申请人信息，如年龄、性别、学历、职业、收入、是否拥有房产等信息；
二是关于汽车贷款本身的信息，如首期付款额、贷款价值比、贷款期限长短等；
三是申请人在征信机构的信用历史记录信息。
模型分组

分组是把总体数据分成几个具备同质性的群体，群体内部的账户具备相似的行为特征，群体之间的行为特征差别较大，最终从候选变量中以数理统计方法选择若干变量组成完整评分卡。

模型制定

在确定了样本、界定了表现变量、提炼了预测变量、决定了模型分组之后，下一步就是以适当的统计方法制定具体的评分模型了。

1）分析单个变量的预测能力

分析单个变量的预测能力，其目的是发现具备强大预测能力的变量作为模型的候选变量，剔除不具备预测力或预测力极其微弱的变量，以缩小候选变量的范围。

分析单个变量的预测能力

把过去6个月的平均付款比例划分成8个栏位，每个栏位都有一定数量的好账户和坏账户，从“坏”的比例上看，0%付款比例的坏账率最高，达14%，随着付款比例的提高，坏账率逐步下降，付款率达100%的账户群，其坏账率最低，不到1%。我们看到这个变量能有效地分辨表现变量，其预测力强。如果反过来，各个栏位的坏账率大体相同，或无规律可循，则说明没有多少预测力，可以删除。

2）减少候选变量的数量

通过分析保留下来的具备较强预测力的候选变量数目往往还是很庞大，必须把候选变量进一步分组，每一组之内变量间的相关性很高，组与组之间变量的相关性很低。然后从每一组变量中选择预测力最强、信息最有效的一个变量作为模型候选之用，这样可以大大减少候选变量的数目。

可以用来进行变量分组的常用统计方法有相关系数分析、变量类聚分析、因子分析、主成分分析等；

3）选择适当的模型方法

具体模型方法的选择必须根据模型的性质、分析人员的经验和技能、系统实施的方便程度来决定。例如，对于申请评分模型，最流行的是逻辑回归模型，对于欺诈风险评分模型应用神经网络模型较多，对于催收评分策略应用决策树模型较多。

4）确定模型的变量组合和权重

不管运用何种统计方法，最终从候选变量中选择一定组合（通常8-15个变量），进入最终的模型，并且根据统计原理分配相应的评分权重。例如行为评分中从反映历史拖欠行为、消费行为、欠款行为、付款行为等各方面选择一些预测变量强、相关性低的变量构成一个信息量丰富的变量组合。

模型校验

在完成模型的制定以后，如何衡量模型预测能力的强弱呢？一般来说，在模型的开发阶段，模型的检验有两种方式：样本内检验和样本外检验。

利用模型开发所用的样本来对比预测情况与实际情况的差别，属于样本内检验；

利用事先预留的、不用于模型开发而只用于模型检验的样本来对比预测情况与实际情况的差别，属于样本外检验；一般来说，预留的样本占总样本的20%-30%。

常用的模型检验方法有：

交换曲线
K-S指标
区分度
拟合度曲线

E34AA192-8A8E-43CC-9B16-306B8C9B8CC9.png

前三者主要检测模型对好账户和坏账户排队区分的效果，即随着评分的上升，好的比例也上升，低分和高分有效地把坏账户和好账户区分开来。拟合度曲线则对比预测坏账率与实际的坏账率之间的准确程度。通常信用评分模型的首要目标是好坏的区分效果，其次才是预测的精确程度，因为哪怕模型预测坏的概率不够精确，但如果能有效地把好账户和坏账户区分开来，瞄准和开拓好账户、拒绝坏账户，也能达到利用模型进行风险管理的首要目的。

最后编辑于：2017.12.22 18:08:11

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 203,772评论 6赞 477
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,458评论 2赞 381
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 150,610评论 0赞 337
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,640评论 1赞 276
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,657评论 5赞 365
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,590评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,962评论 3赞 395
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,631评论 0赞 258
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,870评论 1赞 297
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,611评论 2赞 321
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,704评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,386评论 4赞 319
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,969评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,944评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,179评论 1赞 260
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 44,742评论 2赞 349
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,440评论 2赞 342

信用评分工具

信用评分工具

信用评分卡的开发流程

模型样本

模型变量

模型制定

推荐阅读更多精彩内容