2 我国个人信用评分发展的情况
关于个人信用评分的基本概念前面就介绍了这么多。下面呢我就跟大家聊一下我国个人信用评分发展的情况。
2.1 发展的四个阶段
很多人会认为芝麻分是我们国家第一个个人信用评分。这样理解可能是因为对我们国内的个人信用评分的发展并不是特别的了解。
我一般把评分的发展划分为四个阶段,实际上在早期的金融机构(这个图上写的是商业银行),实际上在金融机构那边很多,除了商业银行,保险公司现在都有这样类似的信用评分,当然早期可能是以打分表的形式出现的。
第二个阶段我主要是指试点的征信机构做的这样的评分,这是较早基于征信数据的评分开发的一个尝试。
第三个阶段主要想介绍下人民银行征信中心作为全国统一的金融信用信息数据库开发评分的这样一个情况。他和前面的试点就不一样在于,试点基本上是基于一个城市或一个地区这样一个开发的评分。而人行征信中心开发的评分就覆盖了几乎是所有的有信贷业务的人群,是真正意义上的全国性的个人信用评分。
第四阶段我想介绍下关于市场化的这些征信机构,包括芝麻、拉卡拉甚至包括京东等等这类机构评分的情况。
2.2评分卡制度
商业银行评分早期是打分表(卡)形式,基本上是某一个特征对应某一个分数,比如说单位的性质,如果是国家机关对应给一个分数,事业单位也对应相应的分数,不同的单位性质对应不同的分数,这种形式就是打分表或打分卡形式。实际上,评分卡是通用称呼,评分都可以用评分卡形式表现。尽管现在都采用统计模型方法构建模型,但为了解释和使用方便,也都以评分卡的方式出现。
有人说评分卡是落后的、早期的,而模型是先进的,这一点是不成立的。有的人认为这种方式不准,我个人不这样认为,这种评分卡很多是基于信贷员或风险经理的业务经验,不见得比模型的方式效果差。当然,这种评分卡可能存在一种问题,制定的标准执行上会因为个人的喜好而变,不像自动化的方式那么一致。所以在一致性和稳定性上可能存在一些问题,也会影响准确性。
2.3 试点信用机构评分
早期有两家试点的征信机构,一家是上海资信,上次在介绍征信也特别介绍过上海资信。上海资信是人民银行和上海市政府合作成立的征信试点机构,它采集上海的所有的金融机构金融信息,特别是信贷信息,包括上海市的一些政务方面的信息,如公积金和社保,它主要服务于上海市的所有金融机构。最早在02年的时候就开发了个人的信用评分,当时叫做个人综合信用管理评分,设的分值区间是-1000——1000,这个分值很有意思,它实际上相当于两个评分,但把它们放到一块去了,一个是-1000到0,这个分是针对跟金融机构尤其跟银行是没有打过交道人的评分;0到1000是给跟银行打过交道的人的评分。这个评分后来把分值区间调整到0到2000,实际上仍然是一样的,只不过是统一加了1000。以前有人有这样的观点,认为只要跟银行打过交道的,你不管是办过贷款、信用卡,甚至只有过存款业务,即使逾期没还都比没有跟银行打过交道的人要分数要高。我个人是不太赞同这样一个观点。实际上,FICO等机构主要还是对有信贷机构,或者是信贷机构比较丰富的人给打分,而没有跟银行打过交道,或者说跟银行打过交道的时间比较短,也就是我们所说的薄文件的这样的人,由于资料或信息比较少,对这部分人也是不评分或者专门信息进行评分。这两者实际上是有一些区别的,不给评分是因为信息比较少,而无法准确的评分,而不是因为这些人由于没有跟银行打过交道,他们的信用水平就低一些。上海资信非常可惜,这个评分没有维护,现在已经不再使用了,他们的官网也没相关的这个评分信息了。鹏元征信征信在05年4月底的时候开发过个人的,叫个人综合信用风险评分,好像这个评分还在对外进行服务,叫做鹏元800,它的分值区间我过去在查的时候好像是200到800这样一个区间,但是在现在的一些网站和资料上是320分到800分,每80分有一段,最低为F段,最高是A。补充一点的是,上海资信的评分实际上是前面讲的一家叫做环联的机构开发的,是环联在澳大利亚这个机构开发的。
征信中心也有一个评分,但可惜的是一直没有对外。从08年我到中心开始,就开始带着做个人信用评分。关于征信中心能不能做评分的争议很大,尤其是征信管理条例出台后有许多的声音。一种说法是征信管理条例规定了征信中心是金融信用信息基础数据库,征信中心并不是一个征信机构,而是负责管理和维护数据库,不要老是想到挣钱,没有必要做这一类的增值产品,而应该好好的把金融信息,采集、整理、加工好,增值的产品交给市场去做。也有说法即使征信中心是个征信机构,但是征信机构和评级机构之间如何协调,征信机构主要强调提供的信息的真实、客观、权威,如果去做评分,评分这样的一个事情,不管基于专家意见还是统计模型,它或多或少都会有主观性的存在,即使是统计模型,在建模过程中,选择变量上,都会有建模人的主观意思在里边。那怎么保证征信机构在提供的产品具有这个客观、公正性?第三种说法实际上涉及到这样一个问题,征信中心把金融数据都垄断了,如果把评分都做了,以后市场方面要怎么发展呢?尤其是作为征信中心这一个事业单位,他的效率都受到大家的质疑,当然也存在也存在一个与民挣利的问题。所以综合上面的,大概有这几种关于征信中心是不是应该做评分的一个说法。目前我个人是认为,征信中心做评分的确是不太合适的,包括我在人社部给他们介绍征信和评分的时候,我也在跟他们说,希望他们在做评分的时候一定要谨慎。因为在做评分的过程中,尤其是政府机构或者是事业单位在做这个评分时,有很多社会问题在里边。
但是当时征信中心为什么会要做评分呢?这有其它原因在里边。征信中心是一个经费自理事业单位,中心人员工资都是要靠自筹,我记得大概是在08年的时候,大概是有3个月的工资没有按时发放,当时中心的领导也比较着急,考虑到信用卡在中国起步发展阶段,急需信用评分类似产品。所以中心希望通过评分产品来解决经费紧张的问题。
2.4 发展
2015年征信局通知八家征信机构筹办之后,一些征信机构也陆陆续续的推出了自己的评分。实际上我对这个一直很纳闷,为什么这些征信机构都是先推出评分,而不是认真地做好数据的采集和共享?有人解释说评分的风险小,不用担心个人信息泄露。评分确实有这样的一个优势,其结果只是一个分值,不会泄露更多的个人信息。但是征信局筹办的通知都给了,这些机构完全可以信息的采集、整理、加工、共享方面做的更好。也有说这些机构是顺势推出来的评分,本来他们自身的金融业务内部使用的评分,我觉得这样对征信未必会有帮助,据说的确也有评分玩的有点过火,受过监管机构的警告。当然也有人说,由于没有征信中心的数据,尤其是信贷这方面的信息,做出的评分的效果都不是特别理想,希望通过这样一种方式推动征信中心数据的开放。估计这些都是玩笑,但我确实觉得征信中心应该开放数据给市场机构的,由市场机构去开发各类的信用工具,这样可能会更有效率,也更有创新,当然也应该包括开放给高校的老师和同学一些脱敏数据供产学习、研究使用。
目前市场上有许多所谓的食用评分,大都需要市场的难。就我目前了解的情况,作为征信机构的个人信用评分,除征信中心之外,效果都不是很好。当然这里面并不是技术的原因,主要还是数据的问题。有机构对外称KS40多或者50多,但是其它机构验证时,结果往往并不理想,好一点的能到30多一点,低的甚至只有十几。一般而言KS值应该在35左右才可以应用。
问答锦集
问题1:请问,评分体系在p2p网络金融中的运用前景?
答:应该说在P2P中,评分是能够发挥其作用的,但是关于P2P对客户风险的识别,不可能完全靠评分把所有问题解决。尤其是P2P网络金融这一块,比线下金融业务面临更高的风险。评分的作用是给P2P机构多一道风险把控的工具。未来我也会给大家介绍评分的应用。评分的作用能够发挥有一定的作用,但绝不是全部。
问题2:我有一个问题,庄博士,您好,我想问的是基于逻辑回归技术的FICO评分模型和基于阿里小贷的信息不对称模型,哪一种方法更好呢?
答:去年在征信中心开了计量风险模型研讨会,会上阿里、腾讯等机构都参加了,其中阿里的团队关于计量风险模型还是不错的。但是至于哪个模型(算法)比较有效,我是这样的理解的。FICO一直采用logistic回归这个模型,在数据处理方面的确有其独到之处,加之logistic回归得到的结果较稳定容易解释,该算法仍然是个不错的选择。前期招行也问过我类似的问题,它们采用了除了logistic回归之外还用了向量积和随机森林和一串算法等各方面都做了尝试,但是结果没有什么明显提升。当时我主要围绕数据属性、算法的使用、参数的调整等方面做了解释,目前觉得主要问题还在数据,在以是否按期还款为目标的模型中,信贷信息是较强的信用信息,其它信息可能相对弱一些,所以有不少机构会研究其它算法或者理论,所以我很难说哪种算法比较合适。我刚刚提到的几个问题,比如说可解释性问题,目前其他算法在可解释的问题上,在稳定性的问题上可能还需要进一步探讨。
问题3:互联网机构拿了征信牌照,基于互联网行为数据建模和第三方征信机构的传统评分办法,哪个置信度更高?互联网方式效率更高
答:基于互联网数据做得评分,那个效果更好,哪个效率更高,我觉的单纯从业务角度看,很难说哪个更好。但是未来从监管角度来说,我相信对公平性的要求会加强。这样的话,基于互联网行为数据的建模关于在解释信用问题上可能会有很好的突破才可以。
(下篇:征信发展与模型讲座个人总结与解析版)