特征工程是所有机器学习的最重要的一步。如果要对特征工程梳理最基本的操作,考虑以下四步:1.编码2.分箱3.自动化特征选择(单变量选项,模型选择,...
之前的文章提及数据集的大小(缩放)对算法的准度的影响比较大。例如BP神经网络对输入“千”和“万”级的数据,准度相差一倍。但是有时候不做处理,哪怕...
首先本章节解决这3个问题: q1:训练集和测试集到底是什么关系? q2:训练集愈来愈好,是不是代表模型越来越好? q3:如何选取最优模型,如何调...
第一个应用:鸢尾花分类 需要的几个python库 scikit-learn:两个 Python 包:NumPy 和 SciPy。NumPy包括多...
本篇由两个部分组成:一概述默认信用风险的区别与联系;Z计分模型用最简单的线性模型计算分数的阈值区间,判断企业违约的可能性。Credit Risk...
本文描述的是Z计分模型,该模型主要用于预测企业财务失败或破产的可能性,也可用于判定企业经营的状况,是目前在财务分析中最常用的一种模型。 目录 1...
作者:tonnie (我的一位学生,早期供职蚂蚁金服) 我做了一些删减。原文:https://zhuanlan.zhihu.com/p/3326...
本文描述的是CreditRisk+模型,该模型是一个信用风险模型,根据银行自身的违约率平均值,结合回收率和风险暴露,得到所有债务人的资产组合的预...
1、简介 信用风险是贷款和债券投资面临的主要风险。Credit Metrics模型通过估计贷款、债券等信用工具在一定时期内的未来价值变化分布,关...
文集作者