240 发简信
IP属地:北京
  • 120
    随机森林原理

    1、什么是随机森林?随机森林就是用随机的方式建立一个森林,在森林里有很多决策树组成,并且每一棵决策树之间是没有关联的。当有一个新样本的时候,我们让森林的每一棵决策树分别进行判...

  • 120
    评分卡|分类学习器的评估

    信用评分卡主要有三种(A卡、B卡、C卡): A卡:申请评分卡,侧重贷前,在客户获取期,建立信用风险评分,预测客户带来违约风险的概率大小; B卡:行为评分卡,侧重贷中,在客户申...

  • 120
    基于R语言的申请评分卡

    1.引言 信贷行业中常见的评分卡包括:申请评分卡(Application)、行为评分卡(Behavior)、催收评分卡(Collection)以及反欺诈评分卡(Anti-Fr...

  • R中的knn算法实现

    偶然之间看到,很多R包中都有knn算法的应用,他们有什么不同之处吗?到底应该选择哪个包来实现knn呢?为了解决这些疑惑,我对class包、DMwR包和kknn包中的knn实现...

  • 120
    【Kaggle】泰坦尼克号生存训练

    就是这篇文章,知乎称“您的帐号由于存在异常行为暂时被知乎反作弊系统限制使用”,然后任凭我申诉多久,都恢复不了了!!!最可恶的是,在你发布文章的时候一点儿提示都没有,显示发布成...

  • 120
    lubridate—轻松处理日期时间

    本文尝试翻译了Garrett Grolemund(《R语言入门与实践》作者)和Hadley Wickham两位大神发表的关于lubridate包的文章,该包专注于对日期时间数...

  • 小白学R—复杂数据处理

    这一关属于进阶关,难度相比前面提高了不少,所以花费的时间也多了一些。本关的学习内容主要为:如何编写函数;数据处理:dplyr, ggplot2;如何编写业务模块;代码如何调试...

  • 120
    小白学R—简单数据分析

    一、本关目标 对“朝阳医院2016年销售数据.xlsx"中的数据进行处理和分析,并完成4个指标:1.月均消费次数;2.月均消费金额;3.客单价;4.消费趋势。 二、数据清洗 ...

  • 120
    小白学R—数据结构入门

    正在跟随微信公众号:猴子聊人物学习数据分析,选择了R语言作为入门工具,以后的文章算是记录自己学习R语言的历程吧!之所以选择简书,是因为知乎多次无故被封,无奈为之,意外发现,M...