240 投稿
收录了16篇文章 · 30人关注
  • Resize,w 360,h 240
    交叉验证

      交叉验证(Cross-Validation)可能是数据科学家在进行统计分析时最重要的技术之一,因为在实际中经常需要验证一个ML模型的稳定性-...

  • Sickit-learn 回归模型性能评估函数

    sklearn.metrics.explained_variance_score()若为预测值,为实际值,则该回归方程的解释方差(explain...

  • Resize,w 360,h 240
    决策树(Decision Tree)

      决策树(Decision Tree)是一种基本的分类与回归方法,其模型呈树状结构,在分类问题中,表示基于特征对实例进行分类的过程。本质上,决...

  • Resize,w 360,h 240
    截断正态分布

      截断正态分布(Truncated_normal_distribution)是在正态分布中界定随机变量进而从正态分布的分布函数中导出概率分布,...

  • Resize,w 360,h 240
    神经网络学习率(learning rate)的衰减

    一、学习率衰减的概念和必要性 学习率过大,在算法优化的前期会加速学习,使得模型更容易接近局部或全局最优解。但是在后期会有较大波动,甚至出现损失函...

  • Resize,w 360,h 240
    Logistic模型及其Scikit-learn实现

    概述  Logistic回归属于概率型非线性回归,主要用于解决线性可分的分类问题。该模型利用函数Logistic function将单次实验的可...

  • Resize,w 360,h 240
    岭回归及其Scikit-learn实现

    概述   对于普通最小二乘的参数估计问题,当模型的各项是相关时,最小二乘估计对于随机误差非常敏感,会产生很大的方差。一般来说,对于没有经过实验设...

  • Resize,w 360,h 240
    最小二乘法原理及Scitkit-learn实现

    概述   最小二乘法是一种数学优化技术,它通过最小化误差来寻找数据的最佳匹配函数,在曲线拟合中有广泛应用。在一维空间中,若已知个点,现在我们使用...

  • Pandas库read_excel()参数详解

    io:字符串,文件的路径对象。 sheet_name:None、string、int、字符串列表或整数列表,默认为0。字符串用于工作表名称,整数...

  • 机器学习概论

    什么是机器学习?   前些年AlphaGo与中韩围棋大师的世纪决战至今仍历历在目,AlpahGo的压倒性胜利象征着人类在机器学习领域取得的极大进...

专题公告

主要发布一些关于机器学习的算法及实现的文章,同时对常用的机器学习,数据分析工具进行介绍。