一、基本原理 聚类(clustering)是一种无监督学习(unsupervised learning),即没有标记信息,通过对无标记训练样本的...
一、基本原理 聚类(clustering)是一种无监督学习(unsupervised learning),即没有标记信息,通过对无标记训练样本的...
一、基本原理 神经网络(neural networks)模拟生物神经网络的一种机器学习模型。下面以三层神经网络为例具体说明其实现过程:该模型共包...
如果数据比简单的直线更为复杂,我们也可以用线性模型来你和非线性数据。一个简单的方法就是将每一个特征的幂次方添加为一个新的特征,然后在这个拓展的特...
一、基本原理 给定训练样本集,学习的目标即是找到一个划分超平面,这个超平面可以通过线性方程 来描述。对于样本点,若,则;若,则,令 即样本空间...
一、原理解释 1.1、从线性回归到逻辑回归 考虑二分类问题,线性回归模型产生的是实值,仍需要转化为0/1值。因此单位阶跃函数(unit-step...
一、问题描述 给定数据集 其中线性回归(linear regression)试图学得,使得。代价函数为,其中,求解,使代价函数最小,即代表拟合出...
git 仓库特点 使用快照流 近乎所有操作都是本地执行 一般只添加数据三种状态:modified -> committed -> staged ...
1. Light GBM 简介 在数据挖掘和传统机器学习领域,提起大名鼎鼎的 XGBoost,相信很多人都听说过,尤其是在 Kaggle 赛场上...
最小二乘的hypothesis为:其中表示第个样本,表示的第个特征。最小二乘的目标函数为:我们可以通过使沿着其梯度方向进行更新来最小化目标函数。...
问题描述 在我学习机器学习实战-决策树部分,欲可视化决策树结构。最终可视化结果: 解决方案 决策树由嵌套字典组成,如: {"no surfaci...
专题公告
讨论和分享机器学习的知识,专注分享关于机器学习的高质量干货