一、集成学习算法简介 学习西瓜书笔记。 集成学习(ensemble learning)通过构建并结合多个学习器来完成学习任务。如何产生“好而不同...
初步认识GBDT 个人理解:GBDT(Gradient Boosting Decision Tree),梯度提升决策树、再读一遍:梯度,提升,决...
可以看看这个笔记 一、初步认识 理解“信息增益”,就差不多把决策树中的用到的技术理解了。可以参考对熵的理解中,对信息增益的解释。 我们想要构造一...
PCA只对符合高斯分布的样本点比较有效ICA对于高斯分布的样本点无效,对于其他分布的有效。 回顾我们之前介绍的《模型选择和规则化》,里面谈到的特...
由以上的直观分析,我们知道了因子分析其实就是认为高维样本点实际上是由低维样本点经过高斯分布、线性变换、误差扰动生成的,因此高维数据可以使用低维来...
本节讲的主要是EM算法的推导,对于算法的应用解释的不多,所以这里不多赘述,只讲讲推理的主要思想。 E步就是想根据上一步的参数θ,找到最好的Qi,...
一、似然函数 已知有一组样本X1,X2,...Xn,X服从分布律P{X=x} = p(x;θ),又设x1,x2,...xn是相应于样本X1,X2...
一、全概率公式与贝叶斯公式 这两个公式是十分十分重要的公式,在概率统计中用的非常多。这里的EM思想,也是用到了 这两个公式的思想。关于这两个公式...
一、引言 从这篇文章开始,介绍非监督学习算法。前面介绍的算法,都是有监督学习算法。 1.1 有监督学习 一句话总结:前面所学习的算法,都是在已知...
文集作者