算法简介 由于具有出色的速度和良好的可扩展性,Kmeans聚类算法算得上是最著名的聚类方法。Kmeans算法是一个重复移动类中心点的过程,把类的中心点,也称重心(centro...
算法简介 由于具有出色的速度和良好的可扩展性,Kmeans聚类算法算得上是最著名的聚类方法。Kmeans算法是一个重复移动类中心点的过程,把类的中心点,也称重心(centro...
决策树是什么 决策树(Decision Tree)是在已知各种情况发生概率的基础上,通过构成决策树来求取净现值的期望值大于等于零的概率,评价项目风险,判断其可行性的决策分析方...
logistic回归与多重线性回归实际上有很多相同之处,最大的区别就在于他们的因变量不同,其他的基本都差不多,正是因为如此,这两种回归可以归于同一个家族,即广义线性模型(ge...
梯度下降是迭代法的一种,可以用于求解最小二乘问题(线性和非线性都可以)。在求解机器学习算法的模型参数,即无约束优化问题时,梯度下降(Gradient Descent)是最常采...
一、简单线性回归 在统计学中,线性回归是利用称为线性回归方程的最小二乘函数对一个或多个自变量和因变量之间关系进行建模的一种回归分析。这种函数是一个或多个称为回归系数的模型参数...
一、数据归一化 原因:样本有多个维度时,量纲的不同会影响特征的重要程度,如果将数据进行归一化处理可以消除量纲对特征的影响 常用的归一化方式有两种: 最值归一化:Xs =(X ...
一、数据拆分 如果将全部的原始数据当做训练集直接训练出模型,然后投入到真实环境中,这种做法是不恰当的,可能存在一定问题,这时候可以对原始数据集进行拆分,拆成训练数据集和测试数...
一、算法简介 K最近邻(kNN,k-NearestNeighbor)分类算法是数据挖掘分类技术中最简单的方法之一。K近邻的意思是每个样本都可以用它最接近的k个邻居来代表。 k...