K-均值(K-means)算法是一种典型的无监督机器学习算法,用来解决聚类问题(Clustering)。由于数据标记需要耗费巨大的人力物力,无监...
PCA算法全称是Principal Component Analysis,即主成分分析算法。它是一种维数约减(Dimensionality Re...
朴素贝叶斯(Naive Bayers)算法是一种基于概率统计的分类方法。它在条件独立假设的基础上,使用贝叶斯定理构建算法,在文本处理领域有广泛的...
支持向量机(SVM,Support Vector Machine)算法是一种常见的分类算法,在工业界和学术界都有广泛的应用。特别是针对数据集较小...
决策树(Decision Tree,简称DT)是最经典的机器学习模型之一,它的预测结果容易理解,易于向业务部门解释,预测速度快,可以处理离散型数...
逻辑回归算法的名字虽然带有“回归”二字,但实际上是用来解决分类问题的算法。 1.逻辑回归算法的原理 假设有一场足球赛,我们有两支球队的所有出场球...
线性回归算法是使用线性方程对数据集拟合得算法,是一个非常常见的回归算法。本章首先从最简单的单变量线性回归算法开始介绍,然后介绍了多变量线性回归算...
KNN(K-Nearest Neighbor,K-近邻算法)算法是一种有监督的机器学习算法,可以解决分类问题,也可以解决回归问题。 1.KNN算...
由于现在有两个指标:查准率和召回率,如果有一个算法的查准率是0.5,召回率是0.4;另一个算法的查准率是0.02,召回率是1.0。那么两个算法到...
文集作者