一、定义 Adaboost是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器(弱分类器),然后把这些弱分类器集合起来,构成一个更强的最终分类器(强分类器)。 Ada...
一、定义 Adaboost是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器(弱分类器),然后把这些弱分类器集合起来,构成一个更强的最终分类器(强分类器)。 Ada...
一、定义 逻辑回归(Logistic Regression)是一种用于解决二分类(0 or 1)问题的机器学习方法,用于估计某种事物的可能性。比如某用户购买某商品的可能性,某...
前情提要: 通俗地说逻辑回归【Logistic regression】算法(一) 逻辑回归模型原理介绍 上一篇主要介绍了逻辑回归中,相对理论化的知识,这次主要是对上篇做一点点...
一、定义 1、一元线性回归 线性回归是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,运用十分广泛。其表达形式为y = w'x+e,e...
当想要在数据表里面直接展示出数据的趋势或者涨跌,但是又不需要很大很清晰的图,就可以采用迷你图,并且迷你图是可以根据数据的变动实时变动的,因此也不失为一个让数据变清晰的办法哦!...
一、算法简介 EM(Expectation-Maximum)算法也称期望最大化算法。EM算法是最常见的隐变量估计方法,在机器学习中有极为广泛的用途,例如常被用来学习高斯混合模...
一、定义 层次聚类就是通过对数据集按照某种方法进行层次分解,直到满足某种条件为止。按照分类原理的不同,可以分为凝聚和分裂两种方法。 层次聚类方法对给定的数据集进行层次的分解,...
一、定义 DBSCAN(Density-Based Spatial Clustering of Applications with Noise)是一个比较有代表性的基于密度的...
一、定义 kmeans即k均值算法。k均值聚类是最著名的划分聚类算法,由于简洁和效率使得他成为所有聚类算法中最广泛使用的。给定一个数据点集合和需要的聚类数目k,k由用户指定,...
一、简介 RFM模型是衡量客户价值和客户创利能力的重要工具和手段。在众多的客户关系管理(CRM)的分析模式中,RFM模型是被广泛提到的。该机械模型通过一个客户的近期购买行为、...
1、数据有效性 当你需要设置一个填空题问卷让别人填,又不想他们的数据格式填得乱七八糟,就可以这么设置。主要目的是保证数据正确。第一步,选择 第二步,设置 第三步,验证 接下来...
一、简介 Apriori算法是第一个关联规则挖掘算法,也是最经典的算法。它利用逐层搜索的迭代方法找出数据库中项集的关系,以形成规则,其过程由连接(类矩阵运算)与剪枝(去掉那些...
一、定义 KNN全称K Near Neighbor,意思是k个最近的邻居,即每个样本都可以用它最接近的k个邻居来代表。如下图,在K=1的范围内,目标点应该标为红色的正方形,在...
一、定义 上次我写了决策树算法,决策树可以解决分类问题,也有CART算法可以解决回归问题,而随机森林也和决策树非常类似,采用了CART算法来生成决策树,因此既可以解决分类问题...
一、定义 SVM的全称是Support Vector Machine,即支持向量机,主要用于解决模式识别领域中的数据分类问题,属于有监督学习算法的一种。SVM要解决的问题可以...
一、贝叶斯原理 相信很多同学在高中或者大学的时候都学过贝叶斯原理,即条件原理。 例题: 现分别有 A、B 两个容器,在容器 A 里分别有 7 个红球和 3 个白球,在容器 B...
很多情况下分类问题和回归问题其实是可以互转的,比如上面写的决策树的CART算法,就是可以处理连续型的分类算法。 下面举🌰几个典型的分类问题和回归问题的转化例子: (1)只能是...
一、什么是决策树 所谓决策树,就是一个类似于流程图的树形结构,树内部的每一个节点代表的是对一个特征的测试,树的分支代表该特征的每一个测试结果,而树的每一个叶子节点代表一个类别...
如果有一列数据,而你想找出重复值怎么办? ding,有了!选取数据区域 - 开始 - 条件格式 - 突出显示单元格规则 - 重复值 效果如下: 如果你不仅仅要找出来,还想要顺...