主要参考来源:http://www.saedsayad.com/data_mining_map.htm
原网址更像是一本书,首页是思维导图,点击图中各项可以访问更详细的内容。我这里只是列出了目录,如有时间我希望可以把内容也添加进来。
数据挖掘
-
解释过去(数据探索)
-
单因素分析
-
分类变量
- 计数、百分比计数
- 饼图、条形图
-
数值变量
- 最小值、最大值、均值、中值、众数
- 范围、分位数、方差、标准差、偏差系数
- 偏度、峰度
- 直方图、箱形图
-
-
二元分析
-
分类 vs 分类
- 卡方检验
- 条形图、组合图
-
数值 vs 数值
- 线性关系
- 散点图
-
分类 vs 数值
- z检验、t检验
- 方差分析
- 线图、条形图、组合图
-
-
-
预测未来(建模)
-
分类
-
频数表
- zeroR分类器(计算其他模型准确度的基线)
- oneR分类器(计算哪个特征与与测量更相关)
- 朴素贝叶斯
- 决策树
-
协方差矩阵
- 线性判别分析
- logistic回归
-
相似函数(欧氏距离、曼哈顿距离、明氏距离)(海明距离)
- kNN(k近邻分类器)
-
其他
- 人工神经网络
- 支持向量机
-
-
回归
-
频数表
- 决策树
-
协方差矩阵
- 多元线性回归
-
相似函数
- kNN(k近邻分类器)
-
其他
- 人工神经网络
- 支持向量机
-
-
聚类
-
层次方法
- 凝聚层次聚类
- 分裂层次聚类
-
划分方法
- kmeans
- 自组织图
-
-
关联性分析
-