概述
由于本书的特点,先是给我们介绍算法的原理,然后再用代码实现,最后才是算法的实际应用。我本人只想快速了解算法的原理,所以在这本书里的笔记一般都是针对算法的原理的,实例部分基本上不会做记录了。
关键术语
下面的表格的数据是随便写的,方便一些概念的理解,和实际生活没有任何联系
体重 | 翼展 | 脚蹼 | 后背颜色 | 种属 |
---|---|---|---|---|
10 | 20 | 30 | blue | 红尾 |
20 | 30 | 40 | black | 绿尾 |
- 专家系统:开发出能够识别鸟类的计算机软件,鸟类学者就可以退休了。因为鸟类学者是研究鸟类的专家,因此我们说创建的是一个专家系统
- 特征:也称为属性,比如鸟类的体重,翼展,脚蹼,后背颜色等
- 实例:表中的每一行都是具有相关特征的实例
- 分类:判断一只鸟是属于哪个种类的
- 训练集:用于训练机器学习算法的数据样本集合,表格中就有2个训练样本的训练集,每个训练样本有4种特征、一个目标变量
- 目标变量:分类算法中目标变量通常是标称型的,回归算法中通常是连续型的
- 知识表示:看到机器学习的效果,有些结果是人所能理解的,而有些只能为计算机所理解