知识总结
假设空间:所有假设的集合(包括空集)
版本空间:对于特定的数据集,与该数据集一致的假设的集合。(一致的意思是假设能覆盖正例,不覆盖反例)
归纳偏好:是一个挑选最佳假设函数的基准。当多个假设都满足条件时,要依据什么标准来决定使用哪个假设,比如使用奥卡姆剃刀,选最简单的、项最少的。
习题解
1.1
编号 | 色泽 | 根蒂 | 敲声 | 好瓜 |
---|---|---|---|---|
1 | 青緑 | 蜷缩 | 浊响 | 是 |
4 | 乌黑 | 稍蜷 | 沉闷 | 否 |
版本空间:
- (色泽=青緑,根蒂=蜷缩,敲声=浊响)(色泽=青緑,根蒂=蜷缩,敲声=*),(色泽=青緑,根蒂=*,敲声=浊响),(色泽=青緑,根蒂=*,敲声=*),(色泽=*,根蒂=蜷缩,敲声=浊响),(色泽=*,根蒂=蜷缩,敲声=*),(色泽=*,根蒂=*,敲声=浊响)
1.2
表1.1
编号 | 色泽 | 根蒂 | 敲声 | 好瓜 |
---|---|---|---|---|
1 | 青緑 | 蜷缩 | 浊响 | 是 |
2 | 乌黑 | 蜷缩 | 浊响 | 是 |
3 | 青緑 | 硬挺 | 清脆 | 否 |
4 | 乌黑 | 稍蜷 | 沉闷 | 否 |
1.3
由于存在数据噪声,归纳偏好可以定为优先选择判断出正例数量多的假设,数量相同是选择项少的假设,前面两项都相同时,随机挑一个。