Topic: definition of supervised learning
如果你有一个朋友想卖掉自己的房子,他的房子大小是想知道自己的房子可以卖多少钱。
学习算法可以帮助他做什么呢?
学习算法可以根据数据画一条直线或者曲线来拟合数据.
如果用一条直线来拟合数据点,我们大致可以得出,房子可以卖150,000刀
但也许我们有更好的拟合方式,比如使用多项式或者高次函数。
例如使用二次函数(quadratic function),我们就可能得到更近似的结果,200,000美刀
而监督学习的重点就在于有一个“right answer”集合。
而根据这个集合,机器可以发掘出集合的一般规律,从而在一定限制下(比如给定feature,给定函数形式 以求参数)得到一个拟合数据集的函数表达。
而上图这样的操作叫Regression, Regression是根据一般规律预测未知数据的结果。
还有一类操作叫Classification。
比如这个例子,就是根据年龄和肿瘤大小,使用以往的经验来判断新患者恶性肿瘤的概率是多少。
可见,与Regression相似的是,我们仍然可以用一条直线或别的曲线来进行classification操作。
但不同点在于,classification不太可能正好把“right answer”集合的错有结果都正确的分为两类。
而判断一个分类函数的参数的好坏,也不只是看正确率,这个问题我们在classification的具体章节会详细讲到。
总得来说,Regression是对连续值的预测,Classification是对离散值的分类。
以上是本节全部内容。