作者:hooly
微信公号:一口袋星光
如果使用regression的方法是解classification问题的话:
第一类也就是class1的目标值就是1;第二类也就是class2的目标值就是-1;
也就是说:比较接近1的就被我们分为class1;比较接近-1的被我们分为class2
因为>0的就是比较接近1的,所以被我们分成class1;<0的是比较接近-1的,被我们分成class2。
第一张图:
左上部分代表<0 ;右下角>0;
对于两边相对来说比较对称的点来说,regression的拟合是相对比较靠中间的,所以这种情况下去regression去解classification的效果是可以的。
但是我们看第二张图:有一些>0的点是远大于1的,这时候你用regression的方法去做classification的问题的话,你得到的是紫色的线,而不是绿色的线。
这是因为regression会惩罚那些对于classification来说太正确的点。
为什么会惩罚?
原因是对于regression来说这些太正确的点其实是不好的,所以regression要偏移去拟合这些点,来保证模型的效果。但是这个偏移对于classification来说,正是我们不想要它做的。
作者:hooly
微信公号:一口袋星光
我会在微信公号上持续更新我的文章,你来讨论我很欢迎。