机器学习发展过程中,主要解决如下几种问题:
分类:最常见的范式。图像分类、领域识别、意图识别、文本分类、ctr预估、风控系统等使用到分类范式。分类的结果是离散形式的。序列标注问题可以划分到分类的范式中。
回归:常见的范式。销量预测、股票预测、图像分割等使用到回归范式。回归的结果是连续形式的。
聚类:常见范式。用户分群等使用聚类范式。聚类后人工给类别贴相应的业务标签。
降维:特征维度过高,会增加学习的负担,pca等技术用于降维学习。
日常工作中,首先要做的是,根据业务问题,确定用什么范式解决。而后进入大循环。