机器学习:
如何解决问题:
1.模型驱动(牛顿力学,化学方程)
2.数据驱动(机器学习,数据可视化,数据挖掘)
Step1:set the model
Step2:training data
Step3:pick the best function
数据集:
1.training data;
2.cross validation data(判断模型好坏,防止过拟合)
3.testing data(不参加训练,判断模型好坏)
监督学习:所有数据都标注,每个x都有一个标签y
半监督学习:一半数据标注,一半未标注
无监督学习:全部未标注数据(代价较小,但可靠性不是很好)
迁移学习:
eg.比如让一个擅长羽毛球的人去训练网球,共同点,他们都需要极强的上肢力量,所以这就时他在新的训练中可以使用到的一点。
源域->目标域
理解为举一反三的能力
数据分布自适应:通过一些变化,将不同的数据分布的距离拉近
特征选择:假设源域和目标域中均含有一部分公共的特征
子空间学习:假设源域和目标域数据在变换后的子空间中会有着相似的分布