一、无监督学习、监督学习和强化学习
监督学习:在给定的一些数据下,已经告诉你这些数据的特性,并且让你分类,然后给你一个数据让你根据图来推出其他的数据(给定一个坐标系,上面有相应的图像,给你x数据让你预测y的值)。如分类
无监督学习:给你一组数据,这些数据你并不知道分类是什么,你需要根据结构自己划分,并没有标准答案。
无监督学习应用:如聚类,
能将像素分类,对于计算机识别图像很有用处,
将嘈杂的一对声音经过算法的处理,将声音分离
文本处理
ICA算法用MATLAB一行代码表示:
强化学习:给你一些正确的决策(强化学习的关键是定义什么是好行为什么是坏行为),通常每一次做了好行为就给他奖励,坏行为就给相应的惩罚,渐渐地机器可以自动判断决策的正确与否。
例如汽车自动寻路,机器狗自动爬岩石,机器蛇自动爬越障碍物等等,都是在强化学习下不断地测试最后得到正确的决策来实现的。
二、回归
例子:汽车一开始受人操控行驶在路面上,机器根据司机行驶这条路对应的方向不断采集数据,最后达到监督学习的目的,得到回归的结果,汽车就能自动进行方向判断和驾驶了。
常用公式字符:
m=#tranining examples
x="input" variable/features(特征变量)
y="output" variable/"target" variable(目标变量)
(x,y)training example
i(th) training example = (x(i),y(i)) (样本列表的第i行)
n=#features(特征值的数量)