1.模式与模式识别 Pattern Recognition
其实,每一种外界的事物都是一种模式,人类平均每天都在进行着很多很多的各种各样的模式识别,模式识别就是区分不同的模式,也即各种事物。
2.特征 Feature
每种模式都具有自己的特征,我们通过事物的不同特征来对事物进行识别。
3.名词约定
样本 Sample: 所研究对象的一个个体。
样本集 Sample Set: 若干样本的集合。
已知样本 Known Sample:已知类别的样本
未知样本 Unknown Sample:未知类别的样本
类别 Class: 同一类的样本具有相同的模式
特征 Feature: 每种模式都具有自己的特征,我们通过事物的不同特征来对事物进行识别。
4.方法
\\基于知识:例如,专家系统,句法识别。
\\基于数据:下图以基于数据的方法判断银行用户信用级别,x为用户信息,y为信用级别
f:使所有x到y的映射成立得到的理想函数,无法得到标准的公式
D:data,已知的用户信息和对应的信用级别,也即Sample Set
A:学习算法Algorithm
H:假想集,算法应满足的约束,也即Features
g:通过学习得到的函数,实质上是f的近似,可以得到公式
5.分类
监督模式识别 supervised pattern recognition :已知类别数
非监督模式识别 unsupervised pattern recognition ,也称聚类 Clustering:未知类别数
6.模式识别系统的典型构成
//有监督
信息预处理
特征提取与选择
构造分类器、得到分类决策
//无监督
信息预处理
特征提取与选择
聚类
结果解释