聚类分析

文森特·梵高 :粉红色的桃花树

01、聚类分析

在没有先验知识的情况下,对样本按各自的特性来进行合理的分类
聚类分析:不需要先知道所属类别就可以实现按各自特性的分类

聚类分析有两种主要计算方法,分别是凝聚层次聚类(Agglomerative hierarchical method)和K均值聚类(K-Means)
(1)层次聚类首先要定义样本之间的距离关系,距离较近的归为一类,较远的则属于不同的类。
(2)K均值聚类不需要计算距离,但要求事先给出分类个数

02、iris聚类分析

2.1、层次聚类

ris数据集包含5个方面的信息,为了探索聚类分析,所以采用前4个变量作为模型前期数据,使用species作为聚类模型结果的验证。

数据集

(1)首先提取iris数据中的4个数值变量,然后计算其欧氏距离矩阵。
(2)然后将矩阵绘制热图,从图中可以看到颜色越深表示样本间距离越近·
从图中可以看到颜色越深表示样本间距离越近。大致上可以区分出三到四个区块,其样本之间比较接近。

热力图
data<-iris[,-5]  #删除第五行
dist.e <- dist(data,method='euclidean')  #变量间欧式距离的数据集
heatmap(as.matrix(dist.e),labRow = F, labCol = F)

使用hclust完成数据集的层次聚类,plot函数可以查看聚类结果
使用cutree函数提取每个样本所属的类别

#--------------------------------------------->2、层次聚类模型
#建立聚类模型
model1<-hclust(dist.e,method='ward.D') #采用离差平方和法处理距离
plot(model1) #绘制聚类树图:没什么用的结果
result<-cutree(model1,k=3) #使用cutree函数提取每个样本所属的类别

到此就完成了150个数据的类别划分

层次聚类结果

可视化展现层次聚类结果
setose品种聚类很成功,但有一些virginica品种的花被错误和virginica品种聚类到一起

#------------------------------------------------->3、层次聚类结果展示
#----------------------------------------------------->3.1、MDS降维
mds<-cmdscale(dist.e,k=2,eig=T)
x <- mds$points[,1]
y <- mds$points[,2]
#----------------------------------------------------->3.2、聚类结果显示
#以不同的的形状表示原本的分类,用不同的颜色来表示聚类的结果
library(ggplot2)
p<-ggplot(data.frame(x,y),aes(x,y))
p+geom_point(size=3,alpha=0.8,aes(colour=factor(result),shape=iris$Species))
#setose品种聚类很成功,但有一些virginica品种的花被错误和virginica品种聚类到一起
层次聚类结果

2.2、K均值聚类

使用kmeans函数进行K均值聚类

model2<-kmeans(data,centers=3,nstart=10)
model2$cluster    #model2$cluster可以用来提取每个样本所属的类别
data$type<-model2$cluster
data$id<-rownames(data)

centers参数用来设置分类个数,
nstart参数用来设置取随机初始中心的次数,其默认值为1,但取较多的次数可以改善聚类效果
K均值聚类后,数据集的结果为:

K均值聚类

如果聚类正确的话,圆形点对应红色;三角形对应蓝色;方框对应绿色
K均值聚类setose品种聚类比较好,但有一些virginica品种的花被错误和virginica品种聚类到一起

K均值聚类结果
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,547评论 6 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,399评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,428评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,599评论 1 274
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,612评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,577评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,941评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,603评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,852评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,605评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,693评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,375评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,955评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,936评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,172评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 43,970评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,414评论 2 342

推荐阅读更多精彩内容