K-means方法:
工作原理:
首先随机的从数据集中选取k个点,每个点初始的代表每个族的聚类中心,然后计算剩余各个样本到聚类中心的距离,将他赋给最近的簇,接着重新计算每个簇的平均值,整个过程不断重复,如果相邻两次调整没有明显变化,说明数据聚类的簇已经收敛。
步骤:
1、从n个数据对象中任意选择k个对象作为初始聚类中心
2、循环3,4直到每个聚类不再发生变化
3、根据每个聚类对象的均值,计算每个对象与这些中心对象的距离,并根据最小距离重新对相应对象进行划分;
4、重新计算每个聚类的均值,直到聚类中心不再变化。
层次聚类:
层次聚类原理和步骤:
通过将数据组织为若干组,并形成一个相应的树来进行聚类的,根据层次是自底向上还是自顶向下形成,可以分为凝聚的聚类算法和分裂的聚类算法