计算样本i到同簇其他样本的平均距离ai,ai越小,说明样本i越应该被聚类到该簇。将ai 成为样本i的簇内不相似度。
计算样本i到其他某簇Cj的所有样本的平均距离bij,称为样本i与簇cj的不相似度。定义为样本i的簇间不相似度:bi=min{bi1,bi2,......bik}
si接近1,则说明样本i聚类合理。
si接近-1,则说明样本i更应该分类到另外的簇。
若si近似为0,则说明样本i在两个簇的边界上。
下面我用K-Means 和 DBSCAN 分别进行了聚类,并且用轮廓评估做了计算
部分代码如下: