k均值聚类分析在客户分类中的应用

客户分类可以对客户的消费行为进行分析,也可以对顾客的消费心理进行分析。医院可以针对不同行为模式的客户提供不同的产品内容,针对不同消费心理的客户提供不同的促销手段等。客户分类也是其他客户分析的基础,在分类后的数据中进行挖掘更有针对性,可以得到更有意义的结果。

k均值聚类算法是一种迭代求解的聚类分析算法,其步骤是随机选取K个对象作为初始的聚类中心,然后计算每个对象与各个种子聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。每分配一个样本,聚类的聚类中心会根据聚类中现有的对象被重新计算。这个过程将不断重复直到满足某个终止条件。终止条件可以是没有(或最小数目)对象被重新分配给不同的聚类,没有(或最小数目)聚类中心再发生变化,误差平方和局部最小。

一、数据提取

根据RFM模型提供的思路,我们将提取三个维度的数据:“最近一次消费”、“消费频率”、“消费金额”。

RRecency最近一次消费:客户最近一次交易时间的间隔天数。R值越大,表示客户交易发生的日期越久,反之则表示客户交易发生的日期越近。

FFrequency消费频率:客户在最近一段时间内交易的次数。F值越大,表示客户交易越频繁,反之则表示客户交易不够活跃。

MMonetary消费金额:客户在最近一段时间内交易的金额。M值越大,表示客户价值越高,反之则表示客户价值越低。

根据以上思路提取的数据如下:


二、建立模型

由于k均值聚类算法需要提供k值,也就是聚类的个数。因此我们在建立模型之前必须先确定什么样的k值才是最适合的。下面将引入肘部法来判断k值。

肘部法则的计算原理是成本函数,成本函数是类别畸变程度之和,每个类的畸变程度等于每个变量点到其类别中心的位置距离平方和,若类内部的成员彼此间越紧凑则类的畸变程度越小,反之,若类内部的成员彼此间越分散则类的畸变程度越大。在选择类别数量上,肘部法则会把不同值的成本函数值画出来。随着值的增大,平均畸变程度会减小;每个类包含的样本数会减少,于是样本离其重心会更近。但是,随着值继续增大,平均畸变程度的改善效果会不断减低。值增大过程中,畸变程度的改善效果下降幅度最大的位置对应的值就是肘部。

以下我们使用Python来实现肘部法:


  运行代码得到以下结果:


可见在4个分类处出现了肘部, 故对于这个数据集的聚类而言,最佳聚类数应该为4。

  开始建立kmaens模型:


为了验证模型的准确度,我们利用轮廓系数法进行判断:当数值越接近1,则说明聚类结果越合理。代码如下:


运算结果为:0.7895694986225192

轮廓系数得分接近1,所以聚类效果还算满意。

三、解释模型

我们对聚类后的结果进行一次分类汇总得到以下结果:


我们需要根据每一类中三个指标的平均值,来对这4种分类做一个解释:

其中“0”类距离天数的均值最长,可见这类顾客已经很久未来院消费,并且消费金额偏低,消费次数少。因此这类顾客可将其定型为流失顾客。

“1”类顾客在消费金额和消费次数上对医院贡献较大,但172.18天的消费间隔天数过长,有流失或者沉睡的风险。因此这类很久未来院消费的顾客,需要及时唤醒,以免流失。故应该定型为唤醒顾客。

通过对“2”类顾客三项指标的判断,这类顾客应属于一般顾客,虽有平均7.4次的消费次数,但消费金额不高,且消费间隔天数过长。属于还未对医院建立很高忠诚度的顾客。

“3”类的顾客的三项指标为4个分类里最高值,85.82天的消费间隔天数也符合医院项目的平均治疗周期(90天),57次的消费次数为医院带来了667556.87的收入。因此这类顾客应定型为价值客户。

最终我们将医院客户分为:流失顾客、一般顾客、唤醒顾客、价值客户。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,293评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,604评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,958评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,729评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,719评论 5 366
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,630评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,000评论 3 397
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,665评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,909评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,646评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,726评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,400评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,986评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,959评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,197评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 44,996评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,481评论 2 342

推荐阅读更多精彩内容

  • 1.无监督学习:简介 聚类算法:第一个无监督学习算法(无标签的数据) 什么是无监督学习呢?对比:监督学习问题指的是...
    带刺的小花_ea97阅读 12,795评论 0 5
  • 1. Kmeans聚类算法简介 由于具有出色的速度和良好的可扩展性,Kmeans聚类算法算得上是最著名的聚类方法。...
    wujingwin阅读 10,409评论 1 8
  • 1. 聚类分析的典型应用场景 聚类分析的一个重要用途就是针对目标群体进行多指标的群体划分,类似这种目标群体的分类就...
    熊定坤阅读 29,565评论 0 4
  • 1 K-Means聚类收敛性怎么证明?一定会收敛??? 2 聚类中止条件:迭代次数、簇中心变化率、最小平方误差MS...
    城市中迷途小书童阅读 8,798评论 0 1
  • 该系列文章为,观看“吴恩达机器学习”系列视频的学习笔记。虽然每个视频都很简单,但不得不说每一句都非常的简洁扼要,浅...
    tomas家的小拨浪鼓阅读 890评论 0 5