最详细的Python结合RFM模型实现用户分层实操案例!

写在最前:做数据分析的小伙伴可能多多少少都知道一些分析方法,但是谈到分析思维却没有底气或者遇到业务问题,不知道如何下手。如果你有上述困惑,那么本篇文章可以作为参考。下图是整理的分析方法论及方法。如果能够灵活运用,将能够解决工作中 80% 以上问题。注意的是,方法论是思维层面,方法是执行层面。那么,重点是我们如何将其应用到实际业务中。 本文将以 RFM 模型为例,运用到实际案例中。(本文用Python实现,Excel也可)

数据分析思维

项目背景:某生鲜外卖APP于2018年1月1日成立,主营新鲜蔬菜瓜果,海鲜肉禽。APP上线后,市场推广期为一年。通过分析发现原来几个重要的客户被竞争对手挖走了,而这几个用户对平台贡献了80%的销售额。之前对所有用户采用一样的运营策略,为了解决这个问题,需要对用户进行分类,了解当前用户分层情况,进行精细化运营。

一、整体分析流程

1、分析目的: 用户分类
2、数据获取:Excel 数据
3、清洗加工:Excel、Python
4、建立模型: RFM
5、数据可视化: 柱形图、饼图
6、结论与建议

二、RFM 模型的理解


最终将 RFM 模型处理后的结果,作为用户标签,帮助运营更精准地制定活动规则以提升用户使用黏性,强化用户感知。最终实现的效果图如下:

三、利用 Python 实现RFM 用户分层

1、获取数据
import pandas as pd
data = pd.read_excel('C:/Users/cherich/Desktop/用户信息.xlsx')
data.head()
data.info()

说明:当前数据集是5000条用户数据,存在缺失值对本次分析不会造成影响。数据清洗,通常包括处理缺失值、重复值、转换数据类型三种。所以仅考虑数据类型即可。这里有个前提条件,R、F、M 应该有一个参照时间,如果活动持续到现在,可以截止到现在。但是我们的数据是历史数据,所以需要查找活动结束时间。

data.sort_values(by='最后一次成交', ascending=False)
2、数据处理
#  活动结束时间  2019-06-30
data['最后一次成交']=data['最后一次成交'].astype('str')
stop_date = pd.to_datetime('2019-06-30')
datas = data.drop(columns=['注册时间','会员开通时间','会员类型','城市','区域','最后一次登陆'])
datas['最后一次成交时间'] = datas['最后一次成交'].apply(lambda x:x.split()[0])

datas['最后一次成交时间'] = pd.to_datetime(datas['最后一次成交时间'])

datas['R1'] = datas['最后一次成交时间'].apply(lambda x:stop_date-x)

datas['F1'] = datas['非会员累计购买次数']+datas['会员累计购买次数']

datas['M1'] = datas['非会员累计消费'] + datas['会员累计消费']
datas['R1']= datas['R1'].astype(str)
datas['R1']= datas['R1'].apply(lambda x:x.split()[0])
datas

说明:以上操作目的是将R指标由时间类型转换成可计算格式,为接下来建立模型,计算时间间隔做准备。

3、建立模型

建立模型,需要分别对F、R、M 分别计算各自的平均值。但是要注意三个指标数据存在极大值、极小值的情况,这对结果会产生一定的误差,所以解决方案是将其标准化,设置分段区间,5分制,5分为最高。(数值区间可根据具体业务灵活调整或者用四分位数)

def R_score(n):
    n = int(n)
    if 0<n<=80:
        r = 5
    elif 80<n<=160:
        r = 4
    elif 160<n<=240:
        r = 3
    elif 240<n<=320:
        r = 2
    else:
        r = 1
    return r

def F_score(n):
    n = int(n)
    if 0<n<=14:
        r = 1
    elif 14<n<=28:
        r = 2
    elif 28<n<=42:
        r = 3
    elif 42<n<=56:
        r = 4
    else:
        r = 5
    return r

def M_score(n):
    n = int(n)
    if 0<n<=1500:
        r = 1
    elif 1500<n<=3000:
        r = 2
    elif 3000<n<=4500:
        r = 3
    elif 4500<n<=6000:
        r = 4
    else:
        r = 5
    return r

datas['M1_score'] =datas['M1'].apply(M_score)
datas['F1_score'] =datas['F1'].apply(F_score)
datas['R1_score'] =datas['R1'].apply(R_score)
datas.head()

说明:这里对R、F、M 再求平均值,以平均值为标准,如果单个指标大于平均值,显示1,否则显示0。最终RFM的结果由0和1拼接组成,即可得出用户最终类型。

R_mean = datas['R1_score'].mean()
F_mean = datas['F1_score'].mean()
M_mean = datas['M1_score'].mean()
datas['R'] = datas['R1_score'].apply(lambda x: 1 if x> R_mean else 0)

datas['F'] = datas['F1_score'].apply(lambda x: 1 if x> F_mean else 0)

datas['M'] = datas['M1_score'].apply(lambda x: 1 if x> M_mean else 0)
datas
datas['RFM'] = datas['R'].apply(str)+datas['F'].apply(str)+datas['M'].apply(str)
datas

def user_tag(rfm):
    if rfm=='000':
        res = '流失用户'
    elif rfm=='010':
        res = '一般维持用户'
    elif rfm=='100':
        res = '新客户'
    elif rfm=='110':
        res = '潜力客户'
    elif rfm=='001':
        res = '重要挽留客户'
    elif rfm=='101':
        res = '重要深耕客户'
    elif rfm=='011':
        res = '重要唤回客户'
    else:
        res = '重要价值客户'
    return res
datas['user_tag']=datas['RFM'].apply(user_tag)
datas
4、数据可视化
import matplotlib.pyplot as plt
import seaborn as sns
import matplotlib as mpl
sns.set(font='SimHei',style='darkgrid')
user_tag = datas.groupby(datas['user_tag']).size()

plt.figure(figsize = (10,4),dpi=80)

user_tag.sort_values(ascending=True,inplace=True)

plt.title(label='生鲜平台用户分层对比',
         fontsize=22, color='white',
         backgroundcolor='#334f65', pad=20)

s = plt.barh(user_tag.index,user_tag.values , height=0.8, color=plt.cm.coolwarm_r(np.linspace(0,1,len(user_tag))))
for rect in s:
    width = rect.get_width()
    plt.text(width+40,rect.get_y() + rect.get_height()/2, str(width),ha= 'center')

plt.grid(axis='y')
plt.show()
groups_b = datas.groupby(by='user_tag').size()

plt.figure(figsize = (10,6),dpi=80)
plt.title(label='生鲜平台用户分层占比',
         fontsize=22, color='white',
         backgroundcolor='#334f65', pad=20)

explodes = [0.6, 0, 0, 0, 0,0,0.4,0.8]

patches, l_text, p_text = plt.pie(groups_b.values,labels = groups_b.index, shadow=True,colors=plt.cm.coolwarm_r(np.linspace(0,1,len(groups_b))), autopct='%.2f%%', explode=explodes,startangle=370)
plt.legend(ins,bbox_to_anchor=(2, 1.0))
plt.show()
5、结论与建议

以上基本完成了RFM模型实现用户分层,可以看出新客户占比30%左右,重要价值客户占比30%左右。两者是平台的最主要用户类型。接下来就需要结合具体业务来制定运营策略。最后分享的是,现在我们看到最多的招聘需求是具备分析思维。那什么是分析思维。我的理解是,首先要理解业务,其次要掌握分析方法,要明确分析方法存在的意义是帮助我们将零散业务问题归类,归类的过程形成分析思路,有了分析思路,那你就具备了分析思维。好了,就写到这里。

公众号「Python之每日一课」,后台回复:「RFM数据」即可获取本文完整数据。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,491评论 5 459
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,856评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,745评论 0 319
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,196评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,073评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,112评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,531评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,215评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,485评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,578评论 2 309
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,356评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,215评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,583评论 3 299
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,898评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,174评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,497评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,697评论 2 335

推荐阅读更多精彩内容