项目背景
- 在产品同质化的市场环境之下,企业之间的竞争已经由产品品质的竞争转变为顾客满意度的竞争,企业着眼于长远发展,和领先市场的核心是针对不同人群的不同需求提供真正差异化的产品、服务以及营销策略。
- 客户先天就存在差异,无论是行为特征、需求偏好,还是价值贡献,因此同质化的营销策略在大量客户面前毫无作用。
- 企业要想最大化的实现可持续发展,就需要专注正确的客户群体,找准客户的需求点,开展针对性的营销。
- 电信行业产品同质化的趋势越来越明显,企业更多的需要倾听客户的呼声和需求,对不断变化的客户期望迅速做出反应;
样本数据
- 一段时期内新入网的用户
业务问题思考
- 通过提供一些优惠提高用户的忠诚度
- 推荐一些产品提高客单价
通过对用户的分析,洞察新用户,解决以下问题
- 1,该给客户提供什么优惠;
- 2,我们的优惠能否给用户带来惊喜;
- 3,不同的客户是否该根据他们的喜好提供不同的优惠
- 4,客户对我们的什么产品感兴趣
- 5,不同的客户是否应该推荐不同的产品
分析思路
1,问题解决思路
- (1) ,从样本数据中选取有效数据集
- (2),对样本数据用户进行细分
- (3),对细分后的不同人群的特征进行洞察
- (4),有针对性的提供优惠和产品推荐
2,样本数据选取与处理
- 选取用户手机上网日志数据作为分析的数据集
- 对手机上网数据进行清洗处理,跟用户ID和网站类型进行统计
- 输出的待分析数据为,用户时间窗口内在每一类网站的访问次数
- 用户ID, 时间 , URL, 域名, 网站类别
- 用户ID, 网站类别 , 访问次数
- 用户ID, 类别1次数,类别2次数,类别3次数,... 类别N次数
- 实验数据集共分为20列组成,一列为用户ID ,剩下的19列为19个网站分类对应的每一个月的访问次数
分类情况
分类名称 | code对应字段 |
---|---|
游戏/体育 | 1001flag_01 |
游戏/文字 | 1002flag_02 |
阅读/小说 | 1003flag_03 |
阅读/漫画 | 1004flag_04 |
网购/团购 | 1005flag_05 |
网购/海外购物 | 1006flag_06 |
网购/综合电商 | 1007flag_07 |
网购/垂直电商 | 1008flag_08 |
商旅出行/旅游咨询 | 1009flag_09 |
商旅出行/民宿 | 1010flag_10 |
商旅出行戏/酒店门票 | 1011flag_11 |
影音/电台 | 1012flag_12 |
影音/音乐 | 1013flag_13 |
影音/摄影 | 1014flag_14 |
金融理财/金融资讯 | 1015flag_15 |
金融理财/P2P | 1016flag_16 |
金融理财/证券 | 1017flag_17 |
教育/成人教育 | 1018flag_18 |
教育/中小学教育 | 1019flag_19 |
- 通过对数据集进行预处理(过滤异常值,填充缺失值,归一化)、将该数据集输入聚类模型,通过调整模型参数,迭代尝试不同的聚类个数,选取最优的聚类,输出结果。
- 对聚类结果进行业务解读,执行后续的客户经营策略。
数据处理
- 对数据进行预处理
- 缺失值处理
- 异常值处理
- 归一化处理
- 导出数据
模型构建
- 采用K-means算法
模型评估
模型评估是通过输入原始数据和聚类模型,评价聚类模型的优劣,包含指标和图标。
K取值 与得分
K个数 | CH指标 |
---|---|
K = 2 | 7572 |
K = 3 | 17480 |
K = 4 | 30169 |
K = 5 | 25962 |
K = 6 | 22040 |
模型洞察
- 模型给出了四个中心点的值,通过对四个中心点的值进行对比解读,提取各类的特征
数据结果解读
-
每一列对应一个聚类,每一行对应一个网站分类,将每一行中的最大值底色标红,就可以看出每个类别的显著特征
聚类 | 人群 | 特征 |
---|---|---|
人群一 | 4779 | 该人群重视理财和教育 |
人群二 | 5336 | 该人群偏好旅游喜欢摄影和音乐 |
人群三 | 3879 | 该人群偏好游戏和阅读 |
人群四 | 4779 | 该人群偏好网购 |
给出建议
结合公司及其合作伙伴的业务和产品,对四类人群进行有针对性的营销推广与关怀。
针对人群1,推荐理财优惠券,推荐理财和教育专用流量包
针对人群2,推荐旅游优惠券,推荐音乐视频专用流量包
针对人群3,推荐游戏卡券优惠券,推荐阅读流量包
针对人群4,推荐网购优惠券,推荐网购专用流量包