互联网游戏数据分析(SQL)

一、数据概览

数据共有828934条,108列标签

本文主要对以下10个字段进行分析

使用工具:Navicat Premium ,jupyter notebook
技能要求:SQL掌握到子查询,Python连接数据库(不连也可以)

二、提出问题:

1、新增玩家分析:从玩家数量、玩家占比、每日新增玩家数展开分析
2、玩家活跃度分析:从不同用户在线时长、分布特征展开分析
3、玩家付费情况分析:从PUR(付费比率)、ARPPU(活跃付费用户平均消费金额)等关键指标展开分析
4、玩家游戏习惯分析:从不同玩家类型、游戏模式(PVP与PVE)得出的情况来展开分析

三、新增玩家分析

新增玩家数量:828934人

SELECT count(DISTINCT user_id) 新增玩家数量 FROM `tap_fun_test`

新增付费玩家数量:19549

select count(DISTINCT(user_id))  新增付费玩家数量 from tap_fun_test where pay_price >0;

付费玩家占比:0.0236

select 新增付费玩家/新增玩家数 as 付费玩家占比 from 
(SELECT count(distinct user_id) 新增玩家数 from tap_fun_test) as t1 ,
(SELECT count(DISTINCT user_id)  新增付费玩家 from tap_fun_test where pay_price>0) as t2 ;

每日新增用户数量

select date(register_time) 日期,count(DISTINCT(user_id)) from tap_fun_test GROUP BY 日期;

每日新增付费用户数

select date(register_time) 日期,count(DISTINCT(user_id)) from tap_fun_test where pay_price>0 GROUP BY 日期;

每日新增玩家在3月10日有一次大高峰增长,可能举办活动,但活动一过后续新增玩家数并没有显著提升,可见活动没有游戏的人气带来实质性的帮助。
活动需要力度加强并保持一定时间维度,给玩家充分时间了解游戏,才能提高秀逸热度。

全部玩家平均在线时长:11.741103057664969

SELECT avg(avg_online_minutes)  as 全部玩家平均在线时长 from tap_fun_test;

付费玩家平均在线时长:135.8732415946089

select avg(avg_online_minutes) from tap_fun_test where pay_price>0;

四、玩家活跃度分析

平均在线时长的分布特点

全部玩家人数的中位数、上下四分位数

select round(count(distinct user_id)/4) as 下四分位数,
round(count(distinct user_id)/2) as 中位数,
round(count(distinct user_id)/4*3) as 上四分位数
from tap_fun_test;

下四分位数:207234 中位数:414467 上四分位数:621701

全部玩家在线时长箱线图关键值

SELECT min(avg_online_minutes) 最小值,
(select avg_online_minutes from tap_fun_test ORDER BY avg_online_minutes LIMIT 207233,1) as 下四分位数,
(select avg_online_minutes from tap_fun_test ORDER BY avg_online_minutes LIMIT 414466,1) as 中位数,
(select avg_online_minutes from tap_fun_test ORDER BY avg_online_minutes LIMIT 621700,1) as 上四分位数,
max( avg_online_minutes) 最大值
FROM `tap_fun_test` 

最小值0.0,下四分位数:0.5,中位数:1.666667,上四分位数:5,最大值:1605.833333

付费玩家的人数最大值最小值、中位数、上下四分位数

select round(count(distinct user_id)/4) as 下四分位数,
round(count(distinct user_id)/2) as 中位数,
round(count(distinct user_id)/4*3) as 上四分位数
from tap_fun_test 
WHERE pay_price>0;

下四分位数:4887, 中位数:9775 上四分位数:14662

付费玩家在线时长箱线图关键值

SELECT min(avg_online_minutes) 最小值,
(select avg_online_minutes from tap_fun_test where pay_price>0 ORDER BY avg_online_minutes LIMIT 4886,1) as 下四分位数,
(select avg_online_minutes from tap_fun_test where pay_price>0 ORDER BY avg_online_minutes LIMIT 9774,1) as 中位数,
(select avg_online_minutes from tap_fun_test where pay_price>0 ORDER BY avg_online_minutes LIMIT 14661,1) as 上四分位数,
max( avg_online_minutes) 最大值
FROM `tap_fun_test` 
where pay_price>0;

最小值:0.3333 ,下四分位数:30.6667,中位数:84.5,上四分位数:191.1667,最大值:1081.5

全部玩家的在线时长箱线图中向下压缩的很厉害,全部玩家上四分位数为5,说明75%的玩家平均在线只有大约5分钟,可能一局游戏都没有玩完,可见玩家流失情况比较严重。
付费用户的箱型图中下四分位数为30,中位数84,上四分位数为191,说明付费用户中75%以上的用户在线时长都超过了30分钟。

五、玩家付费情况分析

关键指标

AU(active users)活跃用户:游戏时长超过15分钟
PU(Paying users)付费用户
APA(Active Paying Account):活跃付费用户数
ARPU:平均每个活跃用户的收入,总收入/AU
ARPPU:平均活跃付费用户收入,总收入/APU
PUR(付费比率):APA/AU

每个活跃玩家的收入

select count(DISTINCT user_id) as AU,
(select sum(pay_price) from tap_fun_test as 总收入),
(select sum(pay_price) from tap_fun_test) /count(DISTINCT user_id) as 每个活跃玩家收入 
from tap_fun_test 
where avg_online_minutes > 15;
#and pay_price>0;每个活跃付费玩家的收入
AU:99846,总收入:556900.04,每个活跃玩家收入ARPU:5.57758989

每个活跃付费玩家的收入

APA:16982,总收入:556900.04,每个活跃付费玩家收入ARPPU:32.79354846

付费比率

select count(DISTINCT user_id) as APA ,
(SELECT count(DISTINCT user_id) from tap_fun_test WHERE avg_online_minutes>=15) as AU ,
count(DISTINCT user_id)/(select count(DISTINCT user_id) from tap_fun_test 
where avg_online_minutes>=15) as PUR
from tap_fun_test 
where avg_online_minutes>=15 and pay_price >0;
APA:17005;AU:100649;活跃玩家的付费率PUR:0.169,全部玩家的付费比率:0.021

该游戏的PUR(人均付费率)为0.169较低,且ARPU(活跃玩家平均消费额)为5.58,说明收入表现差;相对于ARPPU,活跃付费用户消费很高,是ARPU的6倍左右,针对这点我们可以做首次消费门槛和专属大V玩家的福利与活动进行调整与优化。

六、玩家游戏习惯分析

select AVG(pvp_battle_count) as 平均PVP次数 ,
sum(pvp_lanch_count)/sum(pvp_battle_count) as 主动发起PVP概率,
sum(pvp_win_count)/sum(pvp_battle_count) as PVP获胜概率
from tap_fun_test
where avg_online_minutes>=15;
PVP活跃玩家
平均PVP次数:15.164651412333953;主动发起PVP概率:0.5688357584679884;PVP获胜概率:0.532222547626395
PVP活跃付费玩家(加一个pay_price>0)
平均PVP次数:27.301911202587473;主动发起PVP概率:0.6553937480210826;PVP获胜概率:0.6872459716242092

PVE活跃玩家
平均PVE次数:28;主动发起PVE概率:0.9967;PVE获胜概率:0.9041
PVE活跃付费玩家
平均PVE次数:52;主动发起PVE概率:0.9957;PVE获胜概率:0.9110

APA(付费活跃用户)玩家的平均PVE和PVP次数都是AU(活跃)玩家次数的两倍左右,显然APA玩家是重要的发展对象。
PVP活动中,APA玩家主动发起和胜利的概率都明显高于AU玩家。
PVE活动中,APA玩家主动发起和胜利的概率与AU玩家都基本持平,其中主动发起PVE的概率非常高,且二者的PVE胜率高达90%,游戏体验较好。

感谢大佬的视频,学习完对SQL的印象加深了很多https://www.bilibili.com/video/BV1Nh411d7t3

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 199,636评论 5 468
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 83,890评论 2 376
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 146,680评论 0 330
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 53,766评论 1 271
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 62,665评论 5 359
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,045评论 1 276
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,515评论 3 390
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,182评论 0 254
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,334评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,274评论 2 317
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,319评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,002评论 3 315
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,599评论 3 303
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,675评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,917评论 1 255
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,309评论 2 345
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 41,885评论 2 341