对数据间不同变量进行EDA展示,看出不同变量间的关系,和哪些数据可能异常。
导入需要的包和数据。
定义函数,通过正则表达式,获取不同国家分类。
引入统计函数。按国家对数据分类。
绘制不同国家的曲线图。
EDA展示成功,可以发现因为某些原因,中文的维基词条使用次数很低。
而俄语有异常,当时可能有一些现象级的热门事件的发生。
英语是使用次数最多的。
对数据间不同变量进行EDA展示,看出不同变量间的关系,和哪些数据可能异常。
导入需要的包和数据。
定义函数,通过正则表达式,获取不同国家分类。
引入统计函数。按国家对数据分类。
绘制不同国家的曲线图。
EDA展示成功,可以发现因为某些原因,中文的维基词条使用次数很低。
而俄语有异常,当时可能有一些现象级的热门事件的发生。
英语是使用次数最多的。