这是很早之前面的,第一次面数据分析的面试,当时还傻乎乎的以为数据分析和数据挖掘是一回事呢。结果才发现,数据分析岗位大多注重的是数据库的能力,比如sql语句的考察,hive的考...
这是很早之前面的,第一次面数据分析的面试,当时还傻乎乎的以为数据分析和数据挖掘是一回事呢。结果才发现,数据分析岗位大多注重的是数据库的能力,比如sql语句的考察,hive的考...
一、在mysql操作中我们经常需要对数据进行类型转换。此时我们应该使用的是cast()或convert()。 二、两者的对比 相同点:都是进行数据类型转换,实现的功能基本等同...
合并excel
合并Excel中的sheet表 背景:系统导出来的的excel三年数据百万条,但是只有一个子类的是明细数据。其余数据都是按照子类的长度进行合并行处理过的;所以在进行数据清洗的...
创建多重索引 查询索引为1,3,6的值 多重索引Series切片 多重索引DataFrame 多重索引设置列名称 DataFrame行列名称转换 DataFrame索引转换 ...
一.筛选类函数 二.逻辑与逻辑判断函数 三.时间日期类函数 统计聚合函数 四.文本函数
初始设置显示中文 查看原始数据有无重复值 agg函数pandas引入了agg函数,它提供基于列的聚合操作。而groupby可以看做是基于行,或者说index的聚合操作。 绘制...
1.set_index DataFrame可以通过set_index方法,可以设置单索引和复合索引。DataFrame.set_index(keys, drop=True, ...
数据来源Kaggle上关于黑五期间销售数据,网址如下:https://www.kaggle.com/mehdidag/black-friday/version/1 阅读路线:...
题目一、学生表 如下: 自动编号学号姓名 课程编号 课程名称 分数 1 2005001 张三 0001 数学 69 2 2005002 李四 0001 数学...
IF函数 =IF(And(条件1,条件2),两个条件同时成立返回的值,不成立返回的值) =IF(OR(条件1,条件2),两个条件字成立返回的值,都不成立返回的值) Vlook...
案例及代码来源:https://www.jianshu.com/p/4778bffbfcc6 from datetime import datetime %matplotli...
切比雪夫定理:可用于判断异常值 75%的数据,位于平均数两个标准差范围内 89%,3个 96%,5个 切比雪夫定理2: 正态分布中,68%的数据位于平均数1个标准差范围内 9...
query函数 index=df.query('index>200').index (引号为必须) loc, iloc函数 df.loc[(df['group']=='tre...