文本清洗
【字符串概念】
1bit用0或1;1byte=8bit,2^8,共有256中可能性,即ASCII;汉字更多可能性(GB2312,GBK,GB18030);万国码(Unicode),但外文存储太大,16位;UTF-8,8位(ASCII与UTF-8可兼容,但中文要32位)
任何字符串都有编码规则(UTF-8,GB2312,ASCII),但在电脑中都用0、1存储
Find定位:=FIND(find_text,within_text,start_num)
Left Right Mid取数:
=LEFT(text, [num_chars])、RIGHT(text,[num_chars])、MID(text, start_num, num_chars)
Concatenate字符串连接或合并函数:=CONCATENATE(a1,b1,c1)
Replace替换,可以精确定位:=REPLACE(old text,start num,num chars,new text)
Subtitute替换,可以去除一些字段:=SUBTITUTE(text,old text ,new text,[instance num])
Text数值转化为文本,通过使用特殊格式字符串来指定显示格式:=TEXT(value,format_text)
Trim清除左右的空格:=TRIM(text)
若清除内部空格,需要用substitute,如:=SUBSTITUTE(A2," ","")
Len返回文本串中的字符数,常与其他函数一起使用:=Len( text)
关联匹配
Lookup:
1. 模糊查找,=LOOKUP(lookup_value,lookup_vector,result_vector)
2. 逆向查找,=LOOKUP(1,0/(条件),查找区域或数组)
3. 查询A列最后一个文本,=LOOKUP("座",A:A )
4. 查询A列最后一个数值,=LOOKUP(9E307,A:A),A列最后一个单元,=LOOKUP(1,0/(A:A<>""),A:A)
5. 根据简称查找全称
6. 多个区间的条件判断,e.g. =LOOKUP(B2,{0,50,60,75,86,96;"很差","差","一般","较好","优秀","能手"})
VLookup:使用上比lookup函数简单,一般用于精确查找(false或0)
=VLOOKUP(lookup_value,table_array,col_index_num,range_lookup)
Index:查找交叉项的值
1. 在一个连续区域内查找,=INDEX(array,row_num,column_num)
2. 在多个不连续区域内查找,array_num指的是第几个区域
=INDEX( (array_1,array_2,array_3....array_n),row_num,column_num,array_num)
Match:
match-type:表示查询的指定方式,用数字-1、0或者1表示(0表示精确匹配,1或省略表示查找小于或等于制定内容的最大值,-1表示查找大于或等于制定内容的最小值)
=MATCH(lookup_value,lookuparray,match-type)
Match与Index的作用
多条件查找,需要用到数组公式
Row返回所在单元格的行数:
=ROW(reference)
Column返回所在单元格的列数:
=COLUMN(reference)
Offset上下左右偏移得到新的区域的引用:height和width可以省略,表示引用一个单元格
=OFFSET(reference,rows,cols,height,width)
!!!数组快捷键:control+shift+enter
!!!绝对引用快捷键:Command+T
逻辑运算函数:
True=1,False=0
=R2="XX",会返回true,false。可以几列相加,做多条件满足
And
=And(true,false)
Or
IF作为一个过滤,可以多层嵌套
=IF(logical_test, [value_if_true], [value_if_false])
=IFERROR(value, value_if_error)
Is
Not
False True
计算统计函数
Sum
Sumproduct累加相乘
Sumif:
Count,计数,不计算为空的
Countif:条件计数
Countifs:多个条件计数
Max
Min
Rank查找排名
Rand
Randbetween随机抽样
Average
Averageif:比如小于10的人的平均薪资是多少
Quartile分位数
Stdev标准差
Substotal:万能函数,可以一次完成15个函数功能
Int:取整,只能向下取整
Round:四舍五入需求
时间序列函数
时间的本质就是数字,都是数字的加减
Year:
Month:
Day:返回一月中的第几天
Date:
Weekday:零售行业中,=WEEKDAY(,)用2表示星期一是第几天
Weeknum:本周是一年中的第几天
Now:返回当前时间
Today:返回当前日期。距今。
Excel快捷键
Ctrl+方向键,光标快速移动
Ctrl+shift+方向键,快速选框
Ctrl+空格键,选定整列
Shift+空格键,选定整行
!!!EXCEL中自动分列功能
数据透视表:切片功能
如何应用?
数组
lookup函数划分档次
定义名称
删除重复值
制作下拉菜单(数据输入时)
迷你图 Sparkline
数据透视表后黏贴到新表
用LOG收敛,基地越大,收敛越多,敏感度越小
归一化,收敛