简介: 本文主要介绍DataFrame过滤数据的方法和原理。
-
过滤机制
可以按照下列方法,依据列的值过滤DataFrame处理某些符合条件的行
dataframe[ 条件 ]
dataframe[ dataframe["colname"] > value ]
dataframe[ dataframe["colname"] < value ]
dataframe[ dataframe["colname"] != value ]
-
推导过程
对特定的列进行值的比较判断,得到的将是一个boolean数据类型的Series。
boolean_array = dataframe["colname"] > value ————> Series type with bool values
dataframe[boolean_array] —————> DataFrame filtered
||
dataframe[ dataframe["colname"] > value ] —————> DataFrame filtered
-
多条件过滤
注意需要使用 & | 操作符,而不是and,or 操作符。
dataframe[ dataframe["col1"] > val1 & dataframe["col2"] != val2]
附上小哥哥的视频链接Data analysis in Python with pandas
Youtube 🔗
哔哩哔哩 🔗
所有文章列表
pandas使用技巧总览