今天是读《pyhton数据分析基础》的第15天,今天读书笔记的内容为使用pandas模块的数据框类型。
数据框(DataFrame)类型其实就是带标题的列表。很多时候,整个数据框的数据并不会一次性的用于某一部的分析,而是选用某一列或几列的数据进行分析,此时就需要获取数据框的部分数据。
获取方式如下:
获取方式1:使用DataFrame.loc[]
#调用某两行两列交汇的数据
#[index1,index2]表示引用索引号为index1和index2的两行数据
#[colName1,colName2]表示引用列标题为colName1和colName2的列数据
DataFrame.loc[[index1,index2],[colName1,colName2]]
获取方式2:使用DataFrame.iloc[]
#调用某两行两列交汇的数据
#索引号从0开始算,若为连续的行数,则算头不算尾
#以下行代码所选取的数据相同
#1:3、[1,2]表示行索引号,选取第二行和第三行
#3:5、[3,4]表示列索引号,选取第四列和第五列
DataFrame.iloc[1:3,3:5]
DataFrame.iloc[[1,2],[3,4]]