一、文件的使用
Python对文本文件和二进制文件都有统一的操作步骤,即“打开-操作-关闭”
操作文件的流程:
1.文件的打开和关闭
内置函数open()可以用指定模式打开指定文件并创建文件
使用方法:变量名= open(文件路径及文件名,模式)
注:路径中由于\是转义符,所以表示路径时,使用\\或/
打开模式中,'r'、'w'、'x'、’a'可以和'b'、't'、'+'组合使用,形成既表达读写又表达文件模式的方式。
文件使用结束后要用close()方法关闭,释放文件的使用授权
2.文件的读写(注:假如文件变量为f)
f.read(size=-1):从文件中读入整个文件内容
参数可选,如果给出则读入前size长度的字符串或字节流。其结果是一个字符串。
f.readline(size = -1): 从文件中读入一行内容。
参数可选,如果给出,读入该行前size长度的字符串或字节流。其结果是一个字符串。
f.readlines(hint=-1):从文件中读入所有行,以每行为元素形成一个列表。
参数可选,如果给出,读入hint行。
文件打开后,对文件的读写有一个读取指针,当从文件中读入内容后,读取指针将向前进,再次读取的内容将从指针的新位置开始。
f.seek(offset): 改变当前文件操作指针的位置,offset的值:0:文件开头;2:文件结尾
从文本文件中逐行读入内容并进行处理是一个基本的文件操作需求。文本文件可以看成是由行组成的组合类型,因此,可以使用遍历循环逐行遍历文件。
f.write(s): 向文件写入字符串s,每次写入后,将会记录一个写入指针。该方法可以反复调用,将在写入指针后分批写入内容,直至文件被关闭。
f.writelines(lines):直接将列表类型的各元素连接起来写入文件f。
文件读写操作相关的函数都会自动改变文件指针的位置。
文件路径:绝对路径、相对路径
二、数据组织的维度
数据组织可以分为:一维数据、二维数据和高维数据
一维数据:由对等关系的有序或无序数据构成,采用线性方式组织,对应于数学中数组的概念。
例: 北京、上海、天津、重庆
二维数据:也称为表格数据,由关联关系数据构成,采用二维表格方式组织,对应数学中的矩阵。
高维数据:高维数据由键值对类型的数据构成,采用对象方式组织,可以多层嵌套
高维数据在Web系统中十分常见,作为当今Internet组织内容的主要方式,高维数据衍生出HTML、XML、JSON等具体数据组织的语法结构。
以JSON为例:
三、一维数据的处理
•一维数据的表示
在Python中主要采用列表形式表示。
例如中国的直辖市可以采用一个列表变量表示
•一维数据的存储
总体思路是采用特殊字符分隔各数据。
CSV格式(逗号分隔值)
一种通用的、相对简单的文件格式,存储的文件一般采用.csv为扩展名。一维数据保存为CSV格式后,各元素采用逗号分隔,形成一行,这里的逗号是英文逗号
四、二维数据的处理
•二维数据的表示:
二维数据由多个一维数据构成,可以看作是一维数据的组合形式,因此二维数据可以采用二维列表来表示,即列表的每个元素对应二维数据的一行。
注:二维数据一般采用相同的数据类型存储数据,便于操作
•二维数据的存储:
用CSV格式文件存储,CSV文件的每一行是一维数据,整个CSV文件是一个二维数据。