文件的操作流程为:1、打开
2、文件处理
3、关闭
一、文件的简单操作
现在有一个名为“yesterday”的文件,基本的操作如下所示
f = open("yesterday", "r", encoding="utf-8")#句柄
data = f.read()#读取
f.close()#关闭
其中open()函数中填写的三个参数为(“文件名称”,“打开文件的模式”,“编码”)。
打开文件时,以不同的模式打开的话,操作文件的能力也不一样。以下是打开文件模式以及他们的区别为:
r,只读模式(默认)。
w,只写模式。【不可读;不存在则创建;存在则删除内容;】
a,追加模式。【可读; 不存在则创建;存在则只追加内容;】
"+" 表示可以同时读写某个文件
r+,可读写文件。【可读;可写;可追加(追加为写入的东西,出现在文章末尾)】
w+,写读
a+,同a
"U"表示在读取时,可以将 \r \n \r\n自动转换成 \n (与 r 或 r+ 模式同使用)
rU
r+U
"b"表示处理二进制文件(如:FTP发送上传ISO镜像文件,linux可忽略,windows处理二进制文件时需标注)
rb
wb
ab
二、处理文件的方法
1、文件读取
读取文件的方法有如下几种
data = f.read(10)#()中填入数字为10,表示读取10个字符
data = f.readline()#只读一行
data = f.readlines())#以行分割,返回值为列表
2、文件遍历
而如果要遍历一个文件的所有内容时,有如下两种方法
for line in f.readlines():
print(line.strip())
这种方法是先把文件中的内容整体从磁盘上读取到内存,然后在进行遍历。如果文件过大的话,这种方法会很耗时,而且占用内存也会过大。那么如何优化遍历方法那,如果可以一句一句的从磁盘上读取到内存然后输出,这样问题就解决了。所以可以用下面的方法
for line in f:
print(line)
3、光标
在操作文件时,你可以想象其实是有一个光标在文件的内容里,以标注你目前操作的位置所以如果你只打开一次文件,全部读取一次后,在想读取第二次是读不出东西的,因为此时光标的位置已经在最后了,只有没有东西可读了。正如下所示
f = open("yesterday", "r", encoding="utf-8")#句柄
data = f.read()#读取文章的全部内容
print("%s" % data)
data1 = f.read()#再次读取文章的内容
print("----", data1)#无输出值
f.close()
所以此时想要再次读取文件的话就需要对光标位置进行调整。常用光标的操作有如下几种
f.tell()#返回光标的位置
f.seek(0)#光标返回原点
f.seekable()#判断光标是否能移动,有一些文件内容是不能读的
4、实时刷新
当写入文件的时候,会有个缓存,如果缓存满了才会往硬盘上写入,然后清空缓存。如果想要在缓存没有满的情况下就把现在已有的东西写入硬盘,以防止突然死机等状况可以实时刷新一下。
import sys,time
for i in range(50):
sys.stdout.write("#")
sys.stdout.flush()
time.sleep(1)
flush()就是会把现在已经写在内存的内容实时刷新到磁盘的函数了。
5、修改
重新创建一个文件,然后从原文件中一句一句的读取并判断是否是要修改的那句。然后再把正在操作的那句写入新的文件中。
f = open("yesterday", "r", encoding="utf-8")
f_new = open("yesterday2", "w" ,encoding="utf-8")
for line in f:
if "原内容" in line:
line = line.replace("原内容", "修改过的内容")
f_new.write(line)
f.close()
f_new.close()
6、很多时候总是会忘记关闭文本,此时可以通过管理上下文。具体如下
with open("yesterday", "r", encoding="utf-8") as f:
pass
此时就不用担心忘记关闭了。如果要打开多个文件时
with open("yesterday", "r", encoding="utf-8") as f,\
open("yesterday", "r", encoding="utf-8") as a:#其中"\"为换行符
pass
相关代码下载地址:https://github.com/zhangyunf/python-.git