实际案例
将文件内容写入到硬件设备时,使用系统调用,这类I/O操作的时间很长。为了减少I/O操作的次数,文件通常使用缓冲区,当有足够多的数据时才进行系统调用。文件的缓冲行为,分为全缓冲、行缓冲和无缓冲。
那么如何设置Python中文件对象的缓冲行为?
解决方案:
- 全缓冲:open函数的buffering设置为大于1的整数n,n为缓冲区大小
- 行缓冲:open函数的buffering设置为1
- 无缓冲:open函数的buffering设置为0
全缓冲代码如下:
# -*- coding: utf-8 -*-
# 全缓冲
f = open('demo_1.txt', 'w', buffering=1024)
f.write('abc')
注:此处不能调用close(),因为一旦调用该方法,我们不能对文件进行读写操作,进而缓冲区中的数据会在文件读写权限关闭之前将数据写入文件,致使我们设置文件的缓冲的目的失败。
运行上述代码,我们打开demo_1.txt文件查看是否写入数据。不出意外,我们打开该文件是看不到“abc”的这三个字母的。为了验证我们的缓冲区是否设置成功,我们在上述代码的基础上添加如下代码:
f.write("*" * 1021)
我们再运行一下,打开demo_1.txt文件发现仍旧是空文件。我们再来看看代码,现在我们使用了1024B,这时我们只要再写入一个字符,之前缓冲区中的数据就会写入文件。不妨尝试一下,我们继续添加如下代码:
f.write("+")
运行程序并打开demo_1.txt文件,我们发现其内容如下:
abc*************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************
这时,我们可以发现在文件内容中并没有我们最后添加的“+”。因此,我们可以断定当我们输入的数据大于缓冲区n的大小时,Python会将缓冲区n大小的数据写入文件中,为后面我们输入的数据腾出空间进行缓存。
行缓冲代码如下:
# 行缓冲
f = open('demo_2.txt', 'w', buffering=1)
f.write("abcd")
f.write("123456")
运行上述代码并打开demo_2.txt文件发现该文件为空文件。既然是行缓冲,我们猜想是不是要换行才会将缓冲区的数据写入文件。因此,我们添加如下代码:
f.write("\n")
这时,我们打开demo_2.txt文件就可以看到我们输入的数据了。
注:行缓冲一般用于“交互式”文本文件,在Windows系统本人未成功实现行缓冲代码功能,但在Linux系统下成功实现行缓冲代码功能。
无缓冲代码如下:
# 无缓冲
f = open('demo_3.txt', 'w', buffering=0)
f.write('abc')
运行程序并打开demo_3.txt文件发现数据已经写入到文件中。