Python文件读写基本操作

文件读写是每一门编程语言的最基本的核心功能,有了文件读写功能,才能方便地存储和读取数据。

文件读写

假如当前工作目录为/mypy/,在该目录下有一个文本文件:test.txt,其内容为:

www.test.com
hello

打开文件

  • 方法1:
f = open('/mypy/test.txt')
print f
# 输出:<open file 'test.txt',mode 'r' at...>
# 注:如果打开文件的时候不指定模式,默认以`r`模式打开,表示只读
  • 方法2:
f = file('test.txt')
print f
# 输出:同上

可见,file()函数和open()函数有着相似的功能。

读取文件内容

f = open('test.txt')
print f.read()

输出:

www.test.com
hello

关闭文件

文件使用完了之后,必须关闭:

f.close()

向文件中写入内容

f = open('test.txt')
f.write('new')
# 报错:IOError: File not open for writing

这样写入内容报错的原因是,以只读方式打开的文件不允许写入内容,而要这样:

f = open('test.txt','w+')
f.write('new')

执行上面代码,发现这次没有报错,可是去看test.txt文件的内容,并没有新写入的new,这是为何呢?是因为还没有执行f.close()操作,所以文件还并没有被保存,再执行一下f.close()操作,现在再去看文件内容,发现为:

new.test.com
hello

虽然把最新内容new写入了文件,但是却是覆盖了文件的前三个字符,这不是我们想要的,我们想把内容写到文件末尾,这里牵扯到文件指针的问题(后面讲),要达到这个目的,需要这样做:

f = open('test.txt')
f.read()
f.write('new')
f.close()

再次执行上述操作,发现文件test.txt的末尾成功新增一行new

文件读写模式

模式 含义
r 只读
r+ 读写
w 写入,先删除原文件,再重新创建并写入,若文件不存在则创建
w+ 读写,先删除原文件,再重新创建并写入,若文件不存在则创建
a 写入,在文件末尾追加新内容,若文件不存在则创建
a+ 读写,在文件末尾追加新内容,若文件不存在则创建
b 打开二进制文件,可与r,w,a,+结合使用,如:wb+
U 支持所有换行符:\r, \n, \r\n,可与r,w,a,+结合,但必须以r开头,如'rUa+', 'rUw+'

注:以'w'、'a'模式打开文件,只支持写入,不支持读。

用with语句操作文件

打开文件,推荐使用上下文管理器with语句,它可以自动管理文件的打开和关闭,用了它以后就不需手工关闭文件,并且支持一次打开多个文件,非常方便,标准用法如下:

with open('test1.txt','w+') as f1, open('test2.txt','w+') as f2:
  f1.write('123')
  f2.write('456')

文件对象常用函数

open

打开一个文件,其实file()函数也可以打开一个文件,但是推荐首先open()函数。open()函数返回一个file对象,是一个可迭代对象,例如依次读取并输出一个文件的每一行的内容:

f = open('file.txt')
for line in f:
  print line

read

若不传入参数,表示从当前文件指针所在位置读到文件末尾;若传入一个表示size的参数,表示从当前文件指针所在位置往后读size个字节,例如:

f = open('file.txt')
# 从开头往后读3个字节
f.read(3)
# 从第3个字节处往后读5个字节
f.read(5)
# 从第8个字节处读到文件末尾
f.read()

close

关闭文件:

f = open('file.txt')
f.close()

readline

每次读文件的一行,如果不传入任何参数,表示每次读一行的所有字符;如果传入一个表示字节的size参数,表示读一行的前size个字节,如果上一次本行没有读完,则下一次会接着读,直到行尾。

readlines

返回一个列表,是包含一个文件的每一行内容的字符串列表。

next

返回文件的下一行。

write

往文件中从当前文件指针处写入内容。

writelines

传入一个字符串列表参数,将该字符串列表写入文件。

flush

修改文件内容后,提交更新。

seek(偏移量, 选项)

  • 选项 = 0:把文件指针从文件头部向后(不能向前)移动偏移量那么多的字节。
  • 选项 = 1:把文件指针从当前位置向后(不能向前)移动偏移量那么多的字节。
  • 选项 = 2:把文件指针从文件尾部向前移动偏移量那么多的字节。

一个原则:移动不能越界,否则会出错。

一个例子:将文件指针移到文件开头:

f = open('file.txt')
f.seek(0,0)

os模块常用函数

os模块有很多实用的文件、目录和路径操作相关的函数,下面介绍几个最经常用到的。

os.system()

基于当前目录执行shell命令,并返回命令的执行结果。函数原型:

Docstring:
system(command) -> exit_status

Execute the command (a string) in a subshell.
Type:      builtin_function_or_method

os.mkdir()

创建目录,函数原型:

mkdir(path [, mode=0777])

Create a directory.
Type:      builtin_function_or_method

举例:

# 在当前目录下创建名为dir1的目录
os.mkdir('dir1')
# 使用该方法创建嵌套多层目录会报错
os.mkdir('a/b/c')
# 列出path顶层目录下的文件和文件夹(随机顺序)
os.listdir(path)

os.makedirs()

创建多级目录,函数原型:

Signature: os.makedirs(name, mode=511)
Docstring:
makedirs(path [, mode=0777])

Super-mkdir; create a leaf directory and all intermediate ones.
Works like mkdir, except that any intermediate path segment (not
just the rightmost) will be created if it does not exist.  This is
recursive.
File:      e:\code\env\.env\lib\os.py
Type:      function

os.rmdir()

删除目录(需要是空目录),函数原型:

Docstring:
rmdir(path)

Remove a directory.
Type:      builtin_function_or_method

示例:

os.mkdir('dir1')
# 删除目录dir1
os.rmdir('dir1')

os.makedirs('a/b/c')
# c目录被删掉(若path为多级目录,则只有最低一级的目录被删掉)
os.rmdir('a/b/c')

# 删除失败,提示:OSError: Directory not empty:a,目录非空,无法删除
os.rmdir('a')

os.removedirs()

删除空的多级目录(目录中没有文件),函数原型:

Signature: os.removedirs(name)
Docstring:
removedirs(path)

Super-rmdir; remove a leaf directory and all empty intermediate
ones.  Works like rmdir except that, if the leaf directory is
successfully removed, directories corresponding to rightmost path
segments will be pruned away until either the whole path is
consumed or an error occurs.  Errors during this latter phase are
ignored -- they generally mean that a directory was not empty.
File:      e:\code\env\.env\lib\os.py
Type:      function

示例:

os.makedirs('a/b/c')
# 将'a/b/c'三级目录同时删掉
os.removedirs('a/b/c')

os.makedirs('a/b/c')
# 然后在'a/b'目录下创建一个名为'file.txt'的文件
# 发现这时只有c目录能被删掉,a、b目录及file.txt文件都还在
os.removedirs('a/b/c')

# 报错:OSError: Directory not empty:'a/b'
os.removedirs('a/b')

os.getcwd()

获取当前的工作目录,函数原型:

Docstring:
getcwd() -> path

Return a string representing the current working directory.
Type:      builtin_function_or_method

os.chdir()

修改当前的工作目录,影响os.getcwd()函数的返回值,函数原型:

Docstring:
chdir(path)

Change the current working directory to the specified path.
Type:      builtin_function_or_method

os.path的几个实用函数

  • os.path.isabs()
    判断某个路径是否是一个绝对路径。

  • os.path.isdir()
    判断某个路径是否是一个存在的路径。

  • os.path.isfile()
    判断某个路径是否是一个文件。

  • os.path.islink()
    判断某个路径是否是一个超链接。但注意到函数说明中有这么一句话:

Signature: os.path.islink(path)
Docstring:
Test for symbolic link.
On WindowsNT/95 and OS/2 always returns false

WindowsNT/95OS/2系统,os.path.islink()函数总是返回false

  • os.path.ismount()
    判断某个路径是否是一个挂载点:
Test whether a path is a mount point (defined as root of drive)
  • os.path.abspath()
    以当前工作目录为前缀,把一个相对路径转为绝对路径。

  • os.path.basename()
    获取一个路径代表的文件名(包括后缀名)。

  • os.path.exists()
    判断某个路径是否存在(可以为目录路径也可以为文件路径)。

  • os.path.join(path1,*path)
    拼接2个或多个路径,若其中一个为绝对路径,那它之前的路径都会被忽略。

os.walk(top, topdown = True, onerror = None)

遍历根目录top,递归地返回一个三元组:

(root, dirs, files)

其中,root为根目录路径,dirsroot路径下的目录列表,filesroot路径下的文件列表。

topdown参数表示是否从顶层目录开始遍历,onerror是发生错误时候的回调函数。

函数原型:

Directory tree generator.

For each directory in the directory tree rooted at top (including top
itself, but excluding '.' and '..'), yields a 3-tuple

    dirpath, dirnames, filenames

dirpath is a string, the path to the directory.  dirnames is a list of
the names of the subdirectories in dirpath (excluding '.' and '..').
filenames is a list of the names of the non-directory files in dirpath.
Note that the names in the lists are just names, with no path components.
To get a full path (which begins with top) to a file or directory in
dirpath, do os.path.join(dirpath, name).

If optional arg 'topdown' is true or not specified, the triple for a
directory is generated before the triples for any of its subdirectories
(directories are generated top down).  If topdown is false, the triple
for a directory is generated after the triples for all of its
subdirectories (directories are generated bottom up).

When topdown is true, the caller can modify the dirnames list in-place
(e.g., via del or slice assignment), and walk will only recurse into the
subdirectories whose names remain in dirnames; this can be used to prune the
search, or to impose a specific order of visiting.  Modifying dirnames when
topdown is false is ineffective, since the directories in dirnames have
already been generated by the time dirnames itself is generated. No matter
the value of topdown, the list of subdirectories is retrieved before the
tuples for the directory and its subdirectories are generated.

By default errors from the os.listdir() call are ignored.  If
optional arg 'onerror' is specified, it should be a function; it
will be called with one argument, an os.error instance.  It can
report the error to continue with the walk, or raise the exception
to abort the walk.  Note that the filename is available as the
filename attribute of the exception object.

By default, os.walk does not follow symbolic links to subdirectories on
systems that support them.  In order to get this functionality, set the
optional argument 'followlinks' to true.

Caution:  if you pass a relative pathname for top, don't change the
current working directory between resumptions of walk.  walk never
changes the current directory, and assumes that the client doesn't
either.

Example:

import os
from os.path import join, getsize
for root, dirs, files in os.walk('python/Lib/email'):
    print root, "consumes",
    print sum([getsize(join(root, name)) for name in files]),
    print "bytes in", len(files), "non-directory files"
    if 'CVS' in dirs:
        dirs.remove('CVS')  # don't visit CVS directories
File:      e:\code\env\.env\lib\os.py
Type:      function
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 205,386评论 6 479
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,939评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,851评论 0 341
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,953评论 1 278
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,971评论 5 369
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,784评论 1 283
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,126评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,765评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,148评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,744评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,858评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,479评论 4 322
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,080评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,053评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,278评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,245评论 2 352
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,590评论 2 343

推荐阅读更多精彩内容