从文件中读取数据
- 使用文本文件中的信息,首先需要将信息读取到内存中。可以选择一次性读取文件的全部内容,也可以选择逐步读取
读取整个文件 read()
with open('pi.txt') as read_file:
contents = read_file.read()
print(contents)
open()打开文件接收一个参数:要打开的文件的名称,open返回一个表示文件的对象
with表示在不需要访问文件后将其关闭。而无需调用close.但是调用close会有问题,如果程序存在bug导致close()没有执行。那么文件将不会关闭
read()读取文件的全部内容,read()在到达文件末尾时会返回一个空的字符串。如果要不显示这个空字符串使用rstrip()
也可以设置最大的读入字符数限制read()函数一次返回的大小。
poem = ''
chunk = 10
with open('read_chunk.log', 'rt') as file:
while True:
fragment = file.read(chunk)
if not fragment:
break
poem += fragment
print('finish')
print(len(poem))
逐行读取
- readlines()调用时每次读取一行,并返回单行字符串列表
with open('pi.txt') as read_file:
for line in read_file:
print(line.rstrip())
创建包含文件各行内容的列表
- 使用关键字with,open()返回的文件对象只在with代码块内可用。如果要在with代码块外访问文件的内容,可在with代码块内将文件的各行存储在一个列表中
with open('pi.txt') as file_reader:
lines = file_reader.readlines()
for line in lines:
print(line.rstrip())
readlines从文件中读取每一行并将读取到的数据存储在一个列表中。
写入文件
写入空文件
- 要将文本写入文件,需要在调用open()时需要提供一个实参。告诉Python要写入打开的文件
filename = 'piwrite.txt'
with open(filename,'w') as file_write:
file_write.write('123456')
- open传入的实参中‘w’是告诉python以写入模式打开文件。
- r 读取模式
- w 写入模式
- a 附加模式
- r+ 读取和写入模式
- x 表示在文件不存在的情况下新创建并写文件
- t(或者省略)代表文本类型
- b 代表二进制文件
- 如果要写入的文件不存在,函数open()将自动创建。如果以写入'w'模式打开文件时指定的文件已经存在,python将在返回文件对象前清空该文件
- Python只能将字符串写入文本文件。要将数值等数据存储到文本文件中,必须先使用函数str()将其转换为字符串格式
写入多行文件
- write()不会再写入的文本末尾添加换行符。需要在写入的文本中指定‘\n’换行
使用write()写二进制文件
如果文件模式字符串中包含'b',那么文件会以二进制模式打开,在这种情况下,读写的是字节而不是字符串
使用seek() 改变位置
无论是读或者写文件,Python都会跟踪文件汇总的位置,函数tell()返回距离文件开始处的字节偏移量。函数seek()允许跳转到文件其他字节偏移量的位置。
seek跳转的是字节的偏移量,所以打开文件方式需要使用二进制模式b
- seek(offset,origin)
- 如果origin等于0,从开头偏移offset个字节
- 如果origin等于1,从当前位置处偏移offset个字节
- 如果origin等于2,距离最后结尾处偏移offset个字节
- 系统常量定义
import os
os.SEEK_SET # 从文件开头偏移offset个字节
>>> 0
os.SEEK_CUR # 从当前位置处偏移offset个字节
>>> 1
os.SEEK_END # 从距离最后结尾处偏移offset个字节
>>> 2
import os
with open('read_chunk.log', 'rb') as file:
print(file.tell()) # 返回当前距离文件开始的偏移量
print(file.seek(1, os.SEEK_END))
结构化的文本文件
XML
在Python中解析XML最简单的方法是使用ElementTree
- tag是标签字符串
- attrib 是它属性的一个字典
import xml.etree.ElementTree as et
tree = et.ElementTree(file='test_xml.xml')
root_tag = tree.getroot()
print(root_tag.tag)
for child in root_tag:
print(child.tag)
note
to
from
heading
body
json
Python使用json模块来进行json解析
- 使用json的dumps将menu编码城JSON字符串
import json
json_str = ''
with open('json_file', 'rt') as file:
json_str = file.read()
json = json.dumps(json_str)
print(json_str)
>>> {"breakfast": { "hours": "7- 11", "items": { "breakfast burritos": "$6. 00", "pancakes": "$4. 00" } }, "lunch" : { "hours": "11- 3", "items": { "hamburger": "$5. 00" } }, "dinner": { "hours": "3- 10", "items": { "spaghetti": "$8. 00" }}}
- 使用loads把json字符串解析成Python的数据结构
import json
json_str = ''
with open('json_file', 'rt') as file:
json_str = file.read()
json_a = json.dumps(json_str)
# 将json字符串解析成Python数据结构
python_data = json.loads(json_a)
test = eval(python_data)
print(test)
异常
Python使用被称为异常的特殊对象来管理程序执行期间发生的错误。当Python发生错误时,都会创建一个异常对象。如果处理了异常,程序将继续运行。如果没有对异常进行处理,程序将停止。
- 异常是使用try-except代码块处理的。try-except让Python执行指定的操作。
处理ZeroDivisionError异常
try:
print(5/0)
except ZeroDivisionError:
print('error happend')
- try-except捕获异常后程序可以继续执行
try:
print(5/0)
except ZeroDivisionError:
print('error happend')
# else:
print('program continue') #这行代码会被执行
异常else代码块
try-except-else:Python尝试执行try代码块中的代码;如果try代码块中的代码成功执行,则会后续执行else代码块中的代码。
try:
print(5/0)
except ZeroDivisionError:
print('error happend')
else:
print('program continue')
finally代码块
异常处理中的finally代码块是最后执行的,无论是否有异常,finally代码块肯定会执行
t = 0
try:
i = 5
t = 5 / 0
except Exception as e:
print(e)
t = 3
finally:
print(t)
主动触发异常
使用raise 可以主动抛出异常,raise代表程序会主动触发一个异常。被捕获
t = 0
try:
i = 5
raise Exception('error')
except Exception as e:
print(e)
t = 3
finally:
print(t)
>>>
error
3
处理FileNotFoundError异常
- 在使用文件时,要查找的文件可能不存在,我们使用下面的程序
filename = 'pi2.txt'
with open(filename) as file_obj:
print(file_obj)
当pi2.txt不存在时会引发异常,我们使用异常捕获这个异常,可以发现程序不会报错
filename = 'pi2.txt'
try:
with open(filename) as file_obj:
print(file_obj)
except FileNotFoundError:
print('file not found')
print('program continue')
使用pass替代执行语句
- Python中有一个pass语句,可在代码块中使用,pass语句充当了占位符,表示什么都不做
filename = 'pi2.txt'
try:
with open(filename) as file_obj:
contents = file_obj.read()
except FileNotFoundError:
pass
使用json模块来存储数据
模块json能够将简单的Python数据结构转储到文件中,并在程序再次运行时加载该文件中的数据,json在Python之间可以分享数据。
使用json.dump()和json.load()
- 函数json.dump()接受两个实参:
1、要存储的数据
2、存储数据的文件对象
import json
numbers = [1, 2, 3, 4, 5, 6, 7]
filename = 'pi2.txt'
try:
with open(filename, 'w') as file_obj:
json.dump(numbers, file_obj)
except FileNotFoundError:
pass
else:
print('program success')
json.load()读取数据
- json.load()传入要读取的文件对象
import json
filename = 'pi2.txt'
try:
with open(filename, 'r') as read_file:
numbers = json.load(read_file)
except FileNotFoundError:
pass
else:
print(numbers)
- eg: 记住用户名称
import json
filename = 'user.json'
# 读取文件捕捉异常
try:
with open(filename) as user_file:
username = json.load(user_file)
except FileNotFoundError:
username = input('plz input your name')
with open(filename, 'w') as user_write_file:
json.dump(username, user_write_file)
print("i remeber you when you come back i'll call you")
else:
print('hello' + username)