文本文件读写

一、文件的打开

1.普通文件:数据持久化的最简单类型,仅仅在一个文件名下的字节流(流的意思是按照顺序一个字节以个字节访问),把数据从文件读入内存,从内存写入文件
1.1 open()函数:基本语法如下图:
f = open(filename[,mode[,buffering]])#带有三个参数第一个是文件名,第二个mode意思是访问模式对指定的文件要进行说明操作的意思,第三个参数是缓冲一般默认缺省为-1就可以了
f:open()返回文件对象
filename:文件的字符串名
mode:可选参数,打开模式和文件类型
mode参数第一个字母表明对其的操作如下图:
r:表示读模式 #表示从文件中把数据读出来
w:表示写模式 #把内存当中的一些数据写到外层的文件当中
x:表示在文件不存在的情况下新创建并写文件
a:表示在文件末尾追加写内容
+:表示读写模式,可以在读写之间来回切换
mode参数第二个字母表明对其的操作如下图:
t:表示文本类型
b:表示二进制文件

二、文件的读写和访问

1.文件的写操作如下图:
f.write(str)  #写一个字符串到文件中
f.writelines(strlist)  #写入字符串列表
2.文件的读操作如下图:
f.read() #如果不加任何参数它会把整个文件的所有内容都读到内存中
f.readline():返回一行(一行读完以后文件位置的指针会自动跳到下一行,如下次再调用readline就会把下一行读出来,一直读到文件结束)
f.readlines():返回所有行列并且把它放在列表当中去,列表当中的每一个元素就是一行
对文件的操作举个例子如下图:
>>> f = open('my.txt','w') #以w的形式把my.txt文件打开
>>> f.writelines(['apple\n','pie\n']) #在文件中写入两行字符串,python的writelines并不自动添加换行,所有需要在每行后面加一个换行符
>>> f.close() #关闭文件
>>> f=open('my.txt','r') #以r的形式把my.txt文件打开
>>> f.readlines() #把所以的行列读入内存中
['apple\n', 'pie\n'] #以列表的形式返回包括换行符也被保存下了,列表中的每一个元素都是一行,
>>> f.close()#关闭文件

三、文件的关闭

1.打开文件要记得关闭,关闭的作用是终止对外部文件的连接,同时将缓存区的数据刷新到硬盘上
2.文件的关闭直接调用(f.close)就可以了
3.使用上下文管理器(context manager),确保在退出后自动关闭文件如下图所示:
with open('textfile','rt') as myfile:       #使用上下文管理器这里需要用with这个关键字,打开这个文件并对这个文件重新命名为myfile
      myfile.read()
      ...
      ...
      ...
在myfile后面有一个冒号所以后面的语句都需要缩进,而这些在with下面的语句不管对它做什么样的操作,最后它都会自动关闭文件

四、结构化文本文件:(csv)

1.c表示逗号的意思s表示分隔符v表示值的意思,即csv文件是以纯文本文件的形式出现的以逗号分隔的文本文件。这里有几点注意如下图:
csv文件值没有类型,所有值都是字符串
不能指定字体颜色等样式
不能指定单元格的宽高,不能合并单元格
没有多个工作表
不能嵌入图像图表
2.对csv文件的基本操作语法如下图:

图1、读的操作reader、DictReader,这里的DictReader是对带有表头文件的读取

import csv #首先调用csv这个模块
re = csv.reader() #reader可以接受一个可迭代对象(比如csv文件),能返回一个生成器,可以从中解析出内容。


import csv
re = csv.DictReader()
#使用方式与reader类似,也是有一个生成器可以逐行去访问,但返回的每一个单元格都放在一个元组的值内

图2、写的操作

import  csv
w = csv.writer() #当文件不存在时,自动生成,支持单行写入和多行写入
w.witerow(rows)


w = csv.Dictwriter() #以字典数据写入
w.writeheader()
w.writerow(rows)

图3、实例如下图

import csv
with open('test1.csv','w',newline='') as f:    #以写的方式打开test1.csv文件并重命名为f,newline='是为了去空格
    w = csv.writer(f)
    w.writerow(('name', 'tel', 'address', 'age')) #写入内容
    w.writerow(('zhang', 15111111111, 'beijing', 33))
    w.writerow(('li', 13822222222, 'wuhan', 28))
    w.writerow(('liu', 15933333333, 'hainan', 25))
    w.writerow(('rows',1110))
with open('test1.csv','r',newline='') as f: #以读的方式打开文件
    reader = csv.reader(f)
    for i in reader:                        #读取文件内容
        print(i)

输出

F:\j\venv\Scripts\python.exe F:/j/demo22.py
['name', 'tel', 'address', 'age']
['zhang', '15111111111', 'beijing', '33']
['li', '13822222222', 'wuhan', '28']
['liu', '15933333333', 'hainan', '25']
['rows', '1110']
Process finished with exit code 0

五、结构化文本文件:Excel

1.openpyxl模块:该模块可以用来读写扩展名为xlsx/xlsm/xltx/xltm的文件

workbook类是对工作簿的抽象
worksheet类是对表格的抽象
cell类是对单元格的抽象文件写操作

2.操作之前先导入第三方库

安装:pip install openpyx1
导库:from openpyxl import workbook

3.创建Excel文件

一个workbook对象代表一个excel文档,使用该方法创建一个worksheet对象后才能打开一个表,基本语法如下图:

form openpyxl import workbook
wb = workbook()
ws = wb.active
4.读取excel文件基本语法如下图:
from openpyxl import load_workbook
wb = load_workbook(filename)
ws = wb.file.active
5.获取单元格的信息基本语法如下图:
1.获取Cell对象
c = wb['sheet'] ['A1']
c = wb['sheet'].cell(row=1,column=1)
#获取Cell对象之后可以获取坐标和单元格的值
c.coordinate:返回单元格坐标
c.value:返回单元格的值
c.column:返回单元格所在列坐标

六、结构化文本文件:PDF

1.处理pdf文件的库:pyPDF2

pyPDF2包含了pdfFileReader、pdfFileMerger、pageobject和pdfFileWriter四个主要类,可以对PDF文件进行读写、分割、合并、文件转换等多种操作,但是只能从PDF文档中提取文本并返回为字符串,而无法提取图像、图表或其他媒体

2.读取PDF文件基本语法如下图:
readFile = open('test.pdf','rb') #用open打开获得一个文件对象readFile
pdfFileReader = pdfFileReader (readFile)#用pdfFileReader这个类处理这个文件对象再返回给pdfFileReader
3.pdfFileReader类

getNumpages():计算PDF文件总页数
getpage(index):检索指定编号的页面

4.PDF文件的写操作基本语法如下图:
writeFile = 'output.pdf'
pdfFileWriter = pdfFileWriter()
5.pdfFileWriter类

.addpage(pageobj):根据每页返回的pageobject,写入到文件

6.合并多个文档基本语法如下图:
pdf_merger = pdfFileMerger()
pdf_merger.append('py2018.pdf')
pdf_merger.merge(10,'insert.pdf')
pdf_merger.write('merge.pdf')
7.单个页面操作:pageobject类

.extractText():按照顺序提取文本
.getContents():访问页面内容
.rotateClockwise(angle):顺时针旋转
.scale(sx,sy):改变页面大小

这节内容举例不多,写的不够完善后续再完善不全
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,390评论 5 459
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,821评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,632评论 0 319
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,170评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,033评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,098评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,511评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,204评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,479评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,572评论 2 309
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,341评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,213评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,576评论 3 298
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,893评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,171评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,486评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,676评论 2 335

推荐阅读更多精彩内容

  • 一、Python简介和环境搭建以及pip的安装 4课时实验课主要内容 【Python简介】: Python 是一个...
    _小老虎_阅读 5,688评论 0 10
  • 关于Mongodb的全面总结 MongoDB的内部构造《MongoDB The Definitive Guide》...
    中v中阅读 31,862评论 2 89
  • 转自链接 目录 1.认识NPOI 2.使用NPOI生成xls文件 2.1创建基本内容 2.1.1创建Workboo...
    腿毛裤阅读 10,293评论 1 3
  • 使用首先需要了解他的工作原理 1.POI结构与常用类 (1)创建Workbook和Sheet (2)创建单元格 (...
    长城ol阅读 8,372评论 2 25
  • “又是这个人。” 唐罕睁大眼睛看着屏幕上那个熟悉的红色影子,按下了暂停键。 “健豪,你看那个穿红衣服的人又出现了。...
    L的翅膀阅读 850评论 7 13