今日内容:
1.包的使用
2.json与pickle模块
3.hashlib模块
一.包的使用
什么是包:包是一个含有init文件的文件夹,本质就是一个模块,是用来被导入的
首次导入包这种模块发生的两件事:
1.创建模块的名称空间,运行包下的init文件,将运行过程中产生的名字都丢到模块的
名称空间中
2.在当前位置拿到包的名称,这个名称是指向init文件的名称空间,即模块.名字,这个名字是来自init的
1.包的导入
文件在包的init文件中,有两种导入方式:
1.用绝对路径导入:此方法,可以在本包中导入其他任意位置的其他包,但是需要把包加入到sys.path中
#文件init
from p.m1 import f1
#文件m1
def f1():
print('from f1')
#用户使用
import sys
from p import f1
sys.path.append(包的路径)
f1()
2.用相对路径:此方法用.表示当前文件夹,..表示上一次,此后每加一个点都会到上一层目录,但是不会超过根目录
# 当m1与init同级时候
from .m1 import f1
#文件m1
def f1():
print('from f1')
#用户使用
from p import f1
二.json模块与pickle模块
1.什么是序列化与反序列化
我们把对象(或变量)从内存变成可存储或可传输的过程称之为序列化,在python中被称为picking
自定义的类的实例如何保存在一个文件中?如何从文件中读取数据,并让他们在内存中再次恢复成自己对应的类的实例?
按照某种规则,把内存中的数据保存到文件中,文件是一个字节序列,所以必须要把内存数据转换成为字节序列,输出到文件,这就是序列化;反之,从文件的字节恢复到内存,就是反序列化
2.为何要序列化
1.存档:把内存的数据持久化到硬盘中,在python中推荐pickle
2.跨平台交互数据,推荐json
3.如何序列化
①:在我们还没学习模块前的序列化与反序列化(之后不要使用,low)
# 1.序列化
items=["无尽之刃","魔宗","纳什之牙"]
dic_str=str(items)
with open('db.txt',mode='wt',encoding="utf-8") as f:
f.write(dic_str)
# 2.反序列化
with open('db.txt',mode='rt',encoding='utf-8') as f:
data=f.read() # "['无尽之刃', '魔宗', '纳什之牙']"
items=eval(data)
print(items[0])
②:使用json模块
优点:通用性强
缺点:无法识别所有python类型
注意:在json中,元组也可以被写入文件,但是是按照列表的方式存取,load出来后的类型也是list
# 序列化
import json
dic={'name':'alvin','age':23,'sex':'male'}
with open('db.txt',mode='wt',encoding='utf-8') as f:
json.demp(dic,f)
# 2.反序列化
import json
with open('db.txt',mode='rt',encoding='utf-8') as f:
json.load()
③:pickle模块
优点:可以识别所有python类型
缺点:只能用于python,不使用其他
import pickle
s = {1,2,3,4,5}
res=pickle.dumps(s)
# print(res,type(res))
with open('a.pkl',mode='wb') as f:
f.write(res)
with open('a.pkl',mode='rb') as f:
data=f.read()
s=pickle.loads(data)
print(type(s))
三.hashlib模块
1.hashlib模块:hash是一种算法(包括md5,md256,md512等等),我们为该算法传入内容(不单单是文本内容,只要是有用二进制存的都可以),该算法会计算得到hash值
hash算法的三种特性:
1.如果传入的内容一样,且采用的算法一样,得到的结果必定相同(常用来检验文件传输后的完整性)
2.hash值的长度由采用的算法决定,与文件大小无关
3.hash值不可逆,只能从文件计算得出hash值,不能从hash值反解出文件内容(常用于加密)
hashlib演示
import hashlib
m=hashlib.md5()
m.update("身无彩凤双飞翼".encode('utf-8'))
m.update("心有灵犀一点通".encode('utf-8'))
res=m.hexdigest()
print(res)
# 结果:
c3efa694b7b7abc43f64634fc6d7b12f
# 如果传入的内容一样,且采用的算法一样,得到的结果必定相同
m.update("身无彩凤".encode('utf-8'))
m.update("双飞翼".encode('utf-8'))
m.update("心有灵犀".encode('utf-8'))
m.update("一点通".encode('utf-8'))
res=m1.hexdigest()
print(res)
# 结果:
c3efa694b7b7abc43f64634fc6d7b12f
# 计算图片文件的hash值
m2=hashlib.md5()
with open('aaa.png',mode='rb') as f:
for line in f:
m2.update(line)
print(m2.hexdigest())