Python day20:包与常用模块

今日内容：
1.包的使用

2.json与pickle模块

3.hashlib模块

一.包的使用
什么是包：包是一个含有init文件的文件夹，本质就是一个模块，是用来被导入的

首次导入包这种模块发生的两件事：

1.创建模块的名称空间，运行包下的init文件，将运行过程中产生的名字都丢到模块的

名称空间中

2.在当前位置拿到包的名称，这个名称是指向init文件的名称空间，即模块.名字，这个名字是来自init的

1.包的导入

文件在包的init文件中，有两种导入方式：

1.用绝对路径导入：此方法，可以在本包中导入其他任意位置的其他包，但是需要把包加入到sys.path中

#文件init
from p.m1 import f1
#文件m1
def f1():
    print('from f1')
#用户使用
import sys
from p import f1

sys.path.append(包的路径)
f1()

2.用相对路径：此方法用.表示当前文件夹，..表示上一次，此后每加一个点都会到上一层目录，但是不会超过根目录

# 当m1与init同级时候
from .m1 import f1
#文件m1
def f1():
    print('from f1')
#用户使用
from p import f1

二.json模块与pickle模块
1.什么是序列化与反序列化

我们把对象（或变量）从内存变成可存储或可传输的过程称之为序列化，在python中被称为picking

自定义的类的实例如何保存在一个文件中？如何从文件中读取数据，并让他们在内存中再次恢复成自己对应的类的实例？

按照某种规则，把内存中的数据保存到文件中，文件是一个字节序列，所以必须要把内存数据转换成为字节序列，输出到文件，这就是序列化；反之，从文件的字节恢复到内存，就是反序列化

2.为何要序列化

1.存档：把内存的数据持久化到硬盘中，在python中推荐pickle

2.跨平台交互数据，推荐json

3.如何序列化

①：在我们还没学习模块前的序列化与反序列化（之后不要使用，low）

# 1.序列化
items=["无尽之刃","魔宗","纳什之牙"]

dic_str=str(items)

with open('db.txt',mode='wt',encoding="utf-8") as f:
    f.write(dic_str)

# 2.反序列化
with open('db.txt',mode='rt',encoding='utf-8') as f:
    data=f.read()  # "['无尽之刃', '魔宗', '纳什之牙']"
    items=eval(data)
    print(items[0])

②：使用json模块

优点：通用性强

缺点：无法识别所有python类型

注意：在json中，元组也可以被写入文件，但是是按照列表的方式存取，load出来后的类型也是list

# 序列化
import json
dic={'name':'alvin','age':23,'sex':'male'}
with open('db.txt',mode='wt',encoding='utf-8') as f:
    json.demp(dic,f)


# 2.反序列化
import json
with open('db.txt',mode='rt',encoding='utf-8') as f:
    json.load()

③：pickle模块

优点：可以识别所有python类型

缺点：只能用于python，不使用其他

import pickle

s = {1,2,3,4,5}

res=pickle.dumps(s)
# print(res,type(res))
with open('a.pkl',mode='wb') as f:
    f.write(res)


with open('a.pkl',mode='rb') as f:
    data=f.read()
    s=pickle.loads(data)
    print(type(s))

三.hashlib模块

1.hashlib模块：hash是一种算法（包括md5，md256，md512等等），我们为该算法传入内容（不单单是文本内容，只要是有用二进制存的都可以），该算法会计算得到hash值

hash算法的三种特性：

1.如果传入的内容一样，且采用的算法一样，得到的结果必定相同（常用来检验文件传输后的完整性）

2.hash值的长度由采用的算法决定，与文件大小无关

3.hash值不可逆，只能从文件计算得出hash值，不能从hash值反解出文件内容（常用于加密）

hashlib演示

import hashlib

m=hashlib.md5()
m.update("身无彩凤双飞翼".encode('utf-8'))
m.update("心有灵犀一点通".encode('utf-8'))
res=m.hexdigest()
print(res)
# 结果：
c3efa694b7b7abc43f64634fc6d7b12f

# 如果传入的内容一样，且采用的算法一样，得到的结果必定相同
m.update("身无彩凤".encode('utf-8'))
m.update("双飞翼".encode('utf-8'))
m.update("心有灵犀".encode('utf-8'))
m.update("一点通".encode('utf-8'))
res=m1.hexdigest()
print(res)
# 结果：
c3efa694b7b7abc43f64634fc6d7b12f

# 计算图片文件的hash值
m2=hashlib.md5()
with open('aaa.png',mode='rb') as f:
    for line in f:
        m2.update(line)
    print(m2.hexdigest())