- 本教程为python3文档解读
- 本教程面向完全型小白,只要你会在电脑上打字,那你就可以看懂。
- 参考视频观看,味道更加:https://space.bilibili.com/186584185/#!/video
- 建议优先阅读本系列的《编程的本质》这一章节。
- 推荐阅读:《跟我读python3文档:016_带你手撕程序,展现一个函数如何从思路到实现》
贯穿始终的理念:别废话,就是干!
往期回顾:
- 文件读写
- open( )、close( )
- with、as关键字
- 模块
文档解读
python3文档第七小节链接地址:7.2.2. Saving structured data with json
本章主要讲解7.2.2. Saving structured data with json(使用json存储结构化数据)这个小节
作者:咖喱py
我早先学习python时,最不明白的一点就是:json到底是干嘛的?
估计大家也会遇到同样的问题。
如果我们去翻看一些教程或书籍,经常会看到一些高大上的解释。
什么腌制数据、序列化、结构化存储等等。
但是看完了这些解释,依旧不知道它是干什么的。。
所以,本期咖喱py就来通俗的讲解一下,json到底是干什么的!
我们在上期强调过一个知识点,说一定要记住:write( )方法的参数是字符串参数。
不知道大家还有没有印象。
我们上期学过:write( )方法是用来将字符串写入文件的。
比如:
>>> a = open('test.py', 'w')
>>> a.write('咖喱py好帅')
>>> a.close( ) #养成随手关闭文件的好习惯
6 #返回字符串数量值
但是,如果我们要写入的数据不是一个字符串,而是列表、字典,或者其他数据类型,那要怎么办呢?
我们在上期讲过一个方法,说可以用str()函数将其转化为字符串类型,之后在写入文件。
例如:
>>> value = ('the answer', 42)
>>> s = str(value) #把元组类型转化为字符串类型了
>>> f.write(s)
18
但是这样依旧会有问题。
当我们想要将复杂数据类型转化为字符串类型时,我们只能得到一个模糊的字符串对象,我们将这个字符串对象写入文件,之后在读取他,你会发现,你不知道它是什么了?
这句话没有理解不要紧,我们来直接看例子:
>>> class Student(object):
... def __init__(self, name, age, score):
... self.name = name
... self.age = age
... self.score = score
...
>>> #上面的几串代码,让我们声明了一个Student类
>>> #其实就是我们自己做了一个Student类型。
>>> s = Student('咖喱py', 20, 88)
>>> #实例化一个类。相当于列表里存上了数据,并赋值给s。
>>> #有点像这样:s = list('咖喱py', 20, 88)。
>>> a = str(s) #将s字符串化
>>> a #得到了一个字符串对象
'<__main__.Student object at 0x10d213048>'
>>> with open('test.py','w') as file:
... file.write(a) #将字符串对象写入文件
...
40
>>> #如果你此时打开文件,
>>> #你会发现被写入的内容是:<__main__.Student object at 0x10d213048>
>>> b = open('test.py','r')
>>> b.read() #读取我们写入的文件
'<__main__.Student object at 0x10d213048>' #得到字符串对象
#接下来的问题是,我们如何把它还原为Student类型?
这里,要介绍两个概念:序列化与反序列化
- 序列化就是将其他类型转化为字符串类型
- 反序列化就是将字符串类型,转化回其他类型
那么,我们如何把它还原为Student类型?
为了解决这个问题,python专门提供了json库。
我们依旧先来看例子理解下json:
>>> import json
>>> c = json.dumps([1, 'simple', 'list'])
>>> c
'[1, "simple", "list"]'
看明白了吗?列表被转化为字符串,也就是我们说的序列化
>>> d = json.loads(c)
>>> d
[1, "simple", "list"]
序列化后的字符串又被转化回列表,也就是我们说的反序列化
我们在进一步了解json:
直接看例子:
>>> a = open('test.py', 'w')
>>> x = [1, "simple", "list"]
>>> json.dump(x, a)
>>> a.close()
#如果你此时打开文件查看,发现[1, "simple", "list"]被写入文件。
>>> a = open('test.py', 'r')
>>> y = json.load(a)
>>> y
[1, 'simple', 'list']
>>> a.close() #养成随手关闭文件的好习惯
可能很多小伙伴都没有看明白两个例子的区别。
注意这两个例子,我们分别用了两组不同的方法:
- 第一组:
dumps( ):进行序列化
loads( ):进行反序列化 - 第二组:
dump( ):序列化,并写入文件
load( ):直接从文件反序列化。
虽然只有一个字母“s”的差别,但是作用还是有很大区别的。
这一点一定要记清楚了。
那么我们继续说回Student类的问题。
如果你直接用json序列化它,你的程序会报错。
因为Student是你自己定制的类型,不是json默认的转换类型。
所以json不知道你的这个类型要怎么序列化。
注:json默认转化类型对照表
所以,我们要告诉json如何序列化
>>> def student2dict(std):
··· return {
··· 'name': std.name,
··· 'age': std.age,
··· 'score': std.score
··· }
···
此部分参考:廖雪峰-序列化
设置好转化关系之后,就可以使用json序列化了
>>> json.dumps(s, default=student2dict) #注意参数,我们指明了转化方式
看了这么多,理解json的作用了吗?
其实就是:将数据转化为特定的类型,用于写入文件,或在网络上传输。
json操作性的东西就这么多,下面简单介绍下概念性与原理性的东西。
1. json是javascript的标准格式。大部分编程语言为了兼容javascript,都添加了json功能,目的就是为了在网络上传输数据。
json标准格式如下:
{'age': 20, 'score': 88, 'name': 'Bob'}
- 大括号围住
- 键值对
- 分号
其实就是python里的字典格式。也就是说,python与json的兼容性非常好。
2. python原生序列化模块的名字叫做:pickle。
不过因为它只能自己愉快玩耍,没有办法和其他语言交换数据(数据样式不同),也就是我们说的兼容性差,所以大家纷纷弃用了。。。转投了json。
就连python自己也专门内置了json模块。
今天就到这里吧~
至此,第七小节的内容就全部讲完了。
这部分多少有些不好理解,如果大家觉得这块写的不明白,可以试试去参考着看看廖雪峰-序列化,同样写的通俗易懂。