简介
YAML是“YAML不是一种标记语言”的外语缩写;但为了强调这种语言以数据做为中心,而不是以置标语言为重点,而用返璞词重新命名。它是一种直观的能够被电脑识别的数据序列化格式,是一个可读性高并且容易被人类阅读,容易和脚本语言交互,用来表达资料序列的编程语言。它是类似于标准通用标记语言的子集XML的数据描述语言,语法比XML简单很多。
格式
数据结构可以用类似大纲的缩排方式呈现,结构通过缩进来表示,连续的项目通过减号“-”来表示,map结构里面的key/value对用冒号“:”来分隔。样例如下:
#多行缩进写法
---
house:
family:
name: Doe
parents:
- John
- Jane
children:
- Paul
- Mark
- Simone
address:
number: 34
street: Main Street
city: Nowheretown
zipcode: 12345
...
#单行缩进写法
house:
family: { name: Doe, parents: [John, Jane], children: [Paul, Mark, Simone] }
address: { number: 34, street: Main Street, city: Nowheretown, zipcode: 12345 }
注意:
字串不一定要用双引号标识;
在缩排中空白字符的数目并不是非常重要,只要相同阶层的元素左侧对齐就可以了(不过不能使用TAB字符);
允许在文件中加入选择性的空行,以增加可读性;
在一个档案中,可同时包含多个文件,并用“---”分隔;
选择性的符号“...”可以用来表示档案结尾(在利用串流的通讯中,这非常有用,可以在不关闭串流的情况下,发送结束讯号)。
基本组件
- 数组
用短杠+空白字符作为起始
--- # 最喜愛的電影
- Casablanca
- North by Northwest
- Notorious
- 散列表
键值和数据由冒号及空白字符分开。使用缩进和换行符分隔key: value对。
--- # 区块形式
name: John Smith
age: 33
--- # 内置形式
{name: John Smith, age: 33}
#类型强转
#YAML会自动判定数据形态是哪一种实体。但有时用户会想要将数据强制转型成自定的某种类型。
---
a: 123 # 整数
b: "123" # 字符串
c: 123.0 # 浮点数
d: !!float 123 #浮点数
e: !!str 123 # 字符串
f: !!str Yes # 字符串
g: Yes # 布林值"真"
h: Yes we have No bananas # 字符串
python操作yaml格式文件
首先是安装模块: pip install pyyaml
我们创建一个text.yaml文件用来测试,内容就是最前面的内容
import yaml
f = open("test.yaml")
output = yaml.load(f)
print(output)
# {'house': {'family': {'parents': ['John', 'Jane'], 'name': 'Doe', 'children': ['Paul', 'Mark', 'Simone']}, 'address': {'city': 'Nowheretown', 'street': 'Main Street', 'number': 34, 'zipcode': 12345}}}
example = {"name": "leon", "age": 25, "interest": ["play", "work"]}
result = yaml.dump(example)
print(result)
# age: 25
# interest: [play, work]
# name: leon
适用场景
- 脚本语言
由于实现简单,解析成本很低,YAML特别适合在脚本语言中使用。列一下现有的语言实现:Ruby,Java,Perl,Python,PHP,OCaml,JavaScript,Go 。除了Java 和 Go,其他都是脚本语言。 - 序列化
YAML比较适合做序列化。因为它是宿主语言数据类型直转的。 - 配置文件
YAML做配置文件也不错。写YAML要比写XML快得多(无需关注标签或引号),并且比ini文档功能更强。
由于兼容性问题,不同语言间的数据流转建议不要用YAML.