xml.etree.ElementTree 简介

xml.etree.ElementTree 是一个用于处理树结构的 Python 包。

它可以用于处理任何树结构的数据,但最常用于处理 XML 文档。

参考文档:http://effbot.org/zone/element.htm

Element类

from xml.etree.ElementTree import Element

Element类代表了树节点,每个树节点包含以下成员(properties):

类成员 类型 如何获取
节点名(tag) str Element.tag
属性(attributes) dict Element.attrib
文本(text) str Element.text
附加文本(tail) str Element.tail
子节点列表 list Element[:]

创建树节点

创建树节点时,一定要指定节点名:

tree_node = Element("node1")
print(tree_node.tag)    # 输出 node1
print(tree_node.text)   # 输出 None
print(tree_node.tail)   # 输出 None
print(tree_node.attrib) # 输出 {}

也可在创建时指定属性(Element.attrib):

tree_node = Element("node2", {"attr1": 1, "attr2": 2})
print(tree_node.tag)    # 输出 node2
print(tree_node.text)   # 输出 None
print(tree_node.tail)   # 输出 None
print(tree_node.attrib) # 输出 {'attr1': 1, 'attr2': 2}

设置文本(Element.text)或附加文本(Element.tail)

创建节点后,可以设置 text, tail 等类成员。这些成员的初始值为 None

tree_node = Element("node1")
tree_node.text = "Hello world"
tree_node.tail = "Bye"

添加子节点

可以用 Element.append() 成员函数添加子节点:

root = Element("root")
child1 = Element("child1")
child2 = Element("child2")

root.append(child1)
root.append(child2)

访问子节点

Element类用私有成员 Element._children 存放子节点,该私有成员是一个 list 变量。

为了方便访问子节点,Element封装了下标索引函数,使用时可以把 Element 想象成一个 list
变量:

  • len(Element) 检查子节点个数
  • Element[0] 访问第0个子节点,Element[1] 访问第1个子节点...
  • for child in Element 遍历所有子节点
  • Element.remove(child) 删除某个子节点
root = Element("root")
child1 = Element("child1")
child2 = Element("child2")

root.append(child1)
root.append(child2)

print(len(root))    # 2
print(root[0].tag)  # child1
root.remove(child1)
print(len(root))    # 1

树结构与 XML 字符串的相互转换

使用 xml.etree.ElementTree 包中的 tostring()fromstring() 函数:

from xml.etree.ElementTree import Element, tostring, fromstring

root = Element("root")
child1 = Element("child1")
child2 = Element("child2")
root.append(child1)
root.append(child2)

tree_str = tostring(root, encoding="unicode")
print(tree_str)
# '<root><child1 /><child2 /></root>''

new_root = fromstring(tree_str)
print(new_root.tag, new_root[0].tag, new_root[1].tag)
# root child1 child2

如果 tostring() 参数不指定 encoding="unicode",函数将返回 byte 序列。

再举一个生成 html 的例子:

from xml.etree.ElementTree import Element, tostring

html = Element("html")

head = Element("head")
html.append(head)

title = Element("title")
title.text = "HTML Example"
head.append(title)

body = Element("body")
body.text = "Hello world"
html.append(body)

html_str = tostring(html, encoding="unicode")
print(html_str)
# <html><head><title>HTML Example</title></head><body>Hello world</body></html>

快捷操作

添加子节点可以用 SubElement 构造函数快速实现:

from xml.etree.ElementTree import Element, SubElement

root = Element("root")
child = Element("child")
root.append(child)

# 等价于

root = Element("root")
child = SubElement(root, "child")
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,362评论 5 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,330评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,247评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,560评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,580评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,569评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,929评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,587评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,840评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,596评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,678评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,366评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,945评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,929评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,165评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 43,271评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,403评论 2 342

推荐阅读更多精彩内容

  • 第3章 基本概念 3.1 语法 3.2 关键字和保留字 3.3 变量 3.4 数据类型 5种简单数据类型:Unde...
    RickCole阅读 5,096评论 0 21
  • 人生苦短,我用Python。 起初,这篇文章是打算来写 XPath 的,可是后来一想,我需要的仅是 XPath 的...
    Moscow1147阅读 20,715评论 1 14
  • 写在前面的话 代码中的# > 表示的是输出结果 输入 使用input()函数 用法 注意input函数输出的均是字...
    FlyingLittlePG阅读 2,729评论 0 8
  • 本主题主要说明python的xml处理标准模块xml.etree的使用。xml.etree模块包含4个子模块,其中...
    杨强AT南京阅读 7,146评论 0 5
  • 问题1:有一个XML文件,如何解析问题2:解析后,如果查找、定位某个标签问题3:定位后如何操作标签,比如访问属性、...
    野狗子嗷嗷嗷阅读 14,152评论 0 7