XML文档规则
格式良好的XML文档规则
XML文档必须遵守下列重要的规则:
- XML文档声明
XML文档声明是XML文档的第一句,格式如下:
<?xml version="1.0" encoding="UTF-8" standalone="yes/no"?>
- 注意大小写
在XML文档中,大小写是有区别的。
- 所有的XML文档必须有且只有一个根元素
良好格式的XML文档必须有一个根元素,就是紧接着声明建立的第一个元素,其他元素都是这个根元素的子元素,都属于根元素一组。
根元素是一个完全包括文档中其他所有元素的元素。根元素的起始标记要放在所有其他元素的起始标记之前,根元素的结束标记要放在所有其他元素结束标记之后。
- 属性值必须使用引号
XML中规定,所有属性值必须加引号(可以是单引号,也可以是双引号),否则将被视为错误。
- 所有的标识必须有相应的结束标识
在XML中,所有标识必须成对出现,有一个开始标识,就必须有一个结束标识,否则被视为错误。
- 所有的空标识必须被关闭
空标识就是标识对之间没有内容的标识。由所有的标识必须有相应的结束标识知空标识也应该有结束标识。如:
<book></book>
<book/>
- 标识之间必须正确嵌套
在HTML中可以这样写:
<book><name></book></name>
但是在XML中,标识之间不得交叉,必须以规则性的次序出现。比如:
<book>
<name></name>
</book>
- 处理空白字符
在XML中,对于所有标记以外的空白,解析器都要忠实地交给应用程序来处理,即解析器会保留内容中所有的空白字符并不加修改地传递给应用程序,但元素标记和属性中的空白会被删除。
- 处理特殊字符
在XML中,如果要用到表 1 特殊字符的替代字符的特殊字符,必须用相应符号来代替。
格式良好的XML文档
XML文档中的数据对象如果满足下列条件,那就是格式良好的文档。
- 语法合乎XML规范
- 元素构成一个层次树,只有一个根节点。
- 除非提供了DTD,否则没有对外部实体的引用。
有效的XML文档
在XML文件中,用的大多都是自定义的标识。但是如果两个同行业的公司要用XML文件相互交换数据的话,他们之间必须有一个约定,即编写的XML文件可以用那些标识,母元素中能够包括哪些子元素,各个元素出现的顺序以及元素的属性怎么样定义等。这样他们在用XML交换数据时才能够畅通无阻。这种约定可以是DTD(Document Type Definition,文档格式定义),也可以是XML Scheme(XML 模式)。
一个格式良好的XML文档,同时应该遵守XML语法规则,而一个有效的XML文档应该既是一个格式良好的XML文档,同时还应该符合DTD或XML Scheme所定义的规则。