SAX解析:
1.解析效率高,占用内存少
2.可以随时停止解析
3.不能整个文档载入内存
4.不能写入xm
5.SAX解析采用事件驱动型
SAX并不需要解析整个文档,在按顺序解析文档的过程中,SAX会判断当前读到的字符是否合法xml中的部分,如果符合就触发
SAX工作原理:对文档进行顺序扫描,扫描到文档的开始和结尾,扫到元素的开始与结束等地方调用时间处理,处理函数做相应的动作,然后接着扫描知道结束。
SAX解析文档过程:
1.继承DefaultHandler,并实现其方法
2.创建SAX解析器工厂
3.获得解析器
4.获得输入流
5.使用输入流,和实现接口做参数,调用解析器的解析方法进行解析
==》DefaultHandler实现的是ContentHandler
DefaultHandler接口中常用的方法:
startDoucument:当遇到文档的开头,调用此方法,做一些准备工作
endDocument:当遇到文档的结尾,调用此方法,做一些善后工作
startElement(String namespaceURL, String localName, String qName, Attributes atts)
当读到一个开始标签时,会触发这个方法,。namespaceURL就是命名空间,localName是不带命名空间前缀的标签名, qName是待命名空间前缀的标签名。通过atts可以得到所有的属性名和相应的值。
endElement(String uri, String localName, String name)
当遇到结束标签的时候,调用这个方法
characters(char[] ch, int start, int length)
这个方法用来处理在xml文件中读到的内容,第一个参数为文件的字符串内容,后面两个参数是读到的字符串在这个数组中的起始位置和长度,
使用new String(ch, start, length)就可以获取内容
SAX解析实例:
1.SRC新建 user.xml
Person工具类
3.调用方法
DOM解析:
Dom为xml文档的已解析版本定义了一组接口。解析器读入整个文档,然后构建一个主流内存的树结构,然后代码就可以使用dom接口来操作这个树结构
DOM的特点:
1,整个文档树在内存中,便于操作;支持删除、修改,重新排列等多种功能
2,通过树形结构存取xml文档
3.可以在树的某个节点上向前或者向后移动
缺点:
将整个文档调用内存(包含无用节点),浪费时间跟空间
使用场合:
一旦解析了文档还需多次访问这些数据;硬件资源充足(内存,cpu)
Dom解析步骤:
- 创建解析器工厂
- 获得解析器工厂
- 接受一个xml文档作为输入参数名,并得到一个xml的文档对象(Document)
- 操作文档对象
DOM实例:
Pull解析
- pull解析器是android内置的解析器,解析原理与sax类似
- pull她提供了类似的事件。
如:开始元素和结束元素事件,使用parse.next()可以进入下一个元素并触发相应的事件,事件将作为数值代码被发送
因此可以使用一个switch对感兴趣的事件经行处理。当元素开始解析时,调用parse.nextText()方法获取下一个Text类型节点的值
pull与sax的不同之处:
- pull读取xml文件后出发相应的事件调用方法返回的是数字
- pull可以在程序中复制,想解析到那里就可以停止在哪里
- Android中更推荐使用pull解析
==》pull解析步骤
- 创建解析器对象
XmlPullParse parse=XML.newPullParse(); - 进行解析
parse.setInput(is,"utf-8"); - 产生第一个解析事件
int eventype = parse.getEvenType(); - 可以使用循环判断是否继续解析
while(Eventype!=XmlPullParse.END_DOCUMENT){}
PULL解析实例:
SAX、DOM、PULL比较分析:
- 内存占用
由于android手机性能相对于现在的应用操作还是有限的,程序对内存的占用直接影响到解析xml的速度。在这点上,SAX、pull、以它们比DOM占用更少的内存的解析方式,更适用于android手机开发。
- 编程方式
SAX采用事件驱动,在相应事件触发的时候,会调用用户编写好的方法。也就是说,每解析一类xml,就要编写一个新的适合该类xml的处理类。这显然不是一个好的解决办法,尽管在解析速度上比较优秀。而这点,DOM因为是W3C的规范,所以被更多的程序员所知道和使用。所以在开发过程中,没有太大困难。
- 访问与修改
由于采用的是流式解析,这说明他们不能像DOm那样随机访问,xml其中任意一个节点。Sax并没有对文档中加节点的api,更没有删除,修改文档内容的方法。
4。访问方式
SAX、pull是走马观花式阅读方式,Dom是酌字酌句的阅读。SAX。pull、解析的方式是同步的,即解析器到哪里,就对哪里进行解析. 而DOM是已经文件解析好后,供用户提取xml,供用户提取xml中感兴趣的信息。