目录
SAX(Simple API XML)
DOM(Document Object Model)
Pull ------ 谷歌官方推荐
DOM方式最直观和容易理解,但是只适合XML文档较小的时候使用,而SAX方式更适合在移动终端系统中使用,因为相比DOM占用内存少,适合处理比较大的XML文档,最后的Pull方式使用场合和SAX类似,但是更适合需要提前结束XML文档解析的场合。
SAX
SAX解析器是一种基于事件的解析器,事件驱动的流式解析方式是,从文件的开始顺序解析到文档的结束,不可暂停或倒退。
优点:解析速度快,占用内存少。非常适合在Android移动设备中使用。
缺点:不会记录标签的关系,而要让你的应用程序自己处理,这样就增加了你程序的负担。
工作原理:对文档进行顺序扫描,当扫描到文档(document)开始与结束、元素(element)开始与结束、文档 (document)结束等地方时通知事件处理函数,由事件处理函数做相应动作,然后继续同样的扫描,直至文档结束。
public class ContentHandler extends DefaultHandler{
private String nodeName;
private StringBuilder id;
private StringBuilder name;
private StringBuilder version;
private String TAG = "SAX";
//开始解析 XML 文档
@Override
public void startDocument() throws SAXException {
id = new StringBuilder();
name = new StringBuilder();
version = new StringBuilder();
}
//开始解析结点
@Override
public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException {
//localName 记录当前结点的名字 nodeName = localName;
}
//开始提取结点中内容
@Override
public void characters(char[] ch, int start, int length) throws SAXException {
if("id".equals(nodeName))
id.append(ch,start,length);
else if("name".equals(nodeName))
name.append(ch,start,length);
else if("version".equals(nodeName))
version.append(ch,start, length);
}
//结束结点解析
@Override
public void endElement(String uri, String localName, String qName) throws SAXException {
if("app".equals(localName)){
//可能包含回车或换行符 Log.d(TAG, "endElement: id = " + id.toString().trim());
Log.d(TAG, "endElement: name = "+ name.toString().trim());
Log.d(TAG, "endElement: version = "+ version.toString().trim());
//打印结束后清空,否则会影响下一次内容的读取 id.setLength(0);
name.setLength(0);
version.setLength(0);
}
}
//结束XML文档解析
@Override
public void endDocument() throws SAXException {
}
}
//用SAX方式解析XML
private void paraseXMLWithSAX(String xmlData){
try {
SAXParserFactory factory = SAXParserFactory.newInstance();
XMLReader reader = factory.newSAXParser().getXMLReader();
ContentHandler handler = new ContentHandler();
//将contentHandler的实例设置到XMLReader中 reader.setContentHandler(handler);
//开始解析 reader.parse(new InputSource(new StringReader(xmlData)));
}catch(Exception e){
e.printStackTrace();
}
}
Pull 方式解析
PULL解析器的运行方式和SAX类似,都是基于事件的模式。不同的是,在PULL解析过程中返回的是数字,且我们需要自己获取产生的事件然后做相应的操作,而不像SAX那样由处理器触发一种事件的方法,执行我们的代码。
**解析过程:**XML pull提供了开始元素和结束元素。当某个元素开始时,我们可以调用parser.nextText从XML文档中提取所有字符数据。当解释到一个文档结束时,自动生成EndDocument事件。
读取到xml的声明返回 START_DOCUMENT;
读取到xml的开始标签返回 START_TAG
读取到xml的文本返回 TEXT
读取到xml的结束标签返回 END_TAG
读取到xml的结束返回 END_DOCUMENT
优点: PULL解析器小巧轻便,解析速度快,简单易用,非常适合在Android移动设备中使用,Android系统内部在解析各种XML时也是用PULL解析器,Android官方推荐开发者们使用Pull解析技术。Pull解析技术是第三方开发的开源技术,它同样可以应用于JavaSE开发。
//用Pull方式解析XML
private void parseXMLWithPull(String xmlData){
try {
XmlPullParserFactory factory = XmlPullParserFactory.newInstance();
XmlPullParser xmlPullParser = factory.newPullParser();
//设置输入的内容 xmlPullParser.setInput(new StringReader(xmlData));
//获取当前解析事件,返回的是数字 int eventType = xmlPullParser.getEventType();
//保存内容 String id = "";
String name = "";
String version="";
while (eventType != (XmlPullParser.END_DOCUMENT)){
String nodeName = xmlPullParser.getName();
switch (eventType){
//开始解析XML case XmlPullParser.START_TAG:{
//nextText()用于获取结点内的具体内容 if("id".equals(nodeName))
id = xmlPullParser.nextText();
else if("name".equals(nodeName))
name = xmlPullParser.nextText();
else if("version".equals(nodeName))
version = xmlPullParser.nextText();
} break;
//结束解析 case XmlPullParser.END_TAG:{
if("app".equals(nodeName)){
Log.d(TAG, "parseXMLWithPull: id is "+ id);
Log.d(TAG, "parseXMLWithPull: name is "+ name);
Log.d(TAG, "parseXMLWithPull: version is "+ version);
}
} break;
default: break;
}
//下一个 eventType = xmlPullParser.next();
}
} catch (Exception e) {
e.printStackTrace();
}
}
DOM方式解析
DOM,即对象文档模型,它是将整个XML文档载入内存(所以效率较低,不推荐使用),每一个节点当做一个对象,结合代码分析。DOM实现时首先为XML文档的解析定义一组接口,解析器读入整个文档,然后构造一个驻留内存的树结构,这样代码就可以使用DOM接口来操作整个树结构。 由于DOM在内存中以树形结构存放,因此检索和更新效率会更高。但是对于特别大的文档,解析和加载整个文档将会很耗资源。 当然,如果XML文件的内容比较小,采用DOM是可行的。
工作原理:使用DOM对XML文件进行操作时,首先要解析文件,将文件分为独立的元素、属性和注释等,然后以节点树的形式在内存中对XML文件进行表示,就可以通过节点树访问文档的内容,并根据需要修改文档。
使用步骤:
首先利用DocumentBuilderFactory创建一个DocumentBuilderFactory实例
然后利用DocumentBuilderFactory创建DocumentBuilder
然后加载XML文档(Document)
然后获取文档的根结点(Element),
然后获取根结点中所有子节点的列表(NodeList),
然后使用再获取子节点列表中的需要读取的结点。