一、xml解析
注意:在解析xml文档时如果有些内容不想让解析器解析,则可以使用<![CDATA[> …]]>将相关内容包裹成CDATA区。
1、解析方式
dom(文档对象模型Document Object Model):是w3c组织推荐的处理xml的一种方式;实现起来很方便,但是当xml文件太大的时候,JVM很可能支持不了。JVM最大支持64M内存。如果需要更大的内存可以进行修改。使用-Xmx80m可以改变支持内存80M。一般我们使用此种方式解析。
Sax(Simple API for XML):不是官方标准,但是它是xml社区事实上的标准,几乎所有的xml解析器都支持它。效率高,查找数据方便,但是不适合增删改数据。它是一行一行的解析。查找时一般使用sax。
2、解析器
jaxp是标准,dom4j最好用。
3、使用jaxp解析xml文档
(1)调用DocumentBuilderFactory.newInstance()方法得到创建DOM解析器的工厂;
(2)调用工厂对象的newDocumentBuilder()方法得到DOM解析器对象;
(3)调用DOM解析器对象的parse()方法解析XML文档,得到代表整个文档的Document对象,进行可以利用DOM特性对整个XML文档进行操作了。
例子(工程jaxp):
xml/book.xml
<?xml version="1.0" encoding="UTF-8" standalone="no"?><书架>
<书 name="yyy">
<售价>109</售价>
<售价>39元</售价>
<书名>Java就业培训教程</书名>
<作者>张孝祥</作者>
<售价>120</售价></书>
</书架>
src中
package cn.itcast;
import java.io.File;
import java.io.IOException;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import javax.xml.transform.Source;
import javax.xml.transform.Transformer;
import javax.xml.transform.TransformerConfigurationException;
import javax.xml.transform.TransformerException;
import javax.xml.transform.TransformerFactory;
import javax.xml.transform.dom.DOMSource;
import javax.xml.transform.stream.StreamResult;
import org.junit.Test;
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import org.xml.sax.SAXException;
public class Demo1 {
public static void main(String[] args) throws Exception {
/*1.调用DocumentBuilderFactory.newInstance()方法得到创建DOM解析器的工厂;
2.调用工厂对象的newDocumentBuilder()方法得到DOM解析器对象;
3.调用DOM解析器对象的parse()方法解析XML文档,得到代表整个文档的*/
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
DocumentBuilder builder = factory.newDocumentBuilder();
Document document = builder.parse(new File("xml/book.xml"));
//read(document);
list(document);
}
//读取文档
private static void read(Document document) {
NodeList list = document.getElementsByTagName("售价");//取得所有的售价节点
Node price = list.item(0);//取第一个子节点,即价格
String value = price.getTextContent();//取得价格节点的文本内容
System.out.println(value);
}
//对文档进行更新
@Test
public void update() throws Exception{
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
DocumentBuilder builder = factory.newDocumentBuilder();
Document document = builder.parse(new File("xml/book.xml"));
NodeList list = document.getElementsByTagName("售价");
Node price = list.item(0);
price.setTextContent("50");//设置价格节点的文本内容
//注意:以上的操作都是在内存中进行操作,我们还需要将内存中的内容写到xml文档中
TransformerFactory t_factory = TransformerFactory.newInstance();//得到一个产生转换器的工厂
Transformer transformer = t_factory.newTransformer();//得到一个转换器
//transform的第一个参数是源,第二个参数是目标
transformer.transform(new DOMSource(document), new StreamResult(new File("xml/book.xml")));
}
//增加一个售价节点
@Test
public void add() throws Exception{
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
DocumentBuilder builder = factory.newDocumentBuilder();
Document document = builder.parse(new File("xml/book.xml"));
Node parent = document.getElementsByTagName("书").item(0);
//先要产生一个售价节点和其中的文本内容
Node child = document.createElement("售价");
child.setTextContent("120");
parent.appendChild(child);
//还有一种插入的方法
//parent.insertBefore(child, document.getElementsByTagName("书名").item(0));
TransformerFactory t_factory = TransformerFactory.newInstance();
Transformer transformer = t_factory.newTransformer();
transformer.transform(new DOMSource(document), new StreamResult(new File("xml/book.xml")));
}
//删除文档的相关节点
@Test
public void delete() throws Exception{
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
DocumentBuilder builder = factory.newDocumentBuilder();
Document document = builder.parse(new File("xml/book.xml"));
NodeList list = document.getElementsByTagName("售价");
Node child = list.item(2);
child.getParentNode().removeChild(child);
TransformerFactory t_factory = TransformerFactory.newInstance();
Transformer transformer = t_factory.newTransformer();
transformer.transform(new DOMSource(document), new StreamResult(new File("xml/book.xml")));
}
//操作标签的属性
@Test
public void updateAttribute() throws Exception{
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
DocumentBuilder builder = factory.newDocumentBuilder();
Document document = builder.parse(new File("xml/book.xml"));
Element element = (Element) document.getElementsByTagName("书").item(0);
element.setAttribute("name", "yyy");//可以用来增加属性也可以用来改变已有属性
TransformerFactory t_factory = TransformerFactory.newInstance();
Transformer transformer = t_factory.newTransformer();
transformer.transform(new DOMSource(document), new StreamResult(new File("xml/book.xml")));
}
//遍历文档
public static void list(Node node) throws Exception{
if(node.getNodeType() == Node.ELEMENT_NODE){//判断当前节点是不是元素
System.out.println(node.getNodeName());
}
NodeList list = node.getChildNodes();
for(int i = 0; i < list.getLength(); i++){
Node child = list.item(i);
list(child);
}
}
}