jaxp解析器用dom方式操作xml文档的总结

我的个人博客站点：http://blog.itcodai.com

1. xml解析技术概述

　　解析xml文档一般有两种技术：dom（Document Object Model）和sax（Simple API for XML）。dom即文档对象模型，是W3C组织推荐的处理xml的一种方式；sax不是官方标准，但它是xml社区事实上的标准，几乎所有的xml解析器都支持它。

1.1 dom方式

　　dom方式会把文本解析成Document对象，把所有元素和文本也解析成一个对象：解析器将标签解析为Element对象，对内容解析为Text对象，对属性解析为Attribute。对所有的节点都可以用Node对象表示，当没有合适的方法调用的时候，才把Node强制转换成上面的具体类型，上面的类都是Node的子类。

　　使用dom方式对xml文档解析只需要得到document对象，就可以得到所有节点，因为在内存中会解析成树结构图。

优点：实现CURD特别方便，操作速度也比较快。

缺点：如果文件比较大，对内存消耗就特别大，极易导致内存溢出，所以dom方式不是和操作大的xml文档。

1.2 sax方式

　　sax方式不是先将文本解析成整个对象，它是读取一行解析一行。

优点：解析速度快，对内存占用少，查找数据特别方便。

缺点：只适合查找数据，不适合CURD操作。

　　针对这两种方式，有很多解析开发包，主要有jaxp和dom4j，这篇文章先介绍一下jaxp解析器如何用dom方式解析xml文档。

2. jaxp解析器用dom方式解析xml文档

　　 jaxp开发包是j2se的一部分，它由

javax.xml

、

org.w3c.dom

、

org.xml.sax

包及其子包组成。在

javax.xml.parsers

包中，定义了几个工厂类，程序员调用这些工厂类，可以得到对xml文档进行解析的dom和sax的解析器对象。

javax.xml.parsers

包中的DocumentBuilderFactory用于创建dom模式的解析器对象，DocumentBuilderFactory是一个抽象工厂类，它不能直接实例化，但是该类提供了一个静态的

newInstance()

方法，这个方法会根据本地平台默认安装的解析器，自动创建一个工厂的对象并返回。

　　首先给出个book.xml文档，如下：

<?xml version="1.0" encoding="UTF-8"?>
<bookstore> 
  <book name="book1" password="123"> 
    <price>59元</price>  
    <name>java神书1^^</name>  
    <author>倪升武</author>  
  </book> 
  <book name="book2" password="123456"> 
    <price>69元</price>  
    <name>java神书2^^</name>  
    <author>倪升武</author>  
  </book> 
</bookstore>

　　下面我们来使用jaxp具体解析这个book.xml文档：

2.1 得到节点的值

@Test
public void read() throws Exception{
    DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();//获取工厂
    DocumentBuilder builder = factory.newDocumentBuilder();//产生解析器
    Document document = builder.parse(new File("src/book.xml"));//解析xml文档，得到代表文档的document

    NodeList list = document.getElementsByTagName("price");//返回所有price节点的集合
    Node price = list.item(); //拿到第一个price节点
    String value = price.getTextContent();//获取节点的值
    System.out.println(value); //59元    
}

2.2 修改节点的值

@Test
public void update() throws Exception{
    DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
    DocumentBuilder builder = factory.newDocumentBuilder();
    Document document = builder.parse(new File("src/book.xml"));

    Node price = document.getElementsByTagName("售价").item();
    price.setTextContent("89元");
    /*javax.xml.tranform包中的Transformer类用于把代表XML文件的Document对象转换为某种格式后进行输出。
     *例如把XML文件应用样式表后转成一个HTML文档，利用这个对象，当然也可以把Document对象重新写入到一个XML文件中。
     *Transformer类通过transform(Source xmlSource, Result outputTarget)方法完成转换操作，该方法接受一个源和一个目的地。我们可以通过：
     *      javax.xml.transform.dom.DOMSource类来关联要转换的document对象，
     *      用javax.xml.transform.stream.StreamResult对象来表示数据的目的地。
     *Transformer抽象类，但是其对象通过TransformerFactory.newTransformer获得。
     *
    */

    //得到转换器工厂
    TransformerFactory tf = TransformerFactory.newInstance();
    //得到转换器
    Transformer ts = tf.newTransformer();   
    ts.transform(new DOMSource(document), new StreamResult(new File("src/book.xml"))); //将修改后的document对象（dom）转换到book.xml
}

2.3 添加新的节点

@Test
public void addNode() throws Exception{
    DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
    DocumentBuilder builder = factory.newDocumentBuilder();
    Document document = builder.parse(new File("src/book.xml"));

    //创建需要增加的节点
    Node price = document.createElement("price");
    price.setTextContent("109元");

    //得到需要增加的节点的父节点
    Node parent = document.getElementsByTagName("book").item();//第一个book节点

    //把需要增加的节点挂到父节点上
    parent.appendChild(price);

    TransformerFactory tf = TransformerFactory.newInstance();
    Transformer ts = tf.newTransformer();
    ts.transform(new DOMSource(document), new StreamResult(new File("src/book.xml")));
}

2.4 向指定位置添加新的节点

@Test
public void addNodeWithIndex() throws Exception {
    DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
    DocumentBuilder builder = factory.newDocumentBuilder();
    Document document = builder.parse(new File("src/book.xml"));

    Node node = document.createElement("price");
    node.setTextContent("39元");
    Node parent = document.getElementsByTagName("book").item();
    parent.insertBefore(node, document.getElementsByTagName("name").item());//在书名前添加node

    TransformerFactory tf = TransformerFactory.newInstance();
    Transformer ts = tf.newTransformer();
    ts.transform(new DOMSource(document), new StreamResult(new File("src/book.xml")));
}

2.5 删除指定的节点

@Test
public void delete() throws Exception{
    DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
    DocumentBuilder builder = factory.newDocumentBuilder();
    Document document = builder.parse(new File("src/book.xml"));

    NodeList nodes = document.getElementsByTagName("price");//获取所有售价节点
    for(int i = ; i <= nodes.getLength(); i++){
        if(nodes.item(i).getTextContent().equals("109元")){
            //自己不能删自己，要让它的父节点来删
            nodes.item(i).getParentNode().removeChild(nodes.item(i));//删除所有售价为109元的节点
        }
    }

    TransformerFactory tf = TransformerFactory.newInstance();
    Transformer ts = tf.newTransformer();
    ts.transform(new DOMSource(document), new StreamResult(new File("src/book.xml")));
}

2.6 操作文档的属性

@Test
public void updateAttribute() throws Exception{
    DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
    DocumentBuilder builder = factory.newDocumentBuilder();
    Document document = builder.parse(new File("src/book.xml"));

    //操作XML文档元素时，一般都把元素当做Node对待，但是如果Node没有合适的方法时，就得转换成相应的类型
    Node node = document.getElementsByTagName("book").item();
    Element book = null;
    if(node.getNodeType() == Node.ELEMENT_NODE)//在转换之前，最好先判断下类型
        book = (Element)node;
    book.setAttribute("name", "--book--");
    book.setAttribute("password", "--123--");

    TransformerFactory tf = TransformerFactory.newInstance();
    Transformer ts = tf.newTransformer();
    ts.transform(new DOMSource(document), new StreamResult(new File("src/book.xml")));
}

　　以上就是jaxp解析器使用dom方式对xml文档进行解析的总结，可以看出，如果只读不写，只要获取解析器工厂–>获取解析器–>将xml转换成document，然后开始获取想要获取的数据。如果要向xml文档中写数据，那么要获取转换器工厂–>获取转换器–>将document转换成xml。所以很明显，这是两个相反的过程。

—–乐于分享，共同进步！

—–更多文章请看：http://blog.csdn.net/eson_15

jaxp解析器用dom方式操作xml文档的总结

1. xml解析技术概述

1.1 dom方式

1.2 sax方式

2. jaxp解析器用dom方式解析xml文档

2.1 得到节点的值

2.2 修改节点的值

2.3 添加新的节点

2.4 向指定位置添加新的节点

2.5 删除指定的节点

2.6 操作文档的属性

继续阅读

Flex的MXML文件结构

Flex中如何通过创建新的XML命名空间（namespace），在MXML中使用flash.filters类

关于Flex及AS3的百多条小小知识

Socket套接字类 AS3

Flash AS3 连续加载外部若干图片

tomcat conf目录下web.xml tomcat-users.xml server.xml context.xml这四个文件的作用

Silverlight调用WCF服务，在添加WCF服务引用时，报错如下：

sqli-labs第一关--报错注入练习

小程序自定义button组件获取用户信息（用户授权登录）

写一个Junit类...在Spring中

jqGrid的使用笔记：5. 事件

invalid byte 1 of 1-byte UTF-8 sequence

出现invalid byte 1 of 1-byte UTF-8 sequence问题

为什么要选择UniDAC

SIP Presence SUBSCRIBE-NOTIFY

QName是什么