天天看点

Jaxp对XML解析(一)

Jaxp对xml解析

JAXP开发包对java se的一部分,它是由javax.xml,org.w3x.dom,org.xml.sax包及其子包组成。

在javax.xml.parsers包中,定义了几个工厂类,当调用这些工厂类。可以得到xml文档的DOM或SAX的解析器,从而实现对XML文档的解析

javax.xml.parsers包中的DocumentBuilderFactory用于创建DOM模式的解析器对象,DocumentBuilderFactory是一个抽象工厂类,它不能直接实例化,但该类提供了一个newInstance方法,这个方法会根据本地平台默认安装的解析器,自动创建一个工厂的对象并返回。

在dom解析下,xml文档的每一个组成部分会用一个对象表示,例如标签用Element,属性用Attr,但不管什么对象,都是Node的子类,所以在开发中可以把获取到的任意都当作Node对待。

    举例

文件book.xml
<?xml version="1.0" encoding="UTF-8"?>
<图书>
     <书>
          <书名 name="名著">西游记</书名>
	  <作者>吴承恩</作者>  
	  <售价>18</售价>  
     </书>
     <书>
          <书名>三国演义</书名>
          <作者>罗贯中</作者>  
	  <售价>20</售价>
     </书> 
</图书>
           

    例1:读取XML文档,取出 <书名>西游记</书名>节点中的值

@Test
 public void read1() throws Exception {
		// 得到工厂
		DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
		// 得到DOM解析器
		DocumentBuilder builder = factory.newDocumentBuilder();
		// 解析XML文档
		Document document = builder.parse("src/com/it/book.xml");

		// 获取书名的节点
		NodeList list = document.getElementsByTagName("书名");
		Node node = list.item(0);
		String context = node.getTextContent();
		System.out.println(context);
	}
           
运行结果:
西游记
           

举例2: 得到XML文档所有标签

@Test
	public void read2() throws Exception {
		// 得到工厂
		DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
		// 得到DOM解析器
		DocumentBuilder builder = factory.newDocumentBuilder();
		// 解析XML文档
		Document document = builder.parse("src/com/it/book.xml");

		Node root = document.getElementsByTagName("图书").item(0);
		list(root);
	}

	private void list(Node node) {
		if (node instanceof Element) {
			System.out.println(node.getNodeName());// 如果是元素就打印,否则就不打印
		}
		NodeList list = node.getChildNodes(); // 得到节点的孩子节点
		for (int i = 0; i < list.getLength(); i++) {
			Node child = list.item(i); // 得到孩子节点
			list(child); // 采用递归
		}
	}
           
运行结果:
图书
书
书名
作者
售价
书
书名
作者
售价
           

   举例3:读取XML文档标签属性的值:<书名 name="名著">西游记</书名>

@Test
	public void read3() throws Exception {
		// 得到工厂
		DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
		// 得到DOM解析器
		DocumentBuilder builder = factory.newDocumentBuilder();
		// 解析XML文档
		Document document = builder.parse("src/com/it/book.xml");

		Element bookName = (Element) document.getElementsByTagName("书名").item(0);	
                String value = bookName.getAttribute("name");      
                System.out.println(value);
	}
           
运行结果:
名著