XML筆記_解析XML之DOM和SAX

DOM（Document Object Model）

1. 對于XML應用開發者來說，DOM就是一個對象化的XML資料接口，一個與語言無關、與平台無關的标準接口規範。

XML筆記_解析XML之DOM和SAX

要嚴格區分XML文檔樹中的根結點與根元素結點：根結點(Document)代表的是 XML 文檔本身，是我們解析XML 文檔的入口，而跟元素結點則表示XML 文檔的根元素，它對應于 XML 文檔的 Root。

XML筆記_解析XML之DOM和SAX

例子：

<?xml version="1.0"?>
<PEOPLE>
	<PERSON PERSONID="E01">
		<NAME>Tony Blair</NAME>
		<ADDRESS>10 Downing Street, London, UK</ADDRESS>
		<TEL>(061) 98765</TEL>
		<FAX>(061) 98765</FAX>
		<EMAIL>[email protected]</EMAIL>
	</PERSON>
	<PERSON PERSONID="E02">
		<NAME>Bill Clinton</NAME>
		<ADDRESS>White House, USA</ADDRESS>
		<TEL>(001) 6400 98765</TEL>
		<FAX>(001) 6400 98765</FAX>
		<EMAIL>[email protected]</EMAIL>
	</PERSON>
	<PERSON PERSONID="E03">
		<NAME>Tom Cruise</NAME>
		<ADDRESS>57 Jumbo Street, New York, USA</ADDRESS>
		<TEL>(001) 4500 67859</TEL>
		<FAX>(001) 4500 67859</FAX>
		<EMAIL>[email protected]</EMAIL>
	</PERSON>
	<PERSON PERSONID="E04">
		<NAME>Linda Goodman</NAME>
		<ADDRESS>78 Crax Lane, London, UK</ADDRESS>
		<TEL>(061) 54 56789</TEL>
		<FAX>(061) 54 56789</FAX>
		<EMAIL>lind[email protected]</EMAIL>
	</PERSON>
</PEOPLE>

package com.bob.xml.dom;

import java.io.File;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;

import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.NodeList;

public class DomTest1 {
	public static void main(String[] args) throws Exception {
		
		// step 1: 獲得dom解析器工廠（工廠的作用是用于建立具體的解析器）
		DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();

		// step 2：獲得具體的dom解析器
		DocumentBuilder db = dbf.newDocumentBuilder();

		// setp 3： 解析一個xml文檔，獲得Document對象（根結點）
		Document document = db.parse(new File("candidate.xml"));

		NodeList list = document.getElementsByTagName("PERSON");

		for (int i = 0; i < list.getLength(); i++) {
			Element element = (Element) list.item(i);
			String content = element.getElementsByTagName("NAME").item(0)
					.getFirstChild().getNodeValue();
			System.out.println(content);
		}

	}
}

解析xml前3步基本上都是固定的語句。sun為我們提供了多個解析器，每個解析器都實作了JAXP接口，是以可以在不同的解析器之前自由的切換。我們需要去解析一個XML文檔必須首先使用解析器獲得根節點（Document）對象。擷取Document方法是使用Sun提供的解析器工廠裡面的對應的解析器，然後通過解析器獲得Document對象。可參考上圖了解。

2. JAXP（Java API for XML Parsing):用于XML 解析的 Java API。

3. DocumentBuilderFactory 與 DocumentBuilder 之間的關系：

XML筆記_解析XML之DOM和SAX

4. SAX（Simple APIs for XML），面向 XML的簡單APIs。

5. 使用 DOM 解析 XML 時，首先将 XML 文檔加載到記憶體當中，然後可以通過随機的方式通路記憶體中的 DOM 樹； SAX 是基于事件而且是順序執行的，一旦經過了某個元素，我們就沒有辦法再去通路它了，SAX 不必事先将整個XML文檔加載到記憶體當中，是以它占據記憶體要比 DOM 小，對于大型的 XML 文檔來說，通常會使用 SAX 而不是 DOM 進行解析。

XML筆記_解析XML之DOM和SAX

繼續閱讀

Flex的MXML檔案結構

Flex中如何通過建立新的XML命名空間（namespace），在MXML中使用flash.filters類

關于Flex及AS3的百多條小小知識

Socket套接字類 AS3

Flash AS3 連續加載外部若幹圖檔

tomcat conf目錄下web.xml tomcat-users.xml server.xml context.xml這四個檔案的作用

Silverlight調用WCF服務，在添加WCF服務引用時，報錯如下：

sqli-labs第一關--報錯注入練習

小程式自定義button元件擷取使用者資訊（使用者授權登入）

寫一個Junit類...在Spring中

jqGrid的使用筆記：5. 事件

invalid byte 1 of 1-byte UTF-8 sequence

出現invalid byte 1 of 1-byte UTF-8 sequence問題

為什麼要選擇UniDAC

SIP Presence SUBSCRIBE-NOTIFY

QName是什麼