導讀
常見的 XML 程式設計接口有 DOM 和 SAX,這兩種接口處理 XML 檔案的方式不同,當然使用場合也不同。
什麼是 XML?
XML 指可擴充标記語言(eXtensible Markup Language),标準通用标記語言的子集,是一種用于标記電子檔案使其具有結構性的标記語言。 你可以通過本站學習 XML 教程
XML 被設計用來傳輸和存儲資料。
XML 是一套定義語義标記的規則,這些标記将文檔分成許多部件并對這些部件加以辨別。
它也是元标記語言,即定義了用于定義其他與特定領域有關的、語義的、結構化的标記語言的句法語言。
Python 對 XML 的解析
常見的 XML 程式設計接口有 DOM 和 SAX,這兩種接口處理 XML 檔案的方式不同,當然使用場合也不同。
Python 有三種方法解析 XML,SAX,DOM,以及 ElementTree:
1.SAX (simple API for XML )
Python 标準庫包含 SAX 解析器,SAX 用事件驅動模型,通過在解析 XML 的過程中觸發一個個的事件并調用使用者定義的回調函數來處理 XML 檔案。
2.DOM(Document Object Model)
将 XML 資料在記憶體中解析成一個樹,通過對樹的操作來操作 XML。
本章節使用到的 XML 執行個體檔案 movies.xml 内容如下:
War, Thriller
DVD
2003
PG
10
Talk about a US-Japan war
Anime, Science Fiction
DVD
1989
R
8
A schientific fiction
Anime, Action
DVD
4
PG
10
Vash the Stampede!
Comedy
VHS
PG
2
Viewable boredom