天天看點

python處理xml檔案_Python解析并修改XML檔案

XML 本質上隻是一種資料格式,它的本意并不是管理資料,是以,在 XML 應用中,資料的管理仍然要借助資料庫,尤其是當資料量很大、性能要求很高的時候。

XML資料庫具有以下優勢:

XML資料庫能夠對半結構化資料進行有效的存取和管理。如網頁内容就是一種半結構化資料,而傳統的關系型資料庫對于網頁内容這類半結構化資料無法進行有效的管理;

提供對标簽名稱和路徑的操作。傳統的資料庫允許對資料元素的值進行操作,但不能對元素名稱進行操作;而半結構化資料庫提供了對标簽名稱的操作,還包括對路徑的操作;

由于XML資料格式能夠清晰地表達資料的層次特征,是以XML資料庫便于對階層化的資料進行操作。

在 Python 中使用 xml.etree.ElementTree 類來進行 XML 的解析操作,讀取代碼如下:

import xml.etree.ElementTree as ET

tree = ET.parse('student.xml')

root = tree.getroot()

#列印根節點的标簽和屬性

for child, in root:

print(child.tag, child.attrib)

for student in root.findall_('student'):

id = student.find('id').text

age = student.find('age').text

xuehao = student.find('xuehao').text

print(id,age,xuehao)

在讀取中,findall( ) 方法隻能用來查找直接子元素,而 find( ) 方法能夠用來查找第一個直接子元素,并通過 tag 通路标簽,通過 attrib 通路屬性,通過 text 通路值。

xml.etree.ElementTree 類也可以用來修改 XML 檔案,代碼如下:

import xml.etree.ElementTree as ET

#讀取待修改的檔案

updateTree = ET.parse("04.xml")

root = updateTree.getroot()

#建立新節點并添加為root的子節點

newEle = ET.Element("wangwu")

newEle.attrib = {"xuehao":"201809", "age":"20"}

newEle.text = "這是一個新同學"

root.append(newEle)

#修改 sub1 的 xuehao 屬性

sub1 = root.find("lisi")

sub1.set("xuehao","20190101")

#修改 sub2 的資料值

sub2 = root.find("zhangsan")

sub2.text = "我是張三"

#寫回原檔案

updateTree.write("04.xml")

修改前的XML檔案内容為:

20

修改後的XML檔案内容為:

我是張三

這是一個新同學

程式運作結果增加了一個标簽,并修改了其他兩個标簽的值。Python 還可以建立新的 XML 檔案,在這裡不再一一講解。