<a target="_blank" href="http://bbs.qter.org/forum.php?mod=viewthread&tid=188">楼主</a>

发表于 2013-5-21 21:14:28 | 查看:
1001| 回复: 14
使用dom读取xml文档
版权声明
该文章原创于作者yafeilinux,转载请注明出处!
导语
xml(extensiblemarkup language,可扩展标记语言),是一种类似于html的标记语言,但它的设计目的是用来传输数据,而不是显示数据。xml的标签没有被预定义,用户需要在使用时自行进行定义。xml是w3c(万维网联盟)的推荐标准。相对于数据库表格的二维表示,xml使用的树形结构更能表现出数据的包含关系,作为一种文本文件格式,xml简单明了的特性使得它在信息存储和描述领域非常流行。
在qt中提供了qtxml模块来进行xml文档的处理,我们在qt帮助中输入关键字qtxml
module,可以看到该模块的类表。这里主要提供了三种解析方法: dom方法,可以进行读写;sax方法,可以进行读取;基于流的方法,分别使用qxmlstreamreader和qxmlstreamwriter进行读取和写入。要在项目中使用qtxml模块,还需要在项目文件(.pro文件)中添加qt
+= xml一行代码。这一节我们先来讲解一下dom的方法。
环境:windows xp + qt 4.8.4+qtcreator 2.6.2
目录
一、xml文档示例
二、使用dom读取xml文档内容
正文
下面是一个规范的xml文档:
<?xml version="1.0"encoding="utf-8"?>
<library>
<book id="01">
<title>qt</title>
<author>shiming</author>
</book>
<book id="02">
<title>linux</title>
<author>yafei</author>
</book>
</library>
每个xml文档都由xml说明(或者称为xml序言)开始,它是对xml文档处理的环境和要求的说明,比如这里的<?xmlversion="1.0"
encoding="utf-8"?>,其中xml version=“1.0”,表明使用的xml版本号,这里字母是区分大小写的;encoding=“utf-8”是使用的编码,指出文档是使用何种字符集建立的,默认值为unicode编码。xml文档内容由多个元素组成,一个元素由起始标签<标签名>和终止标签</标签名>以及两个标签之间的内容组成,而文档中第一个元素被称为根元素,比如这里的<library></library>,xml文档必须有且只有一个根元素。元素的名称是区分大小写的,元素还可以嵌套,比如这里的library、book、title和author等都是元素。元素可以包含属性,用来描述元素的相关信息,属性名和属性值在元素的起始标签中给出,格式为<元素名 属性名=“属性值”>,如<book
id=“01”>,属性值必须在单引号或者双引号中。在元素中可以包含子元素,也可以只包含文本内容,比如这里的<title>qt</title>中的qt就是文本内容。
dom(document object model,即文档对象模型)把xml文档转换成应用程序可以遍历的树形结构,这样便可以随机访问其中的节点。它的缺点是需要将整个xml文档读入内存,消耗内存较多。
在qt中使用qdomprocessinginstruction类来表示xml说明,元素对应qdomelement类,属性对应qdomattr类,文本内容由qdomtext类表示。所有的dom节点,比如这里的说明、元素、属性和文本等,都使用qdomnode来表示,然后使用对应的isprocessinginstruction()、iselement()、isattr()和istext()等函数来判断是否是该类型的元素,如果是,那么就可以使用toprocessinginstruction()、toelement()、toattr()和totext()等函数转换为具体的节点类型。
下面来演示一个例子,将读取前面介绍的xml文档的内容。
1.新建qt控制台应用,项目名称为mydom。
2.完成后打开mydom.pro项目文件,将第一行代码更改为:
qt += core xml
然后保存该文件。
3.打开main.cpp文件,更改内容如下:
#include <qcoreapplication>
#include <qtxml>
int main(int argc, char *argv[])
{
qcoreapplication a(argc, argv);
// 新建qdomdocument类对象,它代表一个xml文档
qdomdocument doc;
// 建立指向“my.xml”文件的qfile对象
qfile file("my.xml");
// 以只读方式打开
if (!file.open(qiodevice::readonly)) return 0;
// 将文件内容读到doc中
if (!doc.setcontent(&file))
{ file.close(); return 0; }
// 关闭文件
file.close();
// 获得doc的第一个节点,即xml说明
qdomnode firstnode = doc.firstchild();
// 输出xml说明
qdebug() << firstnode.nodename()
<< firstnode.nodevalue();
return a.exec();
}
4.然后先点击一下qt creator左下角的锤子图标来构建项目,这样会在源码目录旁生成构建目录,比如这里是mydom-build-桌面-debug,我们进入该目录,然后新建一个文本文档,如下图所示。
下面将其文件名更改为my.xml,注意一定要更改扩展名,一些电脑中扩展名可能自动隐藏了,可以去“工具→文件夹选项→查看”中修改。提示信息选择“是”即可。如下图所示。
更改完成后使用记事本打开my.xml文件,然后将前面的xml文档内容添加进去,保存退出即可。如下图所示。
5.现在运行程序,效果如下图所示。
如果大家不愿意看到字符串两边的引号,可以将源码中得qdebug()语句更改如下:
qdebug() << qprintable(firstnode.nodename())
<< qprintable(firstnode.nodevalue());
运行程序,效果如下图所示。
6.下面在main()函数的return a.exec();一行代码前继续添加如下代码:
qdomelement docelem = doc.documentelement(); //返回根元素
qdomnode n = docelem.firstchild();
//返回根节点的第一个子节点
//如果节点不为空
while(!n.isnull())
{
if (n.iselement()) //如果节点是元素
{
qdomelement e = n.toelement(); //将其转换为元素
qdebug() << qprintable(e.tagname())
//返回元素标记
<< qprintable(e.attribute("id")); //返回元素id属性的值
}
n = n.nextsibling(); //下一个兄弟节点
这里使用了firstchild()函数和nextsibling()函数,然后利用while()循环来实现对所有子元素的遍历。运行程序,效果如下图所示。
7.下面更改源码中得if()语句的内容,输出所有子节点的内容:
if (n.iselement()) //如果节点是元素
qdomelement e
= n.toelement();
qdebug()
<< qprintable(e.tagname())
<< qprintable(e.attribute("id"));
// 获得元素e的所有子节点的列表
qdomnodelist list
= e.childnodes();
// 遍历该列表
for(int i=0;
i<list.count(); i++)
{
qdomnode node
= list.at(i);
if(node.iselement())
qdebug()
<< " " << qprintable(node.toelement().tagname())
<<qprintable(node.toelement().text());
这里使用了childnodes()函数获得了元素所有子节点的列表,然后通过遍历这个列表实现了遍历其所有子元素。运行程序,效果如下图所示。
结语
通过上面的例子,我们实现了对一个xml文档的读取。可以看到,在qdom中,是将整个xml文件读到内存中的doc对象中的。然后使用节点(qdomnode )操作doc对象,像xml说明,元素,属性,文本等等都被看做是节点,这样就使得操作xml文档变得很简单,我们只需通过转换函数将节点转换成相应的类型,如
qdomelement e =n.toelement();
在下一节我们将讲述xml文件的创建和写入。
涉及到的源码:
kb, 下载次数: 12)