XML简介及简单应用

XML 简介可扩展标记型语言

html 里面的标签是固定的

XML 标签可以自己来定义<person></person><猫></猫>

XML用途

可以用于显示数据和存储数据（主要功能是存储）

XML 是w3c组织发布的技术

1.1版本不能向下兼容

XML应用

不同系统之间传输数据

QQ之间的数据传输

用了表示生活中有关系的数据

经常用在配置文件

XML的语法

xml的文档声明

定义元素（标签）

定义属性

注释

特殊字符

CDTAT区

PI指令

XML中文乱码问题解决：保存和执行编码表需要一致

XML元素的定义

标签的定义：标签有开始必须有结束

标签没有内容可以在标签内结束

标签可以嵌套必须合理嵌套：不能交叉

XML把空格换行都当成内容来解析

<aa>aaaaa</aa>

<aa>aaaaa

<aa/>这俩个不一样、

定义区分大小写不能以数字和下划线开头

不能以xml XML等开头

不能包含空格名称中间不能包含冒号

XML属性的定义

属性定义的要求

一个标签上可以有多个属性

属性名称不能相同

属性值一定要用引号

其他和元素定义相同

注释不能嵌套

XML转义字符

& --> &amp

< --> &lt

> --> &gt

" --> &quot

' --> &apos

XML的CDTAT区解决频繁转义的操作

把需要转义内容放入CDTAT区就不需要转义

写法 <![CDTAT[ 内容 ]]>

PI指令（处理指令）

可以在xml中设置样式

写法:<?xml-stylesheet type="text/css" href="css路径" target="_blank" rel="external nofollow" >对中文不起作用

XML的约束

xml的约束技术 dtd约束 schema约束

dtd快速入门

·创建一个文件后缀为.dtd

·步骤看xml中有多少元素有几个元素，写几个<!ELEMENT>

判断元素书简单元素还是复杂元素

简单元素就是没有子元素 <ELEMENT 元素名称（#PCDATA）>

复杂元素就是有子元素 <!ELEMENT 元素名称（子元素）>

在xml中引入dtd文件

<!DOCTYPE 根元素名称 SYSTEM "dtd文件路径">

· 打开xml文件使用浏览器打开，浏览器只负责校验xml语法不检验约束

· 要检验xml约束，需要使用工具（myeclise）

dta的三种引入方式

<!DOCTYPE 根元素名称 SYSTEM "dtd文件路径">

<!DOCTYPE 根元素名称 [ DTD代码 ]>

框架多使用<!DOCTYPE PUBLIC "dtd名称" "dtd文档url">

使用dtd定义元素

语法 <!ELEMENT 元素名称约束>

简单元素#PCDATA 约束是字符串类型

EMPTY 元素为空

ANY：任意

复杂元素

<!ELEMENT 元素名称（子元素）>子元素只能出现一次

+：表示一次或者多次

?：表示零次或者一次

*：表示任意次

子元素用|隔开只能出现任意一个

使用dtd定义属性

语法: <! ATTLIST 元素名称

属性名称属性类型属性的约束 >

属性值类型 CDATA 文本字符串

枚举 | 每次出现其中一个

ID 表示属性取值不能重复

属性约束设置说明

REQUIRED:该属性必须出现

IMPLIED：该属性可有可无

FIXED:属性的取值为固定值

直接值：表示取值为该默认值

引入实体定义<!ENTITY 实体名称 "实体的值">

使用 &实体名称

·注意定义实体需要写在dtd里面

XML解析的简介（写到java代码）

xml的解析方式：dom 和 sax

使用dom解析xml 优点方便操作增删改查缺点是容易内存溢出

使用sam解析：采用事件驱动边读边解析不会内存溢出但不能实现增删改操作

解析xml ，首先需要解析器

不同的公司和组织提供了api方式提供

sun：针对dom 和sax的解析器 jaxp

dom4j： dom4j（实际开发中使用最多）

jdom： jdom

jaxp的api查看发现

jaxp是javase的一部分

jaxp解析器在jdk的javax.xml.parsers包里

四个类分别针对dom和sax解析使用的类

dom DocumentBuilder ：解析器类（抽象类）

可以从DocumentBuilderFactory.newDocumentBuilder()中获取

一个解析xml的方法 parse（String url）返回Document整个文档

- 返回的document是一个接口，父节点是Node，如果在document里面找不到想要的方法，到Node里面去找

- 在document里面方法

getElementsByTagName(String tagname)

-- 这个方法可以得到标签

-- 返回集合 NodeList

createElement(String tagName)

-- 创建标签

createTextNode(String data)

-- 创建文本

appendChild(Node newChild)

-- 把文本添加到标签下面

removeChild(Node oldChild)

-- 删除节点

getParentNode()

-- 获取父节点

NodeList list

- getLength() 得到集合的长度

- item(int index)下标取到具体的值

for(int i=0;i<list.getLength();i++) {

list.item(i)

}

getTextContent()

- 得到标签里面的内容

DocumentBuilderFactory 解析器工厂（抽象类）

可以从newInstance（）获取

sax SAXparser解析器类

SAXparserFactory 解析器工厂

使用jaxp实现查询操作

*** 查询xml中所有的name元素的值

* 步骤

//查询所有name元素的值

*** 查询xml中第一个name元素的值

* 步骤

使用jaxp添加节点

*** 在第一个p1下面（末尾）添加 <sex>nv</sex>

**步骤

使用jaxp修改节点

*** 修改第一个p1下面的sex内容是nan

** 步骤

使用jaxp删除节点

*** 删除<sex>nan</sex>节点

** 步骤

使用jaxp遍历节点

** 把xml中的所有元素名称打印出来

** 步骤

** 遍历的方法

//递归遍历的方法

private static void list1(Node node) {

//判断是元素类型时候才打印

if(node.getNodeType() == Node.ELEMENT_NODE) {

System.out.println(node.getNodeName());

}

//得到一层子节点

NodeList list = node.getChildNodes();

//遍历list

for(int i=0;i<list.getLength();i++) {

//得到每一个节点

Node node1 = list.item(i);

//继续得到node1的子节点

//node1.getChildNodes()

list1(node1);

}

schema约束

dtd语法： <!ELEMENT 元素名称约束>

** schema符合xml的语法，xml语句

** 一个xml中可以有多个schema，多个schema使用名称空间区分（类似于java包名）

** dtd里面有PCDATA类型，但是在schema里面可以支持更多的数据类型

*** 比如年龄只能是整数，在schema可以直接定义一个整数类型

*** schema语法更加复杂，schema目前不能替代dtd

schema的快速入门

* 创建一个schema文件后缀名是 .xsd

** 根节点 <schema>

** 在schema文件里面

** 属性 xmlns="http://www.w3.org/2001/XMLSchema"

- 表示当前xml文件是一个约束文件

** targetNamespace="http://www.itcast.cn/20151111"

- 使用schema约束文件，直接通过这个地址引入约束文件

** elementFormDefault="qualified"

步骤

（1）看xml中有多少个元素

（2）看简单元素和复杂元素

* 如果复杂元素

<complexType>
					<sequence>
						子元素
					</sequence>
			</complexType>

（3）简单元素，写在复杂元素的

<element name="person">
			<complexType>
			<sequence>
					<element name="name" type="string"></element>
					<element name="age" type="int"></element>
			</sequence>
			</complexType>
			</element>

（4）在被约束文件里面引入约束文件

<person xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"

xmlns="http://www.itcast.cn/20151111"

xsi:schemaLocation="http://www.itcast.cn/20151111 1.xsd">

** xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"

-- 表示xml是一个被约束文件

** xmlns="http://www.itcast.cn/20151111"

-- 是约束文档里面 targetNamespace

** xsi:schemaLocation="http://www.itcast.cn/20151111 1.xsd">

-- targetNamespace 空格约束文档的地址路径

* <sequence>：表示元素的出现的顺序

<all>: 元素只能出现一次

<choice>：元素只能出现其中的一个

maxOccurs="unbounded"：表示元素的出现的次数

<any></any>:表示任意元素

* 可以约束属性

* 写在复杂元素里面

***写在　</complexType>之前

－－

- name: 属性名称

- type：属性类型 int stirng

- use：属性是否必须出现 required

* 复杂的schema约束

<company xmlns = "http://www.example.org/company"
	xmlns:dept="http://www.example.org/department"
	xmlns:xsi = "http://www.w3.org/2001/XMLSchema-instance"
	xsi:schemaLocation="http://www.example.org/company company.xsd http://www.example.org/department department.xsd" >

* 引入多个schema文件，可以给每个起一个别名

<dept:name>100</dept:name>

* 想要引入部门的约束文件里面的name，使用部门的别名 detp:元素名称

</employee>

sax解析的原理（********）

* 解析xml有两种技术 dom 和sax

* 根据xml的层级结构在内存中分配一个树形结构

** 把xml中标签，属性，文本封装成对象

* sax方式：事件驱动，边读边解析

* 在javax.xml.parsers包里面

** SAXParser

此类的实例可以从 SAXParserFactory.newSAXParser() 方法获得

- parse(File f, DefaultHandler dh)

* 两个参数

** 第一个参数：xml的路径

** 事件处理器

** SAXParserFactory

实例 newInstance() 方法得到

* 画图分析一下sax执行过程

* 当解析到开始标签时候，自动执行startElement方法

* 当解析到文本时候，自动执行characters方法

* 当解析到结束标签时候，自动执行endElement方法

使用jaxp的sax方式解析xml（会写*）

* sax方式不能实现增删改操作，只能做查询操作

** 打印出整个文档

*** 执行parse方法，第一个参数xml路径，第二个参数是事件处理器

*** 创建一个类，继承事件处理器的类，

***重写里面的三个方法

* 获取到所有的name元素的值

** 定义一个成员变量 flag= false

** 判断开始方法是否是name元素，如果是name元素，把flag值设置成true

** 如果flag值是true，在characters方法里面打印内容

** 当执行到结束方法时候，把flag值设置成false

* 获取第一个name元素的值

** 定义一个成员变量 idx=1

** 在结束方法时候，idx+1 idx++

** 想要打印出第一个name元素的值，

- 在characters方法里面判断，

-- 判断flag=true 并且 idx==1，在打印内容

使用dom4j解析xml

* dom4j，是一个组织，针对xml解析，提供解析器 dom4j

* dom4j不是javase的一部分，想要使用第一步需要怎么做？

*** 导入dom4j提供jar包

-- 创建一个文件夹 lib

-- 复制jar包到lib下面，

-- 右键点击jar包，build path -- add to build path

-- 看到jar包，变成奶瓶样子，表示导入成功

* 得到document

SAXReader reader = new SAXReader();

Document document = reader.read(url);

* document的父接口是Node

* 如果在document里面找不到想要的方法，到Node里面去找

* document里面的方法 getRootElement() ：获取根节点返回的是Element

* Element也是一个接口，父接口是Node

- Element和Node里面方法

** getParent()：获取父节点

** addElement：添加标签

* element(qname)

** 表示获取标签下面的第一个子标签

** qname：标签的名称

* elements(qname)

** 获取标签下面是这个名称的所有子标签（一层）

** qname：标签名称

* elements()

** 获取标

使用dom4j查询xml

* 解析是从上到下解析

* 查询所有name元素里面的值

* 查询第一个name元素的值

* 获取第二个name元素的值

使用dom4j查询xml

* 解析是从上到下解析

* 查询所有name元素里面的值

* 查询第一个name元素的值

* 获取第二个name元素的值

7、使用dom4j实现添加操作

* 在第一个p1标签末尾添加一个元素 <sex>nv</sex>

* 步骤

使用dom4j实现在特定位置添加元素

* 在第一个p1下面的age标签之前添加 <school>ecit.edu.cn</schlool>

* 步骤

** 可以对得到document的操作和回写xml的操作，封装成方法

** 也可以把传递的文件路径，封装成一个常量

*** 好处：可以提高开发速度，可以提交代码可维护性

- 比如想要修改文件路径（名称），这个时候只需要修改常量的值就可以了，其他代码不需要做任何改变

使用dom4j实现修改节点的操作

* 修改第一个p1下面的age元素的值 <age>30</age>

* 步骤

使用dom4j实现删除节点的操作

* 删除第一个p1下面的<school>ecit</school>元素

* 步骤

使用dom4j获取属性的操作

* 获取第一个p1里面的属性id1的值

* 步骤

//得到document

Document document = Dom4jUtils.getDocument(Dom4jUtils.PATH);

//使用selectNodes("//name")方法得到所有的name元素

List<Node> list = document.selectNodes("//name");

//遍历list集合

for (Node node : list) {

//node是每一个name元素

//得到name元素里面的值

String s = node.getText();

System.out.println(s);

}

** 使用xpath实现：获取第一个p1下面的name的值

* //p1[@id1='aaaa']/name

* 使用到 selectSingleNode("//p1[@id1='aaaa']/name")

* 步骤和代码

//得到document

Document document = Dom4jUtils.getDocument(Dom4jUtils.PATH);

//直接使用selectSingleNode方法实现

Node name1 = document.selectSingleNode("//p1[@id1='aaaa']/name"); //name的元素

//得到name里面的值

String s1 = name1.getText();

System.out.println(s1);

XML简介及简单应用

XML 简介 可扩展标记型语言

XML用途

XML应用

XML的语法

XML元素的定义

XML属性的定义

XML转义字符

XML的CDTAT区 解决频繁转义的操作

XML的约束

dtd快速入门

使用dtd定义元素

使用dtd定义属性

XML解析的简介（写到java代码）

jaxp的api查看发现

使用jaxp实现查询操作

使用jaxp添加节点

使用jaxp修改节点

使用jaxp删除节点

使用jaxp遍历节点

schema约束

schema的快速入门

* 复杂的schema约束

sax解析的原理（********）

使用jaxp的sax方式解析xml（**会写***）

使用dom4j解析xml

使用dom4j查询xml

使用dom4j查询xml

使用dom4j实现在特定位置添加元素

使用dom4j实现修改节点的操作

使用dom4j实现删除节点的操作

使用dom4j获取属性的操作

继续阅读

XML 简介可扩展标记型语言

XML的CDTAT区解决频繁转义的操作

使用jaxp的sax方式解析xml（会写*）