XML文法與限制

1.開發工具介紹

1、開發工具

JDK

eclipse（真正開發的用的是eclipse）————IBM釋出

eclipse可以添加很多的插件（添加自己需要的插件）

myeclipse已經添加了很多的插件（收費）

2、myeclipse視圖恢複最原始的樣子（重置視圖）

window--> Reset Perspective

3、切換視圖

4、建立工程導入自定義安裝的JDK

添加

5、修改快捷鍵

window--> preferences--> General--> Keys--> Content Assist--> Remove Binding

6、Junit測試

被測試的方法必須是：公共的、非靜态、無傳回值、無形參

2.xml概述

Extensible Markup Language

可擴充标記語言

XML技術是W3C組織釋出的

資料存儲格式

儲存和處理資料，同時儲存和處理他們之間的關系

允許使用者自定義标簽，用标簽儲存資料，标簽之間有層次關系

本質上是一段字元串，具有跨平台性的特性

經常用作應用程式配置檔案

4、儲存了XML資料的檔案就叫做xml檔案，字尾名為.xml

5、XML資料也可以以其他的方式存在（如在記憶體中建構XML資料），不要将XML語言狹隘的了解成xml檔案。

6、浏覽器内置了XML解析器，可以使用浏覽器對XML進行校驗

3.xml文法

一個XML檔案分為如下幾部分内容：

1、文檔聲明 <?xml version=”1.0” encoding=”GB2312” standalone=”no” ?>

聲明文檔基本屬性，包含且隻包含一個文檔聲明，必須處在第一行。

version 代表目前xml所遵循的xml标準，必須存在。

encoding告知解析器使用何種編碼解析目前xml，預設值為ISO8859-1

standalone指定目前XML文檔是否是一個獨立文檔，預設值為yes表示是一個獨立文檔

2、元素

1.<開始标簽> 标簽體 </結束标簽>

<自閉标簽/> ---> 不含标簽體也不包含其他标簽

2.有且僅有一個根标簽

3.元素的命名規範：

區分大小寫

不能以數字、标點符号、"_"開頭。

不能以XML(或XML、或Xml 等)開頭。

不能包含空格。

名稱中間不能包含冒号（:）

1.一個标簽可以有多個屬性

2.屬性的值要用單引号或雙引号括起來，屬性的之中包含雙引号，就要用單引号了。

3.命名規範，參照元素的命名規範

1.注釋不能出現在文檔聲明之前。

2.注釋不能嵌套注釋

1.都可以用來轉義特殊字元。

2.CDATA區 <![CDATA[ ]]>

<![CDATA[這是要轉義的内容]]>

被CDATA區擴起來的内容，将會被浏覽器當作文本來處理。

3.轉義字元

& = &

< = <

> = >

" = "

' = '

4.CDATA區和轉義字元的差別

(1)CDATA區成段轉義，轉義字元一次隻轉義一個字元

(2)CDATA區轉義的字元儲存資料本來的格式，隻是通知解析器按文本去處理。

轉義字元改變了資料本身的内容，利用其他字元替代了轉義字元。

6、處理指令 PI（processing instruction）<?xml-stylesheet type=”text/css” herf=”1.css” ?>

1.一段指令通知解析器以何種方式解析XML

指定解析器使用1.css去渲染目前的XML資料

2.文檔聲明就是一個最常見的處理指令。

4.DTD1

編寫一個文檔來限制一個xml文檔的寫法，這稱之為XML限制。

2、XML限制的作用

限制xml文檔的寫法

對xml進行校驗

3、常見的XML限制技術

XML DTD

XML Schema

4、浏覽器預設關閉DTD校驗

myeclipse提供校驗

5、如何在XML中引入一個DTD

(1)外部引入

1.外置的dtd檔案字尾必須為.dtd，必須用utf-8編碼儲存.

2.xml檔案中使用

(1)<!DOCTYPE 根元素名稱 SYSTEM 檔案的位置>

<!DOCTYPE 書架 SYSTEM "book.dtd">

SYSTEM表明引入的dtd，在目前檔案系統中。

(2) <!DOCTYPE 文檔根結點 PUBLIC "DTD名稱" "DTD檔案的URL">

<!DOCTYPE web-app PUBLIC

"-//Sun Microsystems, Inc.//DTD Web Application 2.3//EN"

"http://java.sun.com/dtd/web-app_2_3.dtd">

PUBLIC表明引入的dtd,在網絡公共位置中.

(2)内部引入

直接在xml中書寫dtd

<!DOCTYPE 根元素名稱[

dtd限制....

5.DTD2

(1)元素<!ELEMENT 元素名稱元素限制>

元素限制：可以是元素内容、或存放類型

1.存放類型:ANY/EMPTY

2.元素内容:子元素的清單

用小括号括起來

1.子元素之間可以使用逗号進行分割,表明子元素必須按照順序出現

2.子元素之間可以使用豎線進行分割,表面子元素出現其中之一

3.#PCDATA 表明包含标簽體

4. + 1次或多次

* 0次或多次

? 0次或一次

5.可以使用小括号進行組的操作

<!ELEMENT MYFILE ((TITLE*, AUTHOR?, EMAIL)* | COMMENT)>

(2)屬性

<!ATTLIST 元素名稱

屬性名1屬性值的類型整個屬性的限制

屬性名2屬性值的類型整個屬性的限制

......

1.屬性值的類型:

1.CDATA: 普通字元串

2.枚舉 : 枚舉清單

<!DOCTYPE 購物籃 [

<!ELEMENT 肉 EMPTY>

<!ATTLIST 肉品種 ( 雞肉 | 牛肉 | 豬肉 | 魚肉 ) "雞肉">

3.ID: 必須唯一的，

ID 屬性的值隻能由字母，下劃線開始，不能使用數字，不能出現空白字元

4.參數實體 &實體名稱

2.屬性限制:

#REQUIRED 必須存在的屬性

#IMPLIED一個可選的屬性,可有可無

#FIXED '固定值' 具有一個固定的屬性值，指定了一個不是固定值的值則校驗報錯

'預設值' 預設屬性值

<!ATTLIST 頁面作者

姓名 CDATA #IMPLIED

年齡 CDATA #IMPLIED

聯系資訊 CDATA #REQUIRED

網站職務 CDATA #FIXED "頁面作者"

個人愛好 CDATA "上網" //上網為預設屬性值

(3)ENTITY(實體)

<!ENTITY >,就是對一大段内容的引用,可以簡化代碼的複用

引用實體:在xml中引用的實體叫做引用實體

<!ENTITY 實體名稱 “實體内容” >

在xml語句裡，用&實體名稱，代替實體内容;

參數實體:在dtd中引用的實體叫做參數實體

<!ENTITY % 實體名稱 "實體内容">

在DTD語句裡，用%實體名稱，代替實體内容;

6.兩種解析思想

利用java程式去增删改查(CRUD)xml中的資料--> xml程式設計

兩種解析思想:

1.dom解析

1、将整個XML使用類似樹的結構，儲存在記憶體中，再對其進行操作。

2、是 W3C 組織推薦的處理 XML 的一種方式。

3、需要等到XML完全加載進記憶體才可以進行操作

4、耗費記憶體，當解析超大的XML時慎用。

5、可以友善的對xml進行增删改查操作

2.sax解析

1、逐行掃描XML文檔，當遇到标簽時觸發解析處理器，采用事件處理的方式解析。 2、(Simple API for XML) 非官方标準，但它是 XML 社群事實上的标準，幾乎所有的 XML 解析器都支援它。

3、在讀取文檔同時即可對xml進行處理，不必等到文檔加載結束，相對快捷。

4、不需要将文檔加載進記憶體，是以不存在占用記憶體的問題，可以解析超大XML。

5、隻能讀取XML中資料，無法進行增删改

7.sax解析_dom4j解析入門

利用這兩種解析思想，實作了很多的解析api

1、既有dom方式也有sax方式,

2、這套解析api已經加入到j2se的規範中,不需要導入任何第三方開發包就可以直接使用這種解析方式.但是這種解析方式效率低下,沒什麼人用.

3、jaxp 的sax解析過程：

1、使用dom方式高效的解析xml.

pull

2、導入開發包,通常隻需要導入核心包就可以了

3、如果在使用的過程中提示少什麼包到lib目錄下在導入缺少的包即可

4.與JDOM不同的是，dom4j使用接口和抽象基類。

5.dom4j不能跨着級别查元素

6.dom4j的解析過程

SAXReader reader = new SAXReader();

Document dom = reader.read("book.xml");

Element root = dom.getRootElement();

Element bookName = root.element("書").element("書名");

String bookNameText = bookName.getText();

System.out.println(bookNameText);

8.dom4j進行增删改查

public void selc_add_update_dele() throws DocumentException, IOException{

List<Element> list = root.elements();//root的直系元素，這裡就是書

Element book2Ele = list.get(1);//第二本書

Element book2Name = book2Ele.element("書名");

System.out.println(book2Name.getText());

//1。建立<書>下的<特價>節點，并設定标簽體

Element bargainPrice1 = DocumentHelper.createElement("特價");

bargainPrice1.setText("40.00");

//2.擷取父标簽<書>，将<特價>節點挂上去

Element book1 = root.element("書");

book1.add(bargainPrice1);

//3.更新特價的值

bargainPrice.setText("14.00");

//4.删除特價

bargainPrice1.getParent().remove(bargainPrice1);

//寫到檔案中

XMLWriter xwr = new XMLWriter(new

FileOutputStream("book.xml"),OutputFormat.createPrettyPrint());

xwr.write(dom);

xwr.close();

}

9.Schema之名稱空間

簡介：

1、xml的限制技術 --- 需要掌握名稱空間的概念,會讀簡單的Schema就可以了

2、Schema是xml的限制技術，出現的目的是為了替代dtd

3、本身也是一個xml，非常友善使用xml的解析引擎進行解析，但它的擴充名通常為.xsd

優點：

4、對名稱空間有非常好的支援

5、支援更多的資料類型，并且支援使用者自定義資料類型

6、可以進行語義級别的限定,限定能力大大強于dtd

缺點：

7、相對于dtd不支援實體

8、相對于dtd複雜的多,學習成本比較的高

重點：

9、如何在xml中引入Schema --- !!!!!名稱空間的概念:全世界獨一無二的名字,用來唯一的辨別某個資源,通常是公司的域名,隻是名字而已并不真的表示資源的位置.

10、targetNamespace用于指定schema文檔中聲明的元素屬于哪個名稱空間。

11、elementFormDefault用于指定，該schema文檔中聲明的根元素及其所有子元素是否都屬于targetNamespace所指定的名稱空間。預設值為qualified，表示都屬于指定的名稱空間。若值為unqualified，表示隻有根元素屬于指定名稱空間。

book.xsd檔案：

<?xml version="1.0" encoding="UTF-8" ?>

<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema"

targetNamespace=“www.itcast.cn"

elementFormDefault="qualified">

<xs:element name='書架' >

<xs:complexType>

<xs:sequence maxOccurs='unbounded' >

<xs:element name='書' >

<xs:sequence>

<xs:element name='書名' type='xs:string' />

<xs:element name='作者' type='xs:string' />

<xs:element name='售價' type='xs:string' />

</xs:sequence>

</xs:complexType>

</xs:element>

12、schemaLocation此屬性有兩個值。第一個值是需要使用的命名空間。第二個值是供命名空間使用的 XML schema 的位置，兩者之間用空格分隔。使用schemaLocation屬性時，也需要指定該屬性來自哪裡

book.xml檔案：

<?xml version="1.0" encoding="UTF-8"?>

<itcast:書架 xmlns:itcast=“www.itcast.cn”

xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"

xsi:schemaLocation=“www.itcast.cn book.xsd"> //限制檔案真正位置

<itcast:書>

<itcast:書名>JavaScript網頁開發</itcast:書名>

<itcast:作者>張孝祥</itcast:作者>

<itcast:售價>28.00元</itcast:售價>

</itcast:書>

</itcast:書架>

~~~ Schema的文法---參照Schema的文檔,了解即可

XML文法與限制

繼續閱讀

聯想拯救者Y7000p拆機換壓條(軸蓋)

麥博FC330低音炮拆機圖（簡易版）

xml解析失敗Invalid byte 1 of 1-byte UTF-8 sequence

invalid byte 1 of 1-byte UTF-8 sequence

出現invalid byte 1 of 1-byte UTF-8 sequence問題

2020年終總結和展望前言一、2020年終總結二、2021年展望

一場春雨，一個帶着泥土芬芳的記憶

在DOS下運作不了ipconfig指令

開博一周年

為什麼要選擇UniDAC

MathType

【可靠性評估】電力系統可靠性評估matlab仿真1.軟體版本2.本算法理論知識

在linux下安裝GSL庫以及在codeblocks上配置GSL庫一在 linux 上安裝 GSL 二在codeblocks 上按如下方式配置 GSL庫：三測試程式

SIP Presence SUBSCRIBE-NOTIFY

QName是什麼

swmm與lisflood-fp源碼如何一起編譯 CMake指令