天天看點

XML文法與限制

1.開發工具介紹

1、開發工具

JDK

eclipse(真正開發的用的是eclipse)————IBM釋出

eclipse可以添加很多的插件(添加自己需要的插件)

myeclipse已經添加了很多的插件(收費)

2、myeclipse視圖恢複最原始的樣子(重置視圖)

window--> Reset Perspective

3、切換視圖

4、建立工程導入自定義安裝的JDK 

添加

5、修改快捷鍵

   window--> preferences--> General--> Keys--> Content Assist--> Remove Binding

6、Junit測試

 被測試的方法必須是:公共的、非靜态、無傳回值、無形參

2.xml概述

Extensible Markup Language

可擴充标記語言

XML技術是W3C組織釋出的

資料存儲格式

儲存和處理資料,同時儲存和處理他們之間的關系

允許使用者自定義标簽,用标簽儲存資料,标簽之間有層次關系

本質上是一段字元串,具有跨平台性的特性

經常用作應用程式配置檔案

4、儲存了XML資料的檔案就叫做xml檔案,字尾名為.xml

5、XML資料也可以以其他的方式存在(如在記憶體中建構XML資料),不要将XML語言狹隘的了解成xml檔案。

6、浏覽器内置了XML解析器,可以使用浏覽器對XML進行校驗

3.xml文法

一個XML檔案分為如下幾部分内容:

1、文檔聲明  <?xml version=”1.0” encoding=”GB2312” standalone=”no” ?>

  聲明文檔基本屬性,包含且隻包含一個文檔聲明,必須處在第一行 。

version 代表目前xml所遵循的xml标準,必須存在。

encoding告知解析器使用何種編碼解析目前xml,預設值為ISO8859-1

standalone指定目前XML文檔是否是一個獨立文檔,預設值為yes表示是一個獨立文檔

2、元素   

1.<開始标簽> 标簽體 </結束标簽>

 <自閉标簽/>   ---> 不含标簽體也不包含其他标簽

   2.有且僅有一個根标簽

3.元素的命名規範:

        區分大小寫

        不能以數字、标點符号、"_"開頭。

        不能以XML(或XML、或Xml 等)開頭。

        不能包含空格。

        名稱中間不能包含冒号(:)

1.一個标簽可以有多個屬性

2.屬性的值要用單引号或雙引号括起來,屬性的之中包含雙引号,就要用單引号了。

3.命名規範,參照元素的命名規範

1.注釋不能出現在文檔聲明之前。

2.注釋不能嵌套注釋

1.都可以用來轉義特殊字元。

    2.CDATA區  <![CDATA[    ]]>

    <![CDATA[這是要轉義的内容]]>

        被CDATA區擴起來的内容,将會被浏覽器當作文本來處理。

    3.轉義字元

        &  =  &

        < =  <

        >  =  >

        "  =  "

        ' = '

    4.CDATA區和轉義字元的差別

    (1)CDATA區成段轉義,轉義字元一次隻轉義一個字元

    (2)CDATA區轉義的字元儲存資料本來的格式,隻是通知解析器按文本去處理。

       轉義字元改變了資料本身的内容,利用其他字元替代了轉義字元。

6、處理指令 PI(processing instruction)<?xml-stylesheet type=”text/css” herf=”1.css” ?>

1.一段指令通知解析器以何種方式解析XML

指定解析器使用1.css去渲染目前的XML資料

2.文檔聲明就是一個最常見的處理指令。

4.DTD1

編寫一個文檔來限制一個xml文檔的寫法,這稱之為XML限制。

2、XML限制的作用

限制xml文檔的寫法

對xml進行校驗

3、常見的XML限制技術

XML DTD 

XML Schema

4、浏覽器預設關閉DTD校驗

myeclipse提供校驗

5、如何在XML中引入一個DTD

(1)外部引入

1.外置的dtd檔案字尾必須為.dtd,必須用utf-8編碼儲存.

          2.xml檔案中使用

            (1)<!DOCTYPE 根元素名稱  SYSTEM 檔案的位置>

    <!DOCTYPE 書架 SYSTEM "book.dtd">

    SYSTEM表明引入的dtd,在目前檔案系統中。

           (2) <!DOCTYPE 文檔根結點 PUBLIC "DTD名稱" "DTD檔案的URL">

    <!DOCTYPE web-app PUBLIC 

                "-//Sun Microsystems, Inc.//DTD Web Application 2.3//EN"

                "http://java.sun.com/dtd/web-app_2_3.dtd">

              PUBLIC表明引入的dtd,在網絡公共位置中.   

(2)内部引入

      直接在xml中書寫dtd

      <!DOCTYPE 根元素名稱[

        dtd限制....

      ]>

5.DTD2

(1)元素<!ELEMENT 元素名稱 元素限制>

元素限制:可以是元素内容、或存放類型

1.存放類型:ANY/EMPTY

        2.元素内容:子元素的清單 

    用小括号括起來

            1.子元素之間可以使用逗号進行分割,表明子元素必須按照順序出現

            2.子元素之間可以使用豎線進行分割,表面子元素出現其中之一

            3.#PCDATA 表明包含标簽體

            4.  + 1次或多次

                * 0次或多次

                ? 0次或一次

            5.可以使用小括号進行組的操作

    <!ELEMENT MYFILE ((TITLE*, AUTHOR?, EMAIL)* | COMMENT)>

(2)屬性 

    <!ATTLIST 元素名稱 

    屬性名1屬性值的類型整個屬性的限制

    屬性名2屬性值的類型 整個屬性的限制

    ......

    >

1.屬性值的類型:

        1.CDATA: 普通字元串

        2.枚舉 : 枚舉清單 

<!DOCTYPE 購物籃 [

                <!ELEMENT 肉 EMPTY>

                <!ATTLIST 肉 品種 ( 雞肉 | 牛肉 | 豬肉 | 魚肉 ) "雞肉">

]> 

        3.ID: 必須唯一的,

ID 屬性的值隻能由字母,下劃線開始,不能使用數字,不能出現空白字元

        4.參數實體   &實體名稱

2.屬性限制:

        #REQUIRED 必須存在的屬性

        #IMPLIED一個可選的屬性,可有可無

        #FIXED '固定值' 具有一個固定的屬性值,指定了一個不是固定值的值則校驗報錯

        '預設值' 預設屬性值

             <!ATTLIST 頁面作者 

                     姓名 CDATA #IMPLIED 

                     年齡 CDATA #IMPLIED 

                     聯系資訊 CDATA #REQUIRED 

                     網站職務 CDATA #FIXED "頁面作者" 

                     個人愛好 CDATA "上網"  //上網為預設屬性值

               > 

(3)ENTITY(實體)

    <!ENTITY >,就是對一大段内容的引用,可以簡化代碼的複用

    引用實體:在xml中引用的實體叫做引用實體

    <!ENTITY 實體名稱 “實體内容” >

    在xml語句裡,用&實體名稱,代替實體内容;

    參數實體:在dtd中引用的實體叫做參數實體

    <!ENTITY % 實體名稱 "實體内容">

    在DTD語句裡,用%實體名稱,代替實體内容;

6.兩種解析思想

利用java程式去增删改查(CRUD)xml中的資料--> xml程式設計

兩種解析思想:

1.dom解析

1、将整個XML使用類似樹的結構,儲存在記憶體中,再對其進行操作。

2、是 W3C 組織推薦的處理 XML 的一種方式。

3、需要等到XML完全加載進記憶體才可以進行操作

4、耗費記憶體,當解析超大的XML時慎用。

5、可以友善的對xml進行增删改查操作

2.sax解析

1、逐行掃描XML文檔,當遇到标簽時觸發解析處理器,采用事件處理的方式解析。 2、(Simple API for XML) 非官方标準,但它是 XML 社群事實上的标準,幾乎所有的 XML 解析器都支援它。

3、在讀取文檔同時即可對xml進行處理,不必等到文檔加載結束,相對快捷。

4、不需要将文檔加載進記憶體,是以不存在占用記憶體的問題,可以解析超大XML。

5、隻能讀取XML中資料,無法進行增删改

7.sax解析_dom4j解析入門

利用這兩種解析思想,實作了很多的解析api

1、既有dom方式也有sax方式,

2、這套解析api已經加入到j2se的規範中,不需要導入任何第三方開發包就可以直接使用這種解析方式.但是這種解析方式效率低下,沒什麼人用.

3、jaxp 的sax解析過程:

1、使用dom方式高效的解析xml.

pull

2、導入開發包,通常隻需要導入核心包就可以了

3、如果在使用的過程中提示少什麼包到lib目錄下在導入缺少的包即可

4.與JDOM不同的是,dom4j使用接口和抽象基類。

5.dom4j不能跨着級别查元素

6.dom4j的解析過程

    SAXReader reader  = new SAXReader();

    Document dom = reader.read("book.xml");

    Element root = dom.getRootElement();

    Element bookName = root.element("書").element("書名");

    String bookNameText = bookName.getText();

    System.out.println(bookNameText);

8.dom4j進行增删改查

    public void selc_add_update_dele() throws DocumentException, IOException{

    List<Element> list = root.elements();//root的直系元素,這裡就是書

    Element book2Ele = list.get(1);//第二本書

    Element book2Name = book2Ele.element("書名");

    System.out.println(book2Name.getText());

    //1。建立<書>下的<特價>節點,并設定标簽體

    Element bargainPrice1 = DocumentHelper.createElement("特價");

    bargainPrice1.setText("40.00");

    //2.擷取父标簽<書>,将<特價>節點挂上去

    Element book1 = root.element("書");

    book1.add(bargainPrice1);

    //3.更新特價的值

    bargainPrice.setText("14.00");

    //4.删除特價

    bargainPrice1.getParent().remove(bargainPrice1);

    //寫到檔案中

    XMLWriter xwr = new XMLWriter(new  

    FileOutputStream("book.xml"),OutputFormat.createPrettyPrint());

    xwr.write(dom);

    xwr.close();

    }

9.Schema之名稱空間

簡介:

1、xml的限制技術  --- 需要掌握名稱空間的概念,會讀簡單的Schema就可以了

2、Schema是xml的限制技術,出現的目的是為了替代dtd

3、本身也是一個xml,非常友善使用xml的解析引擎進行解析,但它的擴充名通常為.xsd

優點:

4、對名稱空間有非常好的支援

5、支援更多的資料類型,并且支援使用者自定義資料類型

6、可以進行語義級别的限定,限定能力大大強于dtd

缺點:

7、相對于dtd不支援實體

8、相對于dtd複雜的多,學習成本比較的高

重點:

9、如何在xml中引入Schema --- !!!!!名稱空間的概念:全世界獨一無二的名字,用來唯一的辨別某個資源,通常是公司的域名,隻是名字而已并不真的表示資源的位置.

10、targetNamespace用于指定schema文檔中聲明的元素屬于哪個名稱空間。

11、elementFormDefault用于指定,該schema文檔中聲明的根元素及其所有子元素是否都屬于targetNamespace所指定的名稱空間。預設值為qualified,表示都屬于指定的名稱空間。若值為unqualified,表示隻有根元素屬于指定名稱空間。

book.xsd檔案:

    <?xml version="1.0" encoding="UTF-8" ?> 

    <xs:schema  xmlns:xs="http://www.w3.org/2001/XMLSchema"

      targetNamespace=“www.itcast.cn"   

      elementFormDefault="qualified">

    <xs:element name='書架' >

    <xs:complexType>

    <xs:sequence maxOccurs='unbounded' >

    <xs:element name='書' >

    <xs:sequence>

    <xs:element name='書名' type='xs:string' />

    <xs:element name='作者' type='xs:string' />

    <xs:element name='售價' type='xs:string' />

    </xs:sequence>

    </xs:complexType>

    </xs:element>

12、schemaLocation此屬性有兩個值。第一個值是需要使用的命名空間。第二個值是供命名空間使用的 XML schema 的位置,兩者之間用空格分隔。使用schemaLocation屬性時,也需要指定該屬性來自哪裡

book.xml檔案:

    <?xml version="1.0" encoding="UTF-8"?>

    <itcast:書架 xmlns:itcast=“www.itcast.cn”

    xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"

    xsi:schemaLocation=“www.itcast.cn  book.xsd">  //限制檔案真正位置

    <itcast:書>

    <itcast:書名>JavaScript網頁開發</itcast:書名>

    <itcast:作者>張孝祥</itcast:作者>

    <itcast:售價>28.00元</itcast:售價>

    </itcast:書>

    </itcast:書架>

    ~~~ Schema的文法---參照Schema的文檔,了解即可