天天看點

xml基礎---文法

一.XML文法規則

XML的文檔和HTML的原代碼類似,也是用辨別來辨別内容。建立XML文檔必須遵守下列重要規則:

  規則1:必須有XML聲明語句  

XML聲明如下:        

XML文法的version,"1.0"版本

文檔内容編碼encoding (可選,預設是UTF-8。)

 文檔是否是standalone(預設值為no),表示文檔是否依賴DTD檔案

如:

<?xml version="1.0" standalone="yes" encoding="gb2312" ?>

注意:'<?xml " 要緊挨一起,後面的"?>"也是一樣.

  規則2:是否有DTD檔案

        如果文檔是一個"有效的XML文檔"(見上一章),那麼文檔一定要有相應DTD檔案,并且嚴格遵守DTD檔案制定的規範。DTD檔案的 

            聲明語句緊跟在XML聲明語句後面,格式如下:

  <!DOCTYPE type-of-doc SYSTEM/PUBLIC "dtd-name">

  其中:

  "!DOCTYPE"是指你要定義一個DOCTYPE;

  "type-of-doc"是文檔類型的名稱,由你自己定義,通常于DTD檔案名相同;

  "SYSTEM/PUBLIC"這兩個參數隻用其一。SYSTEM是指文檔使用的私有DTD檔案的網址,而PUBLIC則指文檔調用一個公用的DTD檔案的網址。

  "dtd-name" 就是DTD檔案的網址和名稱。所有DTD檔案的字尾名為".dtd"。

  我們還是用上面的例子,應該寫成這樣:

  <?xml version="1.0" standalone="no" encoding="UTF-8"?>

  <!DOCTYPE filelist SYSTEM "filelist.dtd">

  規則3:注意你的大小寫

  在XML文檔中,大小寫是有差別的。<P>和<p>是不同的辨別。注意在寫元素時,前後辨別大小寫要保持一樣。例如:<Author>ajie</Author>,寫成<Author>ajie</author>是錯誤的。

  你最好養成一種習慣,或者全部大寫,或者全部小寫,或者大寫第一個字母。這樣可以減少因為大小寫不比對産生的文檔錯誤。

  規則4:給屬性值加引号

  在HTML代碼裡面,屬性值可以加引号,也可以不加。例如:<font color=red>word</font>和<font color="red">word</font>都可以被浏覽器正确解釋。

  但是在XML中則規定,所有屬性值必須加引号(可以是單引号,也可以是雙引号),否則将被視為錯誤。

  規則5:所有的辨別必須有相應的結束辨別

  在HTML中,辨別可能不是成對出現的,比如<br>。而在XML中規定,所有辨別必須成對出現,有一個開始辨別,就必須有一個結束辨別。否則将被視為錯誤。

  規則6:所有的空辨別也必須被關閉

  空辨別就是辨別對之間沒有内容的辨別。比如<br>,<img>等辨別。在XML中,規定所有的辨別必須有結束辨別,針對這樣的空辨別,XML中處理的方法是在原辨別最後加/,就可以了。例如:

  <br>應寫為<br />;

  <META name="keywords" content="XML, SGML, HTML">應寫為<META name="keywords" content="XML, SGML, HTML" />;

  <IMG src= "cool.gif">應寫為<IMG src= "cool.gif" />

 Web浏覽器要解釋并且顯示使用HTML元素标記的文檔,需要處理器或者解析器,XML也是這樣的,該解析器以及内需使用資料的應用程式讀取XML,所有的XML解析器都要檢查XML文檔的格式是否良好,格式良好就是遵守XML規範,如之前提到的開始标記和結束标記對應,大小寫區分等等.解析器有兩種:驗證型解析器和非驗證型解析器.非驗證型的隻要檢查文檔的格式是否良好就可以了,而驗證型的還能根據另一個定義XML文檔内容和結構的文檔,來檢查XML文檔是否有效.如DTD,XSD.一般情況下,我們的浏覽器中就已經内嵌了XML的非驗證型的解析器.

二.元素的文法

  元素由一對辨別以及其中的内容組成。就象這樣:ajie。元素的名稱和辨別的名稱是一樣的。辨別可以用屬性來進一步描述。

  在XML中,沒有任何保留字,是以你可以随心所欲的用任何詞語來作為元素名稱。但是也必須遵守下列規範:

  1.名稱中可以包含字母、數字以及其它字母;

  2.名稱不能以數字或"_" (下劃線)開頭;

  3.名稱不能以字母xml(或XML 或Xml ..)開頭

  4.名稱中不能包含空格

  5.名稱中間不能包含":"(冒号)

  為了使元素更容易閱讀了解和操作,我們還有一些建議:

  1.名稱中不要使用"."。因為在很多程式語言中,"."是作為對象的屬性,例如:font.color。同樣的原因"-"也最好不要用,必須使用的,以"_"代替;

  2.名稱盡量簡短。

  3.名稱的大小寫盡量采用同一标準。

  4.名稱可以使用非英文字元,比如用中文。但是有些軟體可能不支援。(IE5目前是支援中文元素的。)

  另外,補充一點關于屬性的說明。在HTML中,屬性可以用來定義元素的顯示格式,比如:<font color="red">word</font>将把word顯示為紅色。而在XML中,屬性隻是對辨別的描述,與元素内容的顯示無關。例如同樣一句:<font color="red">word</font>,并不會将word顯示為紅色。(那麼,有網友會問:如何在XML中将文字顯示為紅色呢?這就需要使用CSS或者XSL,我們在下面詳細講述。)

  三.注釋的文法

  注釋是為了便于閱讀和了解,在XML文檔添加的附加資訊,将不會被程式解釋或則浏覽器顯示。

  注釋的文法如下:

  <!-- 這裡是注釋資訊-->

  可以看到,它和HTML中的注釋文法是一樣的,非常容易。養成良好的注釋習慣将使你的文檔更加便于維護,共享,看起來也更專業。

  四.CDATA的文法

  CDATA全稱character data,翻譯為字元資料。我們在寫XML文檔時,有時需要顯示字母,數字和其它的符号本身,比如"<",而在XML中,這些字元已經有特殊的含義,我們怎麼辦呢?這就需要用到CDATA文法。文法格式如下:

  <![CDATA[這裡放置需要顯示的字元]]>

  例如:

  <![CDATA[<AUTHOR sex="female">ajie</AUTHOR>]]>

  在頁面上顯示的内容将是"<AUTHOR sex="female">ajie</AUTHOR>"

  五.Namespaces的文法

  Namespaces翻譯為名字空間。名字空間有什麼作用呢?當我們在一個XML文檔中使用他人的或者多個DTD檔案,就會出現這樣的沖突:因為XML中辨別都是自己建立的,在不同的DTD檔案中,辨別名可能相同但表示的含義不同,這就可能引起資料混亂。

  比如在一個文檔<table>wood table</table>中<table>表示桌子,

  而在另一個文檔<table>namelist</table>中<table>表示表格。如果我需要同時處理這兩個文檔,就會發生名字沖突。

  了解決這個問題,我們引進了namespaces這個概念。namespaces通過給辨別名稱加一個網址(URL)定位的方法來差別這些名稱相同的辨別。

  Namespaces同樣需要在XML文檔的開頭部分聲明,聲明的文法如下:

  <document xmlns:yourname='URL'>

  其中yourname是由你定義的namespaces的名稱,URL就是名字空間的網址。

  假設上面的"桌子<table>"文檔來自http://www.zhuozi.com,我們就可以聲明為

  <document xmlns:zhuozi='http://www.zhuozi.com'>

  然後在後面的辨別中使用定義好的名字空間:

  <zhuozi:table>wood table</table>

  這樣就将這兩個<table>區分開來。注意的是:設定URL并不是說這個辨別真的要到那個網址去讀取,僅僅作為一種差別的标志而已。

  六.entity的文法

  entity翻譯為"實體"。它的作用類似word中的"宏",也可以了解為DW中的摸闆,你可以預先定義一個entity,然後在一個文檔中多次調用,或者在多個文檔中調用同一個entity。

  entity可以包含字元,文字等等,使用entity的好處在于:1.它可以減少差錯,文檔中多個相同的部分隻需要輸入一遍就可以了。2.它提高維護效率。比如你有40個文檔都包含copyright的entity,如果需要修改這個copyright,不需要所有的檔案都修改,隻要改最初定義的entity語句就可以了。

  XML定義了兩種類型的entity。一種是我們這裡說的普通entity,在XML文檔中使用;另一種是參數entity,在DTD檔案中使用。

  entity的定義文法為:

  <!DOCTYPE filename [

  <!ENTITY entity-name "entity-content"

  ]

  >

  例如我要定義一段版權資訊:

  <!DOCTYPE copyright [

  <!ENTITY copyright "Copyright 2001, Ajie. All rights reserved"

  ]

  >

  如果我的版權資訊内容和他人共享一個XML檔案,也可以使用外部調用的方法,文法象這樣:

  <!DOCTYPE copyright [

  <!ENTITY copyright SYSTEM "http://www.sample.com/copyright.xml">

  ]

  >

  定義好的entity在文檔中的引用文法為:&entity-name;

  例如,上面定義的版權資訊,調用時寫作:&copyright;

  完整的例子如下,你可以copy下來存為copyright.xml觀看執行個體:

  <?xml version="1.0" encoding="GB2312"?>

  <!DOCTYPE copyright [

  <!ENTITY copyright "Copyright 2001, Ajie. All rights reserved">

  ]>

  <myfile>

  <title>XML</title>

  <author>ajie</author>

  <email>[email protected]</email>

  <date>20010115</date>

  &copyright;

  </myfile>

  七.DTD的文法

  DTD是"有效XML文檔"的必須檔案,我們通過DTD檔案來定義文檔中元素和辨別的規則及互相關系。如何建立一個DTD檔案呢?讓我們一起來學習:

  1.設定元素

  元素是XML文檔的基本組成部分。你要在DTD中定義一個元素,然後在XML文檔中使用。元素的定義文法為:<!ELEMENT DESCRIPTION (#PCDATA, DEFINITION)*>

  說明:

  "<!ELEMENT" 是元素的聲明,說明你要定義的是一個元素;

  聲明後面的"DESCRIPTION",是元素的名稱;

  "(#PCDATA, DEFINITION)*>"則是該元素的使用規則。規則定義了元素可以包含的内容以及互相的關系。下面的表格概要列出了元素的規則:

  2.元素規則表:

Symbol

 含 義

 舉  例

#PCDATA

 包含字元或文本資料

 <MYFILE(#PCDATA)>

元素MYFILE包含一個文本資料

#PCDATA, element-name

 包含文本和其它子元素

 <MYFILE(#PCDTATA,TITLE)>

MYFILE元素必須包含文本和TITLE子元素

,

 使用逗号分隔排序

 <MYFILE (TITLE,AUTHOR,EMAIL)>

MYFILE元素必須依次包含TITILE,AUTHOR,EMAIL三個子元素

|

 使用"|"表示或者

 <MYFILE (TITLE | AUTHOR | EMAIL)>

MYFILE元素必須包含TITLE,或者AUTHOR或者EMAIL子元素。

name

 隻能使用一次

 <MYFILE (TITLE)>

MYFILE元素必須包含TITLE子元素,而且隻能使用一次。

name?

 使用一次或者不使用

 <MYFILE (TITLE,AUTHOR?,EMAIL?)>

MYFILE元素必須包含TITLE子元素,而且隻能使用一次;可以包含或者不包含AUTHOR和EMAIL子元素,但是如果使用,隻能一次。

name+

 使用至少一次或多次

 <MYFILE (TITLE+,AUTHOR?,EMAIL)>

MYFILE元素必須包含TITLE子元素,而且使用至少一次;接下來可以跟随AUTHOR子元素,也可以不跟;最後必須包含EMAIL子元素,而且隻能使用一次。

name*

 使用一次,多次,或者根本不使用

 <MYFILE (TITLE*)>

MYFILE元素可以包含一個,多個或者不包含TITLE子元素

( )

 設定組,可以嵌套

 <MYFILE(#PCDATA | TITLE)*>

元素MYFILE包含一個或者更多的文本或者TITLE子元素。

<MYFILE((TITLE*, AUTHOR?, EMAIL)* | COMMENT)>

MYFILE元素必須包含一些内容,内容或者是一個注釋;也或者是多個組,組裡包含:一個,多個或者沒有TITLE子元素,接着是一個或者沒有AUTHOR子元素,再接着是一個必須的EMAIL子元素。 

  另外,我們還可以為元素定義屬性,因為我們不推薦使用屬性,在這裡就不詳細展開了。

  最後,我們來總結學習的内容,寫一個包含DTD,XML,以及Script的簡單執行個體,便于讀者了解:

  1.将下面檔案存為myfile.dtd

  <!ELEMENT myfile (title, author)>

  <!ELEMENT title (#PCDATA)>

  <!ELEMENT author (#PCDATA)>

  2.然後建立XML文檔myfile.xml:

  <?xml version="1.0" encoding="GB2312"?>

  <!DOCTYPE myfile SYSTEM "myfile.dtd">

  <myfile>

  <title>XML輕松學習手冊</title>

  <author>ajie</author>

  </myfile>

  3.建立HTML文檔myfile.html

  <html>

  <head>

  <script language="JavaScript" for="window" event="onload">

  var xmlDoc = new ActiveXObject("Microsoft.XMLDOM");

  xmlDoc.async="false";

  xmlDoc.load("myfile.xml");

  nodes = xmlDoc.documentElement.childNodes;

  title.innerText = nodes.item(0).text;

  author.innerText = nodes.item(1).text;

  </script>

  <title>在HTML中調用XML資料</title>

  </head>

  <body bgcolor="#FFFFFF">

  <b>标題: </b>

  <span id="title"></span><br>

  <b>作者: </b>

  <span id="author"></span><br>

  </body>

  </html>

  4.用IE5.0以上浏覽器打開myfile.html就可以看到效果了。