XML CDATA[轉]

2023-05-09 20:32:05

所有 XML 文檔中的文本均會被解析器解析。

隻有 CDATA 區段（CDATA section）中的文本會被解析器忽略。

Parsed Data

XML 解析器通常會解析 XML 文檔中所有的文本。

當某個 XML 元素被解析時，其标簽之間的文本也會被解析：

<message>此文本也會被解析</message>

解析器之是以這麼做是因為 XML 元素可包含其他元素，就像這個例子中，其中的 <name> 元素包含着另外的兩個元素(first 和 last)：

<name><first>Bill</first><last>Gates</last></name>

而解析器會把它分解為像這樣的子元素：

<name>

   <first>Bill</first>

   <last>Gates</last>

</name>

非法的 XML 字元必須被替換為實體引用（entity reference）。

假如您在 XML 文檔中放置了一個類似 "<" 字元，那麼這個文檔會産生一個錯誤，這是因為解析器會把它解釋為新元素的開始。是以你不能這樣寫：

<message>if salary < 1000 then</message>

為了避免此類錯誤，需要把字元 "<" 替換為實體引用，就像這樣：

<message>if salary < 1000 then</message>

注釋：嚴格地講，在 XML 中僅有字元 "<"和"&" 是非法的。省略号、引号和大于号是合法的，但是把它們替換為實體引用是個好的習慣。

CDATA 内部的所有東西都會被解析器忽略。

假如文本中包含了大量的 "<" 和 "&" 字元 - 就像程式設計代碼中經常出現的情況一樣 - 那麼這個 XML 元素就可以被定義為一個 CDATA 部分。

CDATA 區段開始于 "，結束于 "]]>"：

<script>



</script>

在上面的例子中，在 CDATA 區段中的所有東西都會被解析器忽略。

CDATA 區段不能包含字元串 "]]>"，是以，CDATA 區段的嵌套是不被允許的。

同時也需要確定在 "]]>" 字元串中沒有空格或折行。

來源：http://www.w3school.com.cn/xml/xml_cdata.asp