XML: Extensible Markup Language 可擴充标記語言

XML：

1. 概念：Extensible Markup Language 可擴充标記語言
	* 可擴充：标簽都是自定義的。 <user>  <student>

	* 功能
		* 存儲資料
			1. 配置檔案
			2. 在網絡中傳輸
	* xml與html的差別
		1. xml标簽都是自定義的，html标簽是預定義。
		2. xml的文法嚴格，html文法松散
		3. xml是存儲資料的，html是展示資料

	* w3c:網際網路聯盟

2. 文法：
	* 基本文法：
		1. xml文檔的字尾名 .xml
		2. xml第一行必須定義為文檔聲明
		3. xml文檔中有且僅有一個根标簽
		4. 屬性值必須使用引号(單雙都可)引起來
		5. 标簽必須正确關閉
		6. xml标簽名稱區分大小寫
	* 快速入門：
		<?xml version='1.0' ?>
		<users>
			<user id='1'>
				<name>zhangsan</name>
				<age>23</age>
				<gender>male</gender>
				<br/>
			</user>
			
			<user id='2'>
				<name>lisi</name>
				<age>24</age>
				<gender>female</gender>
			</user>
		</users>
		
	* 組成部分：
		1. 文檔聲明
			1. 格式：<?xml 屬性清單 ?>
			2. 屬性清單：
				* version：版本号，必須的屬性
				* encoding：編碼方式。告知解析引擎目前文檔使用的字元集，預設值：ISO-8859-1
				* standalone：是否獨立
					* 取值：
						* yes：不依賴其他檔案
						* no：依賴其他檔案
		2. 指令(了解)：結合css的
			* <?xml-stylesheet type="text/css" href="a.css" target="_blank" rel="external nofollow"  ?>
		3. 标簽：标簽名稱自定義的
			* 規則：
				* 名稱可以包含字母、數字以及其他的字元 
				* 名稱不能以數字或者标點符号開始 
				* 名稱不能以字母 xml（或者 XML、Xml 等等）開始 
				* 名稱不能包含空格 

		4. 屬性：
			id屬性值唯一
		5. 文本：
			* CDATA區：在該區域中的資料會被原樣展示
				* 格式：  <![CDATA[ 資料 ]]>

* 限制：規定xml文檔的書寫規則
		* 作為架構的使用者(程式員)：
			1. 能夠在xml中引入限制文檔
			2. 能夠簡單的讀懂限制文檔
		
		* 分類：
			1. DTD:一種簡單的限制技術
			2. Schema:一種複雜的限制技術


		* DTD：
			* 引入dtd文檔到xml文檔中
				* 内部dtd：将限制規則定義在xml文檔中
				* 外部dtd：将限制的規則定義在外部的dtd檔案中
					* 本地：<!DOCTYPE 根标簽名 SYSTEM "dtd檔案的位置">
					* 網絡：<!DOCTYPE 根标簽名 PUBLIC "dtd檔案名字" "dtd檔案的位置URL">


		* Schema:
			* 引入：
				1.填寫xml文檔的根元素
				2.引入xsi字首.  xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
				3.引入xsd檔案命名空間.  xsi:schemaLocation="http://www.itcast.cn/xml  student.xsd"
				4.為每一個xsd限制聲明一個字首,作為辨別  xmlns="http://www.itcast.cn/xml" 

			<students   xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
				xmlns="http://www.itcast.cn/xml"
				xsi:schemaLocation="http://www.itcast.cn/xml  student.xsd">

3. 解析：操作xml文檔，将文檔中的資料讀取到記憶體中
	* 操作xml文檔
		1. 解析(讀取)：将文檔中的資料讀取到記憶體中
		2. 寫入：将記憶體中的資料儲存到xml文檔中。持久化的存儲

	* 解析xml的方式：
		1. DOM：将标記語言文檔一次性加載進記憶體，在記憶體中形成一顆dom樹
			* 優點：操作友善，可以對文檔進行CRUD的所有操作
			* 缺點：占記憶體
		2. SAX：逐行讀取，基于事件驅動的。
			* 優點：不占記憶體。
			* 缺點：隻能讀取，不能增删改

* xml常見的解析器：
		1. JAXP：sun公司提供的解析器，支援dom和sax兩種思想
		2. DOM4J：一款非常優秀的解析器
		3. Jsoup：jsoup 是一款Java 的HTML解析器，可直接解析某個URL位址、HTML文本内容。它提供了一套非常省力的API，可通過DOM，CSS以及類似于jQuery的操作方法來取出和操作資料。
		4. PULL：Android作業系統内置的解析器，sax方式的。


	* Jsoup：jsoup 是一款Java 的HTML解析器，可直接解析某個URL位址、HTML文本内容。它提供了一套非常省力的API，可通過DOM，CSS以及類似于jQuery的操作方法來取出和操作資料。
		* 快速入門：
			* 步驟：
				1. 導入jar包
				2. 擷取Document對象
				3. 擷取對應的标簽Element對象
				4. 擷取資料

		* 代碼：
			 //2.1擷取student.xml的path
	        String path = JsoupDemo1.class.getClassLoader().getResource("student.xml").getPath();
	        //2.2解析xml文檔，加載文檔進記憶體，擷取dom樹--->Document
	        Document document = Jsoup.parse(new File(path), "utf-8");
	        //3.擷取元素對象 Element
	        Elements elements = document.getElementsByTag("name");
	
	        System.out.println(elements.size());
	        //3.1擷取第一個name的Element對象
	        Element element = elements.get(0);
	        //3.2擷取資料
	        String name = element.text();
	        System.out.println(name);

	* 對象的使用：
		1. Jsoup：工具類，可以解析html或xml文檔，傳回Document
			* parse：解析html或xml文檔，傳回Document
				* parse(File in, String charsetName)：解析xml或html檔案的。
				* parse(String html)：解析xml或html字元串
				* parse(URL url, int timeoutMillis)：通過網絡路徑擷取指定的html或xml的文檔對象
		2. Document：文檔對象。代表記憶體中的dom樹
			* 擷取Element對象
				* getElementById(String id)：根據id屬性值擷取唯一的element對象
				* getElementsByTag(String tagName)：根據标簽名稱擷取元素對象集合
				* getElementsByAttribute(String key)：根據屬性名稱擷取元素對象集合
				* getElementsByAttributeValue(String key, String value)：根據對應的屬性名和屬性值擷取元素對象集合
		3. Elements：元素Element對象的集合。可以當做 ArrayList<Element>來使用
		4. Element：元素對象
			1. 擷取子元素對象
				* getElementById(String id)：根據id屬性值擷取唯一的element對象
				* getElementsByTag(String tagName)：根據标簽名稱擷取元素對象集合
				* getElementsByAttribute(String key)：根據屬性名稱擷取元素對象集合
				* getElementsByAttributeValue(String key, String value)：根據對應的屬性名和屬性值擷取元素對象集合

			2. 擷取屬性值
				* String attr(String key)：根據屬性名稱擷取屬性值
			3. 擷取文本内容
				* String text():擷取文本内容
				* String html():擷取标簽體的所有内容(包括字标簽的字元串内容)
		5. Node：節點對象
			* 是Document和Element的父類

* 快捷查詢方式：
		1. selector:選擇器
			* 使用的方法：Elements	select(String cssQuery)
				* 文法：參考Selector類中定義的文法
		2. XPath：XPath即為XML路徑語言，它是一種用來确定XML（标準通用标記語言的子集）文檔中某部分位置的語言
			* 使用Jsoup的Xpath需要額外導入jar包。
			* 查詢w3cshool參考手冊，使用xpath的文法完成查詢
			* 代碼：
				//1.擷取student.xml的path
		        String path = JsoupDemo6.class.getClassLoader().getResource("student.xml").getPath();
		        //2.擷取Document對象
		        Document document = Jsoup.parse(new File(path), "utf-8");
		
		        //3.根據document對象，建立JXDocument對象
		        JXDocument jxDocument = new JXDocument(document);
		
		        //4.結合xpath文法查詢
		        //4.1查詢所有student标簽
		        List<JXNode> jxNodes = jxDocument.selN("//student");
		        for (JXNode jxNode : jxNodes) {
		            System.out.println(jxNode);
		        }
		
		        System.out.println("--------------------");
		
		        //4.2查詢所有student标簽下的name标簽
		        List<JXNode> jxNodes2 = jxDocument.selN("//student/name");
		        for (JXNode jxNode : jxNodes2) {
		            System.out.println(jxNode);
		        }
		
		        System.out.println("--------------------");
		
		        //4.3查詢student标簽下帶有id屬性的name标簽
		        List<JXNode> jxNodes3 = jxDocument.selN("//student/name[@id]");
		        for (JXNode jxNode : jxNodes3) {
		            System.out.println(jxNode);
		        }
		        System.out.println("--------------------");
		        //4.4查詢student标簽下帶有id屬性的name标簽 并且id屬性值為itcast
		
		        List<JXNode> jxNodes4 = jxDocument.selN("//student/name[@id='itcast']");
		        for (JXNode jxNode : jxNodes4) {
		            System.out.println(jxNode);
		        }

XML: Extensible Markup Language 可擴充标記語言

XML：

繼續閱讀

Java小案例——随機數猜測随機數猜測

nginx location中斜線的位置的重要性

27 Best Free Eclipse Plug-ins for Java Developer to be ProductiveCode Quality PluginsText Editor PluginsDependency ManagementVersion Control Integration PluginsFramework Development Continuous Integration Related PluginsOther Utility Plugins

Java String.format方法的簡單使用

neo4j之cypher使用文檔

GitHub連夜封殺！這份阿裡 10W 字内部 Java 字面試手冊到底有多強？

spark/scala關于【資源檔案】加載方法概述外部檔案加載方案測試資源檔案打包入jar包中小結

mybatis_入門程式Mybatis入門

AOP程式設計_Android優雅權限架構(1)概念基礎，2021金三銀四前言正文大綱正文

Effective Java 8:通用程式設計

OOM三種類型

Spring整合JMS(二)——三種消息監聽器一、消息監聽器MessageListener

工廠模式-三種類型

【遞歸】高效率求2的n次幂

win10本地scala和spark安裝安裝scala安裝spark

scala (3) Function 和 Method