本文介紹如何通過Java後端程式代碼來展示如何将html轉為XML。此功能通過采用Word API- Free Spire.Doc for Java 提供的Document.saveToFile()方法來實作;該方法支援的目标文檔格式多達 30餘種。另外,該API也提供了多種方法,如Document.saveToEpub()、Document.saveToFile()、Document.saveToImages()、Document.saveToSVG()、Document.saveToTxt()、Document.saveToTiff()等,可用于将源檔案轉為Epub、圖檔、文本檔案等目标文檔格式。
下面,将以html轉為xml格式為例,介紹如何實作轉換。以下是詳細方法及步驟。
【關于如何導入jar包】
通過 Maven倉庫 下載下傳導入,如下配置pom.xml:
<repositories>
<repository>
<id>com.e-iceblue</id>
<url>https://repo.e-iceblue.cn/repository/maven-public/</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>e-iceblue</groupId>
<artifactId>spire.doc.free</artifactId>
<version>5.2.0</version>
</dependency>
</dependencies>
如需手動導入,需要下載下傳 jar包 到本地,然後解壓,找到lib檔案夾下的Spire.Doc.jar檔案。在IDEA中打開“Project Structure”界面,執行如圖步驟将本地路徑下的jar檔案手動引入Java程式:
【将 HTML 轉為 XML】
轉換時,可參考如下代碼步驟:
- 建立Document類的對象。
- 調用Document.loadFromFile(String fileName, FileFormat fileFormat)方法加載HTML檔案。
- 通過Document.saveToFile(String fileName, FileFormat fileFormat)方法儲存為XML格式到指定路徑。
Java
import com.spire.doc.*;
public class HTMLtoXML {
public static void main(String[] args) {
//建立Document類的對象
Document doc = new Document();
//加載html檔案
doc.loadFromFile("sample.html",FileFormat.Html);
//儲存為XML格式
doc.saveToFile("HTMLtoXML.xml", FileFormat.Xml);
}
}
轉換效果:
—END—