天天看點

Java 如何提取 XML 檔案的文本内容(論壇回複摘要)

問題

xml file "test.xml"

XML/HTML code ?

1 2 3 4 5 6 7 8 9 10 11

<?

xml

version

=

"1.0"

encoding

=

"UTF-8"

?>

<

div

>

<

div

>aa

<

a

href

=

""

>bb</

a

>

aa

<

a

href

=

""

>bb</

a

>

aa

</

div

>

<

div

>

</

div

>

</

div

>

用 Java 列印出文本内容(text content) "aabbaabbaa"

解決示範代碼

Get text by Java DOM API

Java file: PrintXmlNodeText.java

Java code ?

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23

import

java.io.*;

import

javax.xml.parsers.*;

import

org.w3c.dom.*;

import

org.xml.sax.*;

public

class

PrintXmlNodeText {

public

final

static

String filePath = 

"test.xml"

// Replace with your file path

public

static

void

main(String[] args) {

DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();

factory.setNamespaceAware(

true

);

try

{

DocumentBuilder builder = factory.newDocumentBuilder();

Document doc = builder.parse(

new

FileInputStream(filePath));

Element element = doc.getDocumentElement();

String txt = element.getTextContent().replaceAll(

"\\s+"

""

);  

// Key line for your problem

System.out.println(txt); 

// Result: "aabbaabbaa"

catch

(Exception e) {

e.printStackTrace();

}

}

}

連接配接 原貼: http://bbs.csdn.net/topics/390360256