用Java簡單的讀取word文檔中的資料:
第一步:下載下傳tm-extractors-0.4.jar
第二步:簡單的程式.(WordReader .java)
前提是你的E盤下有個Strust.doc檔案。
import java.io.File;
import java.io.FileInputStream;
import org.textmining.text.extraction.WordExtractor;
public class WordReader {
public static String readDoc(String doc) throws Exception {
// 建立輸入流讀取doc檔案
FileInputStream in = new FileInputStream(new File(doc));
WordExtractor extractor = null;
String text = null;
// 建立WordExtractor
extractor = new WordExtractor();
// 對doc檔案進行提取
text = extractor.extractText(in);
return text;
}
/**
* @param args
*/
public static void main(String[] args) {
// TODO Auto-generated method stub
try{
String text = WordReader.readDoc("E:/Strust.doc");
System.out.println(text);
}catch(Exception ex){
ex.printStackTrace();
}
}
這樣就簡單的完成了從word中讀取資料了。你可以把它生成一個txt的檔案。
本文轉自yunlielai51CTO部落格,原文連結:http://blog.51cto.com/4925054/1117728,如需轉載請自行聯系原作者