天天看點

用Java讀取word中的資料

用Java簡單的讀取word文檔中的資料:

第一步:下載下傳tm-extractors-0.4.jar

第二步:簡單的程式.(WordReader .java)

前提是你的E盤下有個Strust.doc檔案。

import java.io.File;

import java.io.FileInputStream;

import org.textmining.text.extraction.WordExtractor;

public class WordReader {

 public static String readDoc(String doc) throws Exception {

  // 建立輸入流讀取doc檔案

  FileInputStream in = new FileInputStream(new File(doc));

  WordExtractor extractor = null;

  String text = null;

  // 建立WordExtractor

  extractor = new WordExtractor();

  // 對doc檔案進行提取

  text = extractor.extractText(in);

  return text;

 }

 /**

  * @param args

  */

 public static void main(String[] args) {

  // TODO Auto-generated method stub

        try{

         String text = WordReader.readDoc("E:/Strust.doc");

         System.out.println(text);

        }catch(Exception ex){

         ex.printStackTrace();

        }

}

   這樣就簡單的完成了從word中讀取資料了。你可以把它生成一個txt的檔案。

本文轉自yunlielai51CTO部落格,原文連結:http://blog.51cto.com/4925054/1117728,如需轉載請自行聯系原作者