這幾天在學習java io流的東西,有一個網友看到部落格後問了一個問題,就是說他的doc文檔為什麼用我所說的方法死活就是亂碼。 我一開始以為是他方法問題,結果自己試了之後發現和他的結果一樣也是亂碼。 于是在網上搜尋了一陣之後才發現原來doc文檔和excel一樣不能用普通的io流的方法來讀取,而是也需要用poi,于是進行了一番嘗試後,終于以正确的編碼格式讀取了這個doc檔案。 在網上搜尋的過程中發現doc和docx的讀取方法是不一樣的,于是順帶也學了一下docx檔案的簡單讀取。
一、導包:
doc檔案的讀取,需要導入poi-scratchpad的jar包和相關依賴包:

docx檔案讀取,需要導入poi-ooxml的jar包和相關依賴包:
我用的是maven建構項目,相關的依賴包會自動導入,maven導包配置如下:
二、讀取檔案的代碼:
1、doc檔案讀取簡單示例:
2、docx檔案讀取簡單示例: