天天看点

POI - 读取Excel2003、Excel2007或更高级的兼容性问题

我们使用POI中的HSSFWorkbook来读取Excel数据。

<code>public</code> <code>void</code> <code>test(File file) </code><code>throws</code> <code>IOException {  </code>

<code>        </code><code>InputStream inp = </code><code>new</code> <code>FileInputStream(file);  </code>

<code>        </code><code>HSSFWorkbook workbook = </code><code>new</code> <code>HSSFWorkbook(inp);  </code>

<code>          </code> 

<code>        </code><code>// workbook...遍历操作  </code>

<code>    </code><code>}</code>

上边代码,读取Excel2003(xls)的文件没问题,但是一旦读取的是Excel2007(xlsx)的文件,就会报异常:“The supplied data appears to be in the Office 2007+ XML. You are calling the part of POI that deals with OLE2 Office Documents. You need to call a different part of POI to process this data (eg XSSF instead of HSSF)”

查阅了资料,Excel2007版本的Excel文件需要使用XSSFWorkbook来读取,如下:

<code>        </code><code>XSSFWorkbook workbook = </code><code>new</code> <code>XSSFWorkbook(inp);  </code>

注意:XSSFWorkbook需要额外导入poi-ooxml-3.9-sources.jar和poi-ooxml-schemas-3.9.jar。

这样,Excel2007的导入没问题了,但是导入Excel2003又报异常。

所以,在导入Excel的时候,尽量能判断导入Excel的版本,调用不同的方法。

我想到过使用文件后缀名来判断类型,但是如果有人将xlsx的后缀改为xls时,如果使用xlsx的函数来读取,结果是报错;虽然后缀名对了,但是文件内容编码等都不对。

最后,推荐使用poi-ooxml中的WorkbookFactory.create(inputStream)来创建Workbook,因为HSSFWorkbook和XSSFWorkbook都实现了Workbook接口。代码如下:

<code>Workbook wb = WorkbookFactory.create(is);</code>

可想而知,在WorkbookFactory.create()函数中,肯定有做过对文件类型的判断,一起来看一下源码是如何判断的:

<code>/** </code>

<code>     </code><code>* Creates the appropriate HSSFWorkbook / XSSFWorkbook from </code>

<code>     </code><code>*  the given InputStream. </code>

<code>     </code><code>* Your input stream MUST either support mark/reset, or </code>

<code>     </code><code>*  be wrapped as a {@link PushbackInputStream}! </code>

<code>     </code><code>*/</code>  

<code>    </code><code>public</code> <code>static</code> <code>Workbook create(InputStream inp) </code><code>throws</code> <code>IOException, InvalidFormatException {  </code>

<code>        </code><code>// If clearly doesn't do mark/reset, wrap up  </code>

<code>        </code><code>if</code><code>(! inp.markSupported()) {  </code>

<code>            </code><code>inp = </code><code>new</code> <code>PushbackInputStream(inp, </code><code>8</code><code>);  </code>

<code>        </code><code>}  </code>

<code>        </code><code>if</code><code>(POIFSFileSystem.hasPOIFSHeader(inp)) {  </code>

<code>            </code><code>return</code> <code>new</code> <code>HSSFWorkbook(inp);  </code>

<code>        </code><code>if</code><code>(POIXMLDocument.hasOOXMLHeader(inp)) {  </code>

<code>            </code><code>return</code> <code>new</code> <code>XSSFWorkbook(OPCPackage.open(inp));  </code>

<code>        </code><code>throw</code> <code>new</code> <code>IllegalArgumentException(</code><code>"Your InputStream was neither an OLE2 stream, nor an OOXML stream"</code><code>);  </code>

可以看到,有根据文件类型来分别创建合适的Workbook对象。是根据文件的头部信息去比对进行判断的,此时,就算改了后缀名,还是一样通不过

本文转自yunlielai51CTO博客,原文链接:http://blog.51cto.com/4925054/1735246,如需转载请自行联系原作者

继续阅读