有一批word文檔需要以網頁的形式呈現給使用者.
需要實作動态更新
方案一:
建立資料庫,把word中的内容放到資料庫中去,分别設定不同的字段,通過查詢資料庫的方式将内容呈現到網頁中。這是我最開始的解決思路,但是分析word文檔的内容以後發現建立資料庫的方案并不可行,原因是word文檔的内容格式不統一,比如1.docx的排版是标題+圖檔+文字介紹+流程圖,2.docx的排版是标題+圖檔+表格+文字介紹,這樣設計資料庫的時候比較麻煩,一來是圖檔存儲不友善,二來存在字段為空展示頁面的時候沒有統一的模闆的問題。
方案二:
把所有的word文檔手工編輯成html。這個方案立馬就被否決了,首先word檔案有幾十個,其次後期更新比較困難。
方案三:
word2html.exe位于WebContent/W2H檔案夾下,WordToHtml.java位于src目錄下,word檔案位于WebContent/upload/doc檔案夾下 . 在DOS指令行下執行方式和在java下執行本質上沒有差別,java中調用的時候注意檔案路徑。
需求實作程度90%(高了?),word檔案轉換存在圖檔位置瑕疵,圖檔轉換後有毛邊。
執行時間:轉換45個word檔案5秒左右(本機配置:Win7 64bit,i5 CPU,8gRAM,SSD,讀取word檔案需要OS多次 IO讀取磁盤,在普通硬碟上轉換時間會加長).
後期需要實作word上傳至WebContent/upload/doc檔案夾下,自動轉換成html并更新前端頁面;擷取.docx格式檔案名需要自動實作。