天天看點

shell下office、html、pdf文檔互轉方法

shell下office、html、pdf文檔互轉方法

 分類:

背景開發

版權聲明:本文為部落客原創文章,未經部落客允許不得轉載。

OFFICE 文檔線上預覽方案很多:

伺服器先轉換為PDF,再轉換為SWF,最後通過網頁加載Flash預覽,比如flexpaper

Office文檔直接轉換為SWF,通過網頁加載Flash預覽

微軟的Office365

在浏覽器中直接打開

轉換為html

今天,我們要用的方案是轉換為html來預覽。

技術方案: 

- office文檔轉換為pdf:使用libreoffice 

- pdf轉html,使用pdf2htmlex

測試環境: 

作業系統:ubuntu 12.04

1

下載下傳後,進行測試:

soffice 可以正常轉換為pdf,但是中文顯示為亂碼

google一下,亂碼問題大概是字型缺失的問題,于是嘗試将windows下的字型拷貝過去,複制windows下的字型到/usr/share/fonts下,然後重新整理字型緩存

再重新開機轉換服務,再次測試,已經OK了!

下面介紹簡單安裝方式:

2

3

可以看到,目前目錄生成了xiaoshujiang.html

寫一個腳本,将兩次轉換放到一起,友善調用:

4

5

6

效果:

shell下office、html、pdf文檔互轉方法
shell下office、html、pdf文檔互轉方法
shell下office、html、pdf文檔互轉方法

本文介紹了一種在服務端将office文檔轉換為html以友善預覽的方法。

實際使用時,可以将生成好的html放到網站路徑下,通過攔截器,設定通路權限。