天天看点

shell下office、html、pdf文档互转方法

shell下office、html、pdf文档互转方法

 分类:

后台开发

版权声明:本文为博主原创文章,未经博主允许不得转载。

OFFICE 文档在线预览方案很多:

服务器先转换为PDF,再转换为SWF,最后通过网页加载Flash预览,比如flexpaper

Office文档直接转换为SWF,通过网页加载Flash预览

微软的Office365

在浏览器中直接打开

转换为html

今天,我们要用的方案是转换为html来预览。

技术方案: 

- office文档转换为pdf:使用libreoffice 

- pdf转html,使用pdf2htmlex

测试环境: 

操作系统:ubuntu 12.04

1

下载后,进行测试:

soffice 可以正常转换为pdf,但是中文显示为乱码

google一下,乱码问题大概是字体缺失的问题,于是尝试将windows下的字体拷贝过去,复制windows下的字体到/usr/share/fonts下,然后刷新字体缓存

再重启转换服务,再次测试,已经OK了!

下面介绍简单安装方式:

2

3

可以看到,当前目录生成了xiaoshujiang.html

写一个脚本,将两次转换放到一起,方便调用:

4

5

6

效果:

shell下office、html、pdf文档互转方法
shell下office、html、pdf文档互转方法
shell下office、html、pdf文档互转方法

本文介绍了一种在服务端将office文档转换为html以方便预览的方法。

实际使用时,可以将生成好的html放到网站路径下,通过拦截器,设置访问权限。