天天看点

实现word转pdf,HTML转pdf(探索篇)【后话】

笔者找依赖的jar包,找的好辛苦。

实现word转pdf,HTML转pdf(探索篇)【后话】

ITextRenderer、

ITextFontResolver这两个类依赖的jar包到底是哪个,还有怎么下载?苦苦纠结了3个小时。

实现word转pdf,HTML转pdf(探索篇)【后话】

终于找到你了!

记录个网址:

http://www.java2s.com/Code/Jar/c/Downloadcorerendererr8pre2jar.htm

上测试代码:

调用+走你!

这里笔者结合上一篇poi将word转html,结合使用。

/**doc

转html

*/

String tagPath = "D:\red_ant_file\20180915\image\";

String sourcePath = "D:\red_ant_file\20180915\RedAnt的实验作业.doc";

String outPath = "D:\red_ant_file\20180915\123.html";

try {

AllServiceIsHere.docToHtml(tagPath, sourcePath, outPath);

} catch (Exception e) {

// TODO Auto-generated catch block

e.printStackTrace();

}

【注意】

(值得注意的地方是IText 根据html生成pdf文件的时候,会验证html文件是否标准,例如通过poi转换的出来的html文件的一些标签会缺少标签闭合 ” / “ :

否则,你会遇到

Can't load the XML resource (using TRaX transformer). org.xml.sax.SAXParseException; lineNumber: 23; columnNumber: 3; 元素类型 "meta" 必须由匹配的结束标记 "</meta>" 终止。

笔者尝试,使用第三方 jar 包Jsoup, 直接调用 parse方法,笔者认为html就标准啦!

这个坑,让笔者苦恼了,1个小时。

为此,笔者不得不重写,word转html代码:

再次记录个网址:下载第三方 jar 包Jsoup使用

https://jsoup.org/download

上重写word转html代码:

准备个文件,测试一下。

word转html,规范化代码后的转换结果。

实现word转pdf,HTML转pdf(探索篇)【后话】

接下来,html转pdf

实现word转pdf,HTML转pdf(探索篇)【后话】

虽然笔者,最终调试出来了。使用这种方法转pdf。

但是使用中,会遇到各种各样的奇葩坑!因此笔者在这里不推荐使用这种方法。

原因就是,html的规则也在变化之中,写法也在变化之中。html转pdf会在后续报各种各样的标签错误。

笔者之所以粘出,这些代码。完全是因为,笔者对自己的尝试,有个明确的结果。亦或是,再优化这些代码,找到合适的解决办法。

继续阅读