实现word转pdf，HTML转pdf（探索篇）【后话】

2018-09-15 13:50:15

笔者找依赖的jar包，找的好辛苦。

ITextRenderer、

ITextFontResolver这两个类依赖的jar包到底是哪个，还有怎么下载？苦苦纠结了3个小时。

终于找到你了！

记录个网址：

http://www.java2s.com/Code/Jar/c/Downloadcorerendererr8pre2jar.htm

上测试代码：

调用+走你！

这里笔者结合上一篇poi将word转html，结合使用。

/**doc

转html

String tagPath = "D:\red_ant_file\20180915\image\";

String sourcePath = "D:\red_ant_file\20180915\RedAnt的实验作业.doc";

String outPath = "D:\red_ant_file\20180915\123.html";

try {

AllServiceIsHere.docToHtml(tagPath, sourcePath, outPath);

} catch (Exception e) {

// TODO Auto-generated catch block

e.printStackTrace();

}

【注意】

（值得注意的地方是IText 根据html生成pdf文件的时候，会验证html文件是否标准，例如通过poi转换的出来的html文件的一些标签会缺少标签闭合 ” / “ :

否则，你会遇到

Can't load the XML resource (using TRaX transformer). org.xml.sax.SAXParseException; lineNumber: 23; columnNumber: 3; 元素类型 "meta" 必须由匹配的结束标记 "</meta>" 终止。

笔者尝试，使用第三方 jar 包Jsoup，直接调用 parse方法，笔者认为html就标准啦！

这个坑，让笔者苦恼了，1个小时。

为此，笔者不得不重写，word转html代码：

再次记录个网址：下载第三方 jar 包Jsoup使用

https://jsoup.org/download

上重写word转html代码：

准备个文件，测试一下。

word转html，规范化代码后的转换结果。

接下来，html转pdf

虽然笔者，最终调试出来了。使用这种方法转pdf。

但是使用中，会遇到各种各样的奇葩坑！因此笔者在这里不推荐使用这种方法。

原因就是，html的规则也在变化之中，写法也在变化之中。html转pdf会在后续报各种各样的标签错误。

笔者之所以粘出，这些代码。完全是因为，笔者对自己的尝试，有个明确的结果。亦或是，再优化这些代码，找到合适的解决办法。

实现word转pdf，HTML转pdf（探索篇）【后话】

继续阅读

简单粗暴，java pdf转word,word转图片，无水印，无大小限制

Word转PDF方法（jacob插件）

java实现word转html

【Qt】利用QAxObject实现word转pdf

Java 将xml模板动态填充数据转换为word文档

根据html改为ftl模板生成pdf文件，支持中文及换行

itextpdf将html转成pdf，包含中文字体以及中文换行

itext word怎么转成pdf

word转pdf工具有哪些？分享几种好用转换方法

利用wkhtmltopdf插件做html转换PDF并实行在线打印或下载

aspose html转pdf_使用Python转换PDF，Word/Excel/PPT/md/HTML都能转！

使用abcpdf将html转换成pdf文件

wkhtmltopdf和itext两种工具详细对比

分享一个个人觉得特别好用的html链接转PDF的工具

专业的PDF分割,PDF合并软件-LinkPdf转换器

word转html