天天看點

《善用佳軟:高效能人士的軟體應用之道》一2.5 PDF:跨平台文檔解決方案

本節書摘來異步社群《善用佳軟:高效能人士的軟體應用之道》一書中的第2章,第2.5節,作者: 張玉新 , 陳勇 , 吳放 責編: 王峰松,更多章節内容可以通路雲栖社群“異步社群”公衆号檢視。

善用佳軟:高效能人士的軟體應用之道

本節旨在介紹最實用的、以免費軟體為主的pdf相關工具,同時消除對pdf的常見誤解,較為系統地介紹pdf應用操作,包括pdf虛拟列印機、格式轉換、閱讀及注釋、屬性及頁面編輯、圖文編輯等。

1.關于pdf及本節内容的一些基本說明

(1)關于pdf。

什麼是pdf?pdf是由adobe公司發明的檔案格式,是portable document format的縮寫,意為“便攜文檔格式”。它已成為事實上的電子文檔标準,越來越多的電子出版物、軟體說明書、填報表格都采用pdf格式。

為什麼要用pdf格式?

為了通用:把一篇文章轉成pdf後,讀者無論是用unix還是用windows,無論是否安裝有中文字型,都可以正常閱讀。

為了美觀:你精心排版的檔案轉成pdf後,對方在螢幕上看到的與你完全一樣,不會有斷行不一緻或字型不一緻的困擾。

為了安全:在pdf檔案中,你可以設定權限密碼,不允許無權限者修改、複制、列印等。

很多時候,生成pdf還會減小檔案的大小。

(2)本節内容及說明。

本節主要介紹pdf閱讀、編輯、轉換軟體及相關工具,以免費軟體為主。

下文不涉及破解pdf保護的軟體,未介紹pdf與其他格式之間轉換的軟體,不涉及非windows環境、latex等軟體。

(3)一些基本而重要的認識。

絕大多數使用者隻需要閱讀pdf,而不需要生成或編輯pdf,是以對大多數人來說,隻要一個pdf閱讀軟體就足夠了。

如果要“制作”pdf,正确的思路是從其他檔案(比如office、htm、rtf)“轉化”而來,而不是用想象中的“pdf生成軟體”建立→錄入内容→排版→儲存而來。此類軟體的正式名稱(網上搜尋時)或類别應該是pdf converter、pdf virtual printer,即轉換程式、虛拟列印機。

pdf是一種檔案格式,它有不同版本:1.2、1.5……版本越高,功能越強,比如支援動畫、多媒體、附件、表單……但這些進階功能并不常用,準确地說,是極少用。作為pdf的發明者和推進者,adobe的産品是最穩定的。但是,它也是最昂貴的、體積最大的(為了支援pdf的更多功能)。相對而言,第三方産品隻支援有限的(通常也是足夠的)功能,但體積小巧、運作迅速、價格便宜。

在第三方産品中,相當多的種類都基于adobe或ghostscript技術,另有一些基于獨立開發的技術。

要注意的是,很多國外軟體在進行中文pdf方面會有問題。很多共享軟體不注冊也能一直用,但會在pdf檔案上加水印。

綜合多種軟體,可以實作完全免費的pdf解決方案。是以,請不要使用盜版!

2.pdf閱讀軟體及線上應用

再次強調一下,pdf主要用來閱讀,而不是編輯。給你一個doc、rtf、txt,通常你既可以閱讀,也可以編輯。或者說,編輯的時間比閱讀更多。但pdf不太一樣,釋出pdf主要是供人閱讀,而不是供人編輯。

閱讀pdf是個很容易解決的問題,并且大多數軟體或線上應用都是免費的。針對不同使用者,善用佳軟給出如下建議。

(1)經典實用類pdf閱讀軟體。

對于經常閱讀pdf的使用者,推薦選擇下面的一款或幾款pdf閱讀軟體。它們都很經典,并且穩定。

adobe reader

adobe reader(原名acrobat reader)是最正宗、出道最早、“名分最正”的pdf閱讀軟體,估計它占的份額在80%以上。

推薦指數:

優點:最穩定、最相容。

缺點:體積太大(估計要50mb)。

結論:一般使用者不推薦;但需要用到高版本pdf功能,或其他軟體相容性出現問題時,可選擇該軟體。

foxit reader

優秀的國産軟體,近幾年異軍突起,無論軟體性能還是功能都非常值得贊賞(其界面如圖2-18所示)。

《善用佳軟:高效能人士的軟體應用之道》一2.5 PDF:跨平台文檔解決方案

優點:體積小,僅3mb,啟動也快,綠色無須安裝,中文支援極好。

缺點:無明顯缺點。

結論:推薦。詳見善用佳軟部落格,讀者可查找“小巧的pdf閱讀軟體:foxit pdf reader”和“foxitreader:超小超快pdf閱讀器,代替acrobat reader”兩篇文章。

pdf-xchange viewer

善用佳軟極為看好的一款新秀軟體,更新迅速,進步明顯,功能特别豐富,非常推薦。相信pdf-xchange viewer會成為adobe和foxit的強力競争對手。

除了上述經典的三款主流pdf閱讀軟體以外,在國外較有影響力的pdf閱讀軟體還有以下幾種。

expert pdf reader:曆史較長,但國内使用者很少。部分人認為比foxit好一些,筆者沒太用過。

perfect pdf reader:界面是華麗的ribbon風格。沒怎麼使用過,不予評價。

cool pdf reader:小巧,僅600kb。沒怎麼使用過,不予評價。

(2)小巧新奇型pdf閱讀軟體。

對于喜歡嘗試更小巧的軟體、更新奇的操作方式的使用者,有如下推薦。

mupdf

《善用佳軟:高效能人士的軟體應用之道》一2.5 PDF:跨平台文檔解決方案

号稱速度最快。雖不确定這點,但我至少相信它的界面最精簡——無任何菜單按鈕,全靠快捷鍵操作。有windows版、linux版,解壓後14.7mb。其界面如圖2-19所示。

apvlv

apvlv的熱鍵完全仿照vim風格,被稱為vim化的pdf閱讀工具,實在是跨平台以及vim粉絲的必備利器。如果開啟之後不會用,那就 吧。

sumatra pdf

比上述兩款稍為大衆一些的pdf閱讀軟體,免費、單檔案、小巧(不到1mb)、支援中文。

(3)線上閱讀pdf。

如果隻是偶爾使用,則無須安裝軟體,可利用線上應用輕松搞定pdf閱讀需求。

3.pdf制作軟體及線上應用

pdf是如何做出來的呢?并不是有一個特别軟體,建立一個檔案後,在裡面輸入内容并儲存,就成了pdf,而是通常用别的軟體編輯文檔後,輸出為pdf;或者就是将一個現成的文檔“列印”成pdf。也就是說,能生成pdf的軟體有兩類,一類是其他檔案的編輯器,且具備輸出pdf功能,再一類是虛拟列印機(virtual printer),可以把任何能列印的文檔“列印”成pdf。前者處理的範圍有限,但生成的pdf會帶有連結、目錄、書簽、作者等相關資訊;後者處理範圍廣,但附加資訊會少一些。至于到底少哪些,視具體軟體而異。

(1)可輸出pdf的軟體。

有些office類軟體支援pdf。

善用佳軟大力推薦的開源軟體openoffice.org不僅能較好地相容ms office格式,還比昂貴的ms office多了一項輸出pdf功能(從2007版開始,微軟也在自己的office套件裡面加入了pdf輸出功能)。它能把正在編輯的文書、表格、示範輸出為pdf,并且可以保留目錄、連結、書簽。

此外,供個人免費使用的國産軟體“wps個人版”也能輸出pdf,并且wps office對ms office的相容性比ooo更好。

有些文本編輯器支援pdf。

pdf的主要意義,除了安全之外就是版式。是以,著名的科技排版軟體tex理所當然可以導出pdf。你可以選用latex(或進一步借助vim、emacs等更專業的編輯器)來編輯tex檔案,并編譯為pdf等格式。

(2)pdf虛拟列印機(virtual printer)。

pdf虛拟列印機類軟體極多,按“出身”可分如下兩類。

第一類,來自pdf發明者adobe的産品:體積最大,性能最穩定,相容性最好,但絕不免費。

第二類,即“第三方”産品(傳說中的“山寨”?),又有很多種。國内使用者要注意的是,它們(尤其是體積特别小的)能否支援中文。

特别簡單的英文轉pdf工具,體積特小,但對國内使用者意義不大(往往不支援中文)。

基于ghost script(即gs)的産品,要先安裝這個gs軟體(約10mb),然後再安裝它們的虛拟列印機(3~10mb),通常支援中文。

自主開發(不基于gs)的通常不免費,但性能好,體積小,有的支援中文,有的不能。

當然,還有一種“手工”生成pdf的辦法,實用性不強,但深具體驗之美,具體請參看後文“pdf-t-maker:需要動手的進階免費方案”。

下面介紹幾款pdf虛拟列印機。

acrobat:最經典也最昂貴

推薦指數:對個人使用者0%;對企業使用者100%。

acrobat是生成pdf最穩定、相容性最好的方案。當然,它也是體積最大、價格最高的方案。

提醒入門使用者,adobe出品的閱讀器以前叫acrobat reader,是用來看pdf的,而這個acrobat是生成pdf的。切勿混淆!或許adobe公司也意識到了這個問題,現在把閱讀器改名為adobe reader了。

pdffactory:品質一流但不免費

推薦指數:個人使用者0%(太貴);企業使用者80%。

極好的産品!其首頁稱:pdffactory産品提供了比其他程式更簡單、更有效率和更少花費的建立pdf檔案的解決方案。pdffactory标準版本(人民币約500元)用來建立普通pdf檔案,pdffactory pro(人民币約1000元)用于需要安全的pdf(法律文檔、公司資訊等)和其他進階功能的使用者。

善用佳軟認為這是一款高品質的産品,其公司fineprint也是一家非常成功的共享軟體商。有理由猜測pdffactory是國内個人及小企業使用者中占有率最高的pdf生成軟體。它勝過adobe acrobat的主要原因就是小巧(體積僅2mb量級)、易下載下傳,對中文支援好,且國内市場也做得很好。它是共享軟體,但從技術上看,也可以長期使用,隻是生成的文檔帶有廣告水印。從這一點看,雖然它聲稱是共享軟體,但也可看做是免費的廣告軟體。pdffactory的專業版還提供了加密、把多個文檔列印到一個pdf等功能。

pdfcreator:開源世界第一推薦!

推薦指數:開源軟體迷100%;一般使用者60%。

來自sourceforge的開源産品pdfcreator毫無疑問是開源、免費世界中影響力最大的pdf生成方案,盡管在中國可能不是這樣——或許是沒有中文首頁、安裝gs比較複雜?還是有更好的商業軟體(非正版)可用?

它對中文支援完全沒有問題(我平生隻有一次在用ms office時有漏字),擁有多界面語言(含簡體中文),支援加密,支援多種選項設定,并且有間接辦法把多個文檔列印成一個pdf。應該說,功能非常全面。除建立pdf文檔外,還可生成postscript、encapsulated postscript以及png、bmp、jpeg、pcx、tiff等圖形格式檔案。

注意:

pdfcreator将檔案列印成pdf時不支援書簽和連結;另外在儲存時,頭資訊中不要含有中文。

cutepdf writer:最适合個人使用者

軟體首頁:www.cutepdf.com。

推薦指數:大衆使用者的首選。

cutepdf家族包括多種軟體,其中此款免費,可以滿足基本的列印生成pdf的需求。它也是基于gs的,是以,請先從cutepdf網站下載下傳并安裝gpl ghostscript轉換程式,然後再裝cutepdf writer。

它隻有列印生成pdf的基本功能。如果需要頁面多合一、删頁或加頁、旋轉、調控頁面大小、更改檔案資訊、加密等功能,可以使用下文介紹的相關工具。當然也可以下載下傳cutepdf writer companion,它與writer無縫內建,可實作更多功能。

cutepdf writer companion内有廣告插件,但可選擇安裝與否。

primopdf與nitropdf

primopdf與nitropdf均出自非常專業的nitro公司,前者是免費的pdf虛拟列印機,後者是專業的pdf套裝工具(nitro pdf professional 5售價$99)。primopdf與前幾款免費的pdf軟體相比差不多,使用者相對較少;而nitropdf速度快,但對個人而言價格稍高。

nitro公司真正值得推薦的業務是線上生成pdf和網頁轉換pdf的軟體。

線上生成pdf:你上傳檔案或指定的網頁到網址https://online.primopdf.com,它為你生成pdf後會發送到你信箱。這個軟體(方法)的優點是免費、無須注冊、支援中文。

pdf download:來自nitropdf的另一款網頁轉pdf工具,可以通過線上、小書簽、浏覽器插件等三種形式實作轉換pdf,支援中文,支援連結。

tinypdf:超級小巧、支援中文

軟體首頁:www.tinypdf.com。

tinypdf是一款非常小巧(國内網友精簡後的版本隻有200kb)、無廣告、支援嵌入字型、支援中文、無須ghostscript的虛拟pdf列印機,對商業應用也免費。

dopdf:無須gs,小巧、快速、穩定、更新活躍、支援中文

軟體首頁:www.dopdf.com。

優點:安裝包小巧,僅4.3mb;支援簡體中文在内的多國語言(包括安裝過程和使用界面);不需要ghostscript或.net;支援32位/64位系統;占用資源少。

缺點:功能選項較少(dopdf的商業版本是novapdf pro, 50美元,功能更豐富)。

bullzip pdf printer:免費、強大、更新活躍

軟體首頁:www.bullzip.com。

免費軟體,基于ghostscript,支援多語言(含簡體中文),約 4mb,支援文檔加密、設定屬性、頁面旋轉、水印、插入或追加文檔。除pdf外,還可輸出png、tiff、jpeg、bmp、pcx等格式。

pdfmachine

軟體首頁:www.pdfmachine.com。

推薦指數:80%。

pdfmachine v10、v11的基本功能免費,進階功能有水印;現在v13全部有水印(共享軟體),但同時提供了pdfmachine live——免費線上轉換文檔為pdf的服務。

筆者認為pdfmachine是一個在國内被埋沒的優秀産品!國内大網站雖有提供,但介紹的文章幾乎沒有。筆者是通過google英文搜尋而發現此軟體的。pdfmachine對中文支援極好(官方首頁直接提到了對亞洲字元的支援),我用pdfcreator列印一些檔案有漏字,但此軟體完全正常。它還可以在ms office中加成add-in,點選即可生成pdf。

其大小也隻有8mb左右(2011年4月最新版本)。

go2pdf:體積最小、免費、有水印

軟體首頁:www.go2pdf.com。

優點:體積最小(下載下傳包1.38mb)是go2pdf最大的優點,估計很多人都會率先試用它。go2pdf可以将任何東西轉化成pdf格式文檔,支援建立者添加資訊、支援加密和密碼通路,支援通路控制以及字型嵌套和矢量字型縮放,并且支援中文。

缺點:有水印。go2pdf生成的pdf檔案在頁腳處有一行藍色文字廣告“create pdf with go2pdf for free, if you with to remove this line, click here to buy virtual pdf printer”。

适用場景:臨時需要下載下傳pdf生成軟體,來制作要求不高的pdf文檔。

小結:

此類軟體中,筆者自己主用并推薦cutepdf、pdfcreator。讀者也可選擇tinypdf、bullzip pdf printer、dopdf等。

(3)pdf-t-maker:需要動手的進階免費方案。

筆者最初是從水木清華的illh網友處學到此方法的。它可以為word檔案生成帶連結和目錄的pdf。它的思路是,word檔案通過宏+ps列印機,生成ps檔案;然後用distiller生成pdf。個人覺得這個方法不太适合初學者使用(說明:最新版的ms office已經支援另存為pdf檔案)。

pdf-t-maker就是vba的宏,下載下傳最新版并安裝後,可在word菜單或工具欄中調用它。

ps列印機可以選adobe公司的免費的ps driver:adobe universal postscript windows driver installer 1.0.6-chinese simplified(7.5mb),或其他ps列印機。

distiller可以選gsgs8.53libps2pdf14.bat,如果運作時提示找不到gswin32c.exe,則可将其從bin目錄複制過來,或加入到路徑(注意,完整安裝的gs才會有gswin32c. exe,如果是pdfcreator自帶的gs,則很可能沒有這個檔案)。

然後,在word中按下按鈕,就可以直接生成帶目錄的pdf了。

4.圖像轉pdf

(1)正常方案:适用于無特殊需求的普通使用者。

筆者對軟體選擇有一條基本原則,就是對于偶爾的初級需求,應優先選擇已有軟體或多功能通用軟體,而不要選單一功能的專業工具。

方案 1:本文推薦的多款通用pdf虛拟列印機,都可以把多個圖檔合并列印為pdf。

方案2:優秀的多功能看圖軟體irfanview,也可以生成pdf。

(2)專業方案:freepic2pdf(官網:www.comicer.com)。

對于在圖像轉 pdf 方面有近乎geek需求的使用者,筆者推薦國内高手老馬的freepic2pdf。

“你用過之後就會知道他的速度之快了,而且已經在盡量縮小大小的狀況下優化圖檔品質了”,網友wodingdong這樣評價freepic2pdf。

老馬作為圖像方面的專家,見識過很多此類軟體,并把目前的圖檔轉pdf軟體分為兩類:基于虛拟列印原理的和直接将圖像嵌入pdf檔案的。但這兩類軟體都存在對圖像重新采樣、壓縮,進而造成圖像品質下降、pdf檔案膨脹等問題。并且,它們對格式繁雜的tiff支援不佳,于是,老馬“最終還是下定決心,以libtiff組織提供的tiff2pdf.c為基礎寫了一個圖像轉pdf引擎”,實作他自己的要求。

該軟體主要特點如下。

對tiff檔案高度支援,尤其是國内各掃描外包公司提供的非标準ojpeg壓縮的tiff檔案。

對有損壓縮資料不再重新壓縮,以免品質損失;對無損壓縮資料則壓縮成g4或zip資料以減小檔案長度。

将基于虛拟列印原理的軟體的優點借鑒過來,包括指定紙張類型、指定頁邊距、圖像自動放大等,以擷取較好的閱讀效果。

支援jbig2壓縮。收費軟體支援jbig2壓縮的有好幾個,但免費軟體中大概這是第一個。

讀完上一段後,請讀者再次“自查”。如果freepic2pdf的描述讓你不知所雲,請退回正常方案。如果引發了你的興奮或好奇,請參閱freepic2pdf的軟體說明,甚至更深入地探讨圖像轉pdf的問題、方法以及更多題外話。

5.pdf輔助工具

本節包括pdf的加密、合并、分割、檔案資訊的修改等。

(1)becypdfmetaedit:免費小巧的pdf檔案資訊修改工具。

《善用佳軟:高效能人士的軟體應用之道》一2.5 PDF:跨平台文檔解決方案

這款僅310kb的免費、免安裝小工具,可以用于修改頭資訊、加書簽、加密碼。是以,此工具加上述基本pdf列印機,完全等同于進階pdf列印機,值得關注!

(2)mbtpdfasm/becypdfasm:免費小巧的pdf處理工具。

mbtpdfasm是一個指令行程式,不到1mb,免費。它以合并pdf為主,兼具多種功能,如提取pdf檔案資訊、提取中間的某些頁、多檔案合并、對新檔案加密和加書簽。書簽若為中文,則亂碼,當然書簽亂碼并不影響正文。

becypdfasm是該軟體的圖形化界面,需要配合mbtpdfasm才能使用,操作更友善。事實上,指令行不是沒有好處,比如我們可以一次加入多個書簽。下面舉一個例子。

mbtpdfasm -mold.pdf -dnew.pdf -oa.txt

此指令行表示把old.pdf轉化為new.pdf,同時根據a.txt制作書簽。

a.txt内容形式應如下:

1 0 1 1 序

2 1 1 2 序第二頁

3 0 1 10 最後一頁

其格式為:數字1 數字2 數字3 數字4 字元串。

數字1可了解為行号1、2、3……

數字2表示本行的上級目錄的序号(上例中第2行的上級為第1行),0表示最進階目錄,無上級。

數字3表示順序号。如果第一行書簽有多個子項,此處決定其先後順序。

數字4表示頁碼。

字元串就是書簽的内容。

(3)pdftk:免費強大的指令行pdf工具。

pdftk是一個極其強大的工具!它可以拆分、合并、加密、解密、填表、水印、附件、編輯檔案頭資訊。也就是說,如果隻能保留一個pdf工具,它就是不二之選。它隻由一個exe組成,大小約5.6mb。

6.其他pdf工具

tweak pdf:1.3mb的軟體,用來改變pdf的壓縮率、基本資訊、頁面顯示效果等,完整版需要收費。

pdf bundle:1.3mb的軟體,用來為pdf加入附件(如ppt、zip、odt),完整版需要收費。

盡管使用pdf壓縮的機會不多,但考慮到這方面的相關文章和軟體介紹極少,是以,這裡要總結一下pdf壓縮技巧及相關的pdf壓縮軟體,作為pdf系列的補充。

1.pdf内部的壓縮技術

pdf檔案内部已經使用了如下壓縮技術。

lzw(lempel-ziv-welch)與flate(zip,pdf v1.2):用于圖像、文本的無損壓縮。

jpeg及jpeg2000 (pdf v1.5):用于圖像的有損和無損壓縮。

ccitt(group 3 or 4)與jbig2 (pdf v1.4):用于黑白圖像無損壓縮。

是以,試圖讓pdf檔案通過壓縮軟體(7-zip/winzip/winrar)來減小存儲大小的做法,通常不會取得明顯效果,但必要情況下也不妨嘗試。比如ni網友留言說, 7-zip的lzma算法對某些檔案還是有很強壓縮效果的,他曾試過把50mb的pdf用7z壓縮軟體給壓縮到16mb。

2.pdf檔案體積的相關因素及壓縮技巧

任何優化(或壓縮)都可以分為兩種:有損和無損。壓縮所涉及的資訊,既包括能直接看到的文字、圖像,也包括不能被直接看到的字型、檔案元資訊等。舉個非pdf的例子,從bmp到png的格式轉換是無損的,到jpg就是有損的。對jpg優化(有損)而言,一種是降低圖像品質,一種是減少頭資訊。有些比較智能的軟體,在降低圖像品質時,能對不同區域采取不同的圖像壓縮比,即:次要區域多壓縮多損失,重要區域少壓縮保持高品質。

pdf如果體積較大,通常是緣于圖像和嵌入的字型。

生成pdf時就要考慮成品大小,建議采用較少種類的、常見的字型,這樣就可以減少字型嵌入的成本,同時不影響顯示品質。另外,減少圖檔的數量、尺寸、色深,采用最适合的圖像格式。

從檔案體積看,可以這樣表示:pdf檔案大小 = 文 + 字型 + 格式 + 圖 + 附件。是以,壓縮pdf也要從這些方面入手。

(1)pdf的字型優化原則。

優先使用标準字型。pdf預設的标準字型有五種(times、helvetica、courier、symbol、zapfdingbats),規範的pdf閱讀器必須支援這些字型。其他字型就有可能需要全部或部分嵌入(font embedding)。

減少所用字型種類。若要體積小,就不要宋體、楷體、黑體一齊來了。另外,濫用字型可能也會遠離美觀而偏向花哨甚至惡俗。

少使用字型風格。對pdf而言,正常、粗體、斜體、粗斜體是四種不同的字型,需要分别嵌入,是以應盡量少用幾種。另外,對于要強調的文字,可以換用字号、顔色、下劃線、字元間距、縮進等手段實作,它們不會占用多餘體積。

慎用輕型字型(比如某些華麗的藝術字型,比正常的黑體、宋體體積更大)。

(2)通常有效的pdf優化措施。

用pdf列印軟體,把pdf檔案再虛拟列印為新的pdf(推薦一試,因為有大量免費軟體)。

在pdf編輯軟體中“另存為”。這裡要解釋一下:pdf是一種“增量儲存(incremental updates)”格式。當你改變一些資訊後,它會将這種變化“儲存”在原檔案的最後,這種做法速度快,但檔案體積大。而“另存”則是重寫檔案内容,速度稍慢,但備援資訊會被整理掉,使檔案體積減小。

利用進階pdf編輯軟體中的優化按鈕。如nitro pdf button→prepare→optimize document;acrobat 8→advanced→pdf optimizer。

網友oversky補充:pdf creator、cutepdf、primopdf、pdf redirect、bullzip這些工具都是用ghostscript來生成pdf的。檔案大小、品質好壞都與設定有關,例如圖案的jpeg壓縮比、解析度較高的圖案是否有向下采樣(downsampling),還有字型是否嵌入pdf。真要想制作比較小的檔案,要找可以把圖用jpeg2000壓縮的,目前個人隻看到pdf-xchange 4 pro和adobe acrobat有這種技術。

3.壓縮軟體pdf shrink試用手記

pdf shrink 是原mac平台的pdf壓縮軟體,後來開始提供windows和iphone版本。2009年10月,善用佳軟得到了pdf shrink的windows内測版本,試用如下。

(1)下載下傳安裝。

《善用佳軟:高效能人士的軟體應用之道》一2.5 PDF:跨平台文檔解決方案

(2)pdf shrink壓縮原理。

pdf shrink users guide.pdf(其使用者手冊)中提到:“pdf shrink reduces the size of pdf files by optimizing the resolution and compression method of each image in the pdf file. the interface allows for setting different compression and resolution choices for color, grayscale and monochrome images.”

照此來說,pdf shrink的優化措施隻是在圖檔方面,即優化(應該就是降低)分辨率、改進壓縮算法,而不涉及影響pdf大小的其他方面(比如字型嵌入)。

(3)純文字pdf壓縮測試。

原始檔案:雪山飛狐.txt,ansi編碼,264kb。

測試過程:用notepad.exe列印到如下三款pdf列印機(采用預設設定),然後,用pdf shrink的web方案進行壓縮。

測試結果見表2-2。

《善用佳軟:高效能人士的軟體應用之道》一2.5 PDF:跨平台文檔解決方案

pdfcreator-優化:手工設定不嵌入字型。

結論:pdf shrink對文字内容幾乎無法壓縮,不嵌入字型是減少文本類型pdf大小的有效手段。

(4)純圖像pdf壓縮測試。

原始檔案:photo.doc。制作過程:直接在ms word 2003中ctrl+n建立文檔,在tc中拖放三個圖檔檔案(數位相機照片,jpg,3888 x 2592像素,每張約3mb,共9.7mb)到該doc文檔,儲存,得doc檔案10.3mb。分别列印到如下三款pdf列印機(采用預設設定),然後,用pdf shrink的web方案進行壓縮。

測試結果見表2-3。

《善用佳軟:高效能人士的軟體應用之道》一2.5 PDF:跨平台文檔解決方案

pdfcreator-優化:手工設定pdf分辨率,從預設600降到72;彩色圖像壓縮從預設自動改為jpeg最大壓縮,并設分辨率為72。

結論:總體來看,大尺寸圖像的壓縮,從doc到pdf,再到壓縮後的pdf,都有明顯效果。在本例中,檔案從10mb壓為1~2mb,最終壓為50kb左右。

cutepdf writer和pdfcreator生成的原始檔案相差較多,但壓縮後大小相同。這是因為本質上它們都是用ghostscript來生成結果的。

基于ghostscript的pdf生成,可以通過參數設定降低檔案大小。比如pdfcreator更改設定後直接生成的pdf為49kb,但比起pdf shrink壓縮出的更小(39kb)的pdf,圖像品質反而較差。

(5)實際網頁測試。

測試結果見表2-4。

《善用佳軟:高效能人士的軟體應用之道》一2.5 PDF:跨平台文檔解決方案

結論:pdf壓縮效果取決于圖像/文字的比例。

對于本身較小的pdf檔案,最終大小首先取決于生成時的設定,其次才是壓縮。比如,本例中,用tinypdf生成的原始檔案,比壓縮後的cutepdf、pdfcreator檔案更小。

筆者推薦gmail、pdftoword.com、e-pdf to word converter等pdf轉換word格式的方法。

pdf無法編輯,這不是缺點,而是它的定位。雖然無法編輯,但可以進行注釋。

為什麼要将pdf轉換到其他格式?從技術角度說,是為了二次編輯和後續利用。但如果這樣做,請注意版權問題。

不過,一定要轉到word格式嗎?不一定。如果文檔隻有文字,則建議轉為txt或rtf。如果還有一些不算複雜的圖表、圖檔,轉為html也是可以接受的。但如果格式複雜,或者你對html不了解,也不妨轉為word格式。

本文以及善用佳軟全站的關注點是“原則、思考方法、解決方案”,而不是“軟體”。做個假設,如果念條咒語,或揮幾下手就能把pdf轉為word,為什麼一定要軟體呢?

1.推薦的pdf轉換word方案

(1)莫忘最基本的“複制/粘貼”法。

尋找“進階”辦法之前,不妨先試一下最基本的方法:打開pdf文檔,複制全文,然後在word中粘貼。如果文檔格式不複雜,這樣得到的結果就夠用了。

(2)在gmail、qq郵箱中直接檢視pdf格式。

gmail很早就解決了pdf檢視問題。先把pdf作為附件發送至gmail信箱,在附件一側,點選“view”或“檢視”連結,進入線上pdf閱讀器後,點選“純html”連結,即可以網頁格式顯示pdf内容。如果你一定需要doc格式,請複制html内容到word。

而qq郵箱中,pdf附件旁邊也有類似的“純文字方式檢視”連結,隻是相比gmail,缺少文字格式。

另外,這種轉換還能破解pdf防止複制内容的限制。

優點:速度快、可信、很多人已經有gmail信箱(沒有?那就注冊一個吧);各種語言編碼的文字都應該可以轉換。

缺點:pdf中的圖檔好像有問題。

(3)号稱最精準的pdftoword.com線上轉換。

pdftoword.com号稱是目前最為精準的pdf to word檔案轉換器,出自著名的pdf解決方案供應商nitropdf。

pdftoword.com是線上應用,完全免費,使用友善。操作步驟如下。

通路pdftoword.com:①上傳pdf→②標明格式(doc/rtf)→③輸入接收郵箱。如圖2-22所示。

《善用佳軟:高效能人士的軟體應用之道》一2.5 PDF:跨平台文檔解決方案

進入郵箱:查收轉換後的word文檔。

web 2.0 share對該應用的評價是:“……pdftoword無愧于精準之王,對中文轉換同樣很好,文字方面不多說了,大家可以自己測試。pdftoword在排版方面确實有獨到之處,特别介紹一個細節,pdftoword轉換後的文檔仍以段落為機關,沒有很多的換行符,而以前大多轉換器都是以行為機關,以緻末尾有很多的換行符,你複制粘貼時會有許多麻煩……”

2.其他軟體或線上應用

“電腦玩物”曾做過一個測試,對比了四個線上應用。但由于測試的特殊要求“11mb,立即轉換”,隻有一個應用達成了目标。是以,并未對轉換品質進行對比。

3.共享軟體e-pdf to word converter

共享軟體e-pdf to word converter(usd35)在把pdf轉換到word的軟體中,也屬于效果較好的一款。其界面如圖2-23所示。

《善用佳軟:高效能人士的軟體應用之道》一2.5 PDF:跨平台文檔解決方案

“小衆軟體”評價:“……e-pdf可以把pdf檔案比較完美地轉換成word文檔,用104頁的pdf做了測試,除了少數地方,其餘都屬于完美轉換了……”

再援引另一段網上介紹:e-pdf to word converter是一款将pdf文檔轉換成word文檔的工具軟體,它支援文字、圖像及其他内容的輸出。這款軟體可以脫離microsoft word、adobe acrobat或acrobat reader而獨立運作。完美的中文支援和原始版面轉換,基本做到了百分之百的原汁原味……目前唯一發現的不足是數字會被轉換成全角數字,不知道可否在word中批量把數字換回半角,另外有些文字大小會小一号。試用了超多的pdf轉word工具了,應該說這個是所見過的版面保留最好的了,雖然還是有點缺憾。

4.結論

偶爾有pdf2doc需求的網友,建議先試用線上的gmail、pdftoword。如果品質不能滿足需求,或對轉換的數量、速度有更多要求,可以試用/注冊e-pdf to word converter等軟體。

但無論哪種方法,在行動之前都應認真想一下:真有必要從pdf轉為word嗎?