天天看點

C# Parsing 類實作的 PDF 檔案分析器

項目讓你可以去讀取并解析一個pdf檔案,并将其内部結構展示出來. pdf檔案的格式标準文檔可以從adobe那兒擷取到. 這個項目基于“pdf指南,第六版,adobe便攜文檔格式1.7 2006年11月”. 它是一個恐怕有1310頁的大部頭. 本文提供了對這份文檔的簡潔概述. 與此相關的項目定義了用來讀取和解析pdf檔案的c#類. 為了測試這些類,附帶的測試程式pdffileanalyzer讓你可以去讀取一個pdf檔案,分析它并展示和儲存結果. 程式将pdf檔案分割成單獨每頁的描述,字型,圖檔和其它對象. 有兩種類型的pdf檔案不受此程式的支援: 加密檔案和多代檔案.