天天看點

PaddleOCR 簡述

1. PaddleOCR 簡述

OCR (Optical Character Recognition,光學字元識别)是指電子裝置(例如掃描器或數位相機)檢查紙上列印的字元,通過檢測暗、亮的模式确定其形狀,然後用字元識别方法将形狀翻譯成計算機文字的過程。

PaddleOCR旨在打造一套豐富、領先、且實用的OCR工具庫,助力開發者訓練出更好的模型,并應用落地。

PaddleOCR 的主要特性包括:

(1)超輕量模型

(2)通用識别大模型

(3)算法豐富且開源

(4)支援自定義訓練

(5)支援C++預測、端側部署、服務部署

2. PaddleOCR 應用場景

2.1 通用場景

類别 亮點
高精度中文識别模型SVTR 比PP-OCRv3識别模型精度高3%,<br />可用于資料挖掘或對預測效率要求不高的場景。
手寫體識别 新增字形支援

2.2 制造業

類别 亮點
數位管識别 數位管資料合成、漏識别調優
液晶屏讀數識别 檢測模型蒸餾、Serving部署
包裝生産日期 點陣字元合成、過曝過暗文字識别
PCB文字識别 小尺寸文本檢測與識别
電表識别 大分辨率圖像檢測調優
液晶屏缺陷檢測 非文字字元識别

2.3 金融

類别 亮點
表單VQA 多模态通用表單結構化提取
增值稅發票 關鍵資訊抽取,SER、RE任務訓練
印章檢測與識别 端到端彎曲文本識别
通用卡證識别 通用結構化提取
身份證識别 結構化提取、圖像陰影
合同比對 密集文本檢測、NLP串聯

2.4 交通

類别 亮點
車牌識别 多角度圖像、輕量模型、端側部署
駕駛證/行駛證識别 敬請期待
快遞單識别 敬請期待