1. PaddleOCR 簡述
OCR (Optical Character Recognition,光學字元識别)是指電子裝置(例如掃描器或數位相機)檢查紙上列印的字元,通過檢測暗、亮的模式确定其形狀,然後用字元識别方法将形狀翻譯成計算機文字的過程。
PaddleOCR旨在打造一套豐富、領先、且實用的OCR工具庫,助力開發者訓練出更好的模型,并應用落地。
PaddleOCR 的主要特性包括:
(1)超輕量模型
(2)通用識别大模型
(3)算法豐富且開源
(4)支援自定義訓練
(5)支援C++預測、端側部署、服務部署
2. PaddleOCR 應用場景
2.1 通用場景
類别 | 亮點 |
---|---|
高精度中文識别模型SVTR | 比PP-OCRv3識别模型精度高3%,<br />可用于資料挖掘或對預測效率要求不高的場景。 |
手寫體識别 | 新增字形支援 |
2.2 制造業
類别 | 亮點 |
---|---|
數位管識别 | 數位管資料合成、漏識别調優 |
液晶屏讀數識别 | 檢測模型蒸餾、Serving部署 |
包裝生産日期 | 點陣字元合成、過曝過暗文字識别 |
PCB文字識别 | 小尺寸文本檢測與識别 |
電表識别 | 大分辨率圖像檢測調優 |
液晶屏缺陷檢測 | 非文字字元識别 |
2.3 金融
類别 | 亮點 |
---|---|
表單VQA | 多模态通用表單結構化提取 |
增值稅發票 | 關鍵資訊抽取,SER、RE任務訓練 |
印章檢測與識别 | 端到端彎曲文本識别 |
通用卡證識别 | 通用結構化提取 |
身份證識别 | 結構化提取、圖像陰影 |
合同比對 | 密集文本檢測、NLP串聯 |
2.4 交通
類别 | 亮點 |
---|---|
車牌識别 | 多角度圖像、輕量模型、端側部署 |
駕駛證/行駛證識别 | 敬請期待 |
快遞單識别 | 敬請期待 |