天天看點

Android實作圖檔OCR功能Android實作圖檔OCR功能

Android實作圖檔OCR功能

OCR的幾種實作方案

  1. 開源的tesseract和tess-two方案
  2. 百度OCR服務
  3. 騰訊OCR服務
  4. 微軟OCR服務

神馬筆記選擇的是百度OCR服務。

使用百度OCR方案,實作比較簡單,但也碰到了幾個坑。

  1. 包名,雖然建立應用時,可以選擇不需要報名,但會傳回283604錯誤碼;
  2. sdk沒有提供x86_64的so檔案,建立的x86_64模拟器一直提示jni錯誤;

解決方案也比較簡單。

  1. 建立應用時,填寫包名,編輯應用似乎沒有作用,依然傳回283604錯誤碼;
  2. 建立合适的模拟器或者使用真機調試,我選擇的是真機調試。

百度OCR提供了一定的免費額度。

API 狀态 調用量限制 QPS限制
通用文字識别 免費使用 50000次/天免費 不保證并發
通用文字識别(含位置資訊版) 免費使用 500次/天免費 不保證并發
通用文字識别(高精度版) 免費使用 500次/天免費 不保證并發
通用文字識别(高精度含位置版) 免費使用 50次/天免費 不保證并發

神馬筆記4.0.0版本使用的是每天免費50000次的通用文字識别服務,識别精度基本滿意。