天天看點

使用騰訊OCR識别提取圖檔中的文字

使用騰訊的OCR,官方文檔上給出兩種方式,一種是自己寫請求,一種是使用騰訊內建的SDk,本次使用的是SDK,下載下傳位址為:https://cloud.tencent.com/document/product/866/17600,根據需要選擇對應的SDK下載下傳,本次以OCR-通用印刷體識别

使用騰訊OCR識别提取圖檔中的文字

下面需要将這個SDK調通。首先找到demo主類,将下面的四個參數換成自己的參數:,其中前三個參數自己很容易了解并找到

使用騰訊OCR識别提取圖檔中的文字

但是bucketName很多人不知道是什麼(bucketName參數如果不使用SDK方式則不需要),其實bucketName是騰訊雲的對象存儲的存儲桶的名稱,下圖中标記的參數就是你的bucketName值

使用騰訊OCR識别提取圖檔中的文字

因為此次調用的是OCR-通用印刷體識别,是以,找到demo類下對應的私有方法:

使用騰訊OCR識别提取圖檔中的文字

我們可以看見圖檔上傳有兩種方式,一種是url一種是圖檔内容,url的圖檔位址必須是公網可以通路的圖檔位址,本地圖檔是不可以的,如果你的環境不能被外網通路,那麼這種方法是行不通的,第二種圖檔内容方式是以base64方式上傳,可以指定本地圖檔,一般都是可以成功的。

所有需要改的參數到此結束,然後運作這個demo類,就可以看到識别圖檔後的結果了