使用騰訊OCR識别提取圖檔中的文字

2023-06-25 10:58:53

使用騰訊的OCR，官方文檔上給出兩種方式，一種是自己寫請求，一種是使用騰訊內建的SDk，本次使用的是SDK，下載下傳位址為：https://cloud.tencent.com/document/product/866/17600，根據需要選擇對應的SDK下載下傳，本次以OCR-通用印刷體識别

使用騰訊OCR識别提取圖檔中的文字

下面需要将這個SDK調通。首先找到demo主類，将下面的四個參數換成自己的參數：，其中前三個參數自己很容易了解并找到

使用騰訊OCR識别提取圖檔中的文字

但是bucketName很多人不知道是什麼（bucketName參數如果不使用SDK方式則不需要），其實bucketName是騰訊雲的對象存儲的存儲桶的名稱，下圖中标記的參數就是你的bucketName值

使用騰訊OCR識别提取圖檔中的文字

因為此次調用的是OCR-通用印刷體識别，是以，找到demo類下對應的私有方法：

使用騰訊OCR識别提取圖檔中的文字

我們可以看見圖檔上傳有兩種方式，一種是url一種是圖檔内容，url的圖檔位址必須是公網可以通路的圖檔位址，本地圖檔是不可以的，如果你的環境不能被外網通路，那麼這種方法是行不通的，第二種圖檔内容方式是以base64方式上傳，可以指定本地圖檔，一般都是可以成功的。

所有需要改的參數到此結束，然後運作這個demo類，就可以看到識别圖檔後的結果了

繼續閱讀