最近問答類APP很火
網上的各種搜題輔助程式也很多, 作為程式員,當然也湊波熱鬧自己搞了一個.
環境Python3+google OCR
其中圖檔的截取利用了macOS + iOS的配合
采用的大緻原理是手機連上Mac,通過自帶的QuickTime實時顯示手機螢幕,具體做法
可以百度怎麼用 Quick Time Player 為 iPhone 錄制螢幕
這個搜題輔助其實可以用在任意答題類APP上,調整截圖坐标是識别的關鍵
步驟如下
- 安裝google的文字識别引擎
1 | |
- 下載下傳中文語言識别包
- 找到語言包chi_sim.traineddata
- 下載下傳下來後放到,這裡是Mac上的路徑
/usr/local/Cellar/tesseract/3.05.01/share/tessdata/
- 安裝python依賴庫
1 | |
- 自行修改代碼中的螢幕截圖區域Frame
1 | |
- 運作程式
1 | |
識别效果
- OCR畢竟比不上接口直接拿資料,會存在一定誤差,發現識别不準是可以自行調節圖像處理參數
1 2 3 | |
- 這是截圖後識别成文字的效果
- 這是丢進百度搜尋的效果