最近问答类APP很火
网上的各种搜题辅助程序也很多, 作为程序员,当然也凑波热闹自己搞了一个.
环境Python3+google OCR
其中图片的截取利用了macOS + iOS的配合
采用的大致原理是手机连上Mac,通过自带的QuickTime实时显示手机屏幕,具体做法
可以百度怎么用 Quick Time Player 为 iPhone 录制屏幕
这个搜题辅助其实可以用在任意答题类APP上,调整截图坐标是识别的关键
步骤如下
- 安装google的文字识别引擎
1 | |
- 下载中文语言识别包
- 找到语言包chi_sim.traineddata
- 下载下来后放到,这里是Mac上的路径
/usr/local/Cellar/tesseract/3.05.01/share/tessdata/
- 安装python依赖库
1 | |
- 自行修改代码中的屏幕截图区域Frame
1 | |
- 运行程序
1 | |
识别效果
- OCR毕竟比不上接口直接拿数据,会存在一定误差,发现识别不准是可以自行调节图像处理参数
1 2 3 | |
- 这是截图后识别成文字的效果
- 这是丢进百度搜索的效果