文本識别微信小程式需求說明書

文本識别微信小程式

通過規範小程式的開發過程，達到提高品質，降低維護成本的目的。開發者應根據本指南進行小程式開發和編制小程式開發文檔。

在資訊量非常大的時代，PDF和圖檔占資訊量較大一部分，這就造成了使用者對圖檔和PDF文本識别的大量需求，包括對各種語言文字、手寫體、數字等。本項目目的為滿足這一市場的需求。

旨在為此微信小程式的開發指定規範、明确開發方向和目的。使每個成員了解自己的分工，并嚴格按照此文檔執行。

該程式可以将圖檔和某些無法複制的PDF中的文字識别出來供使用者使用，後期識别出來的文字能支援複制，格式規範和無亂碼。在一定程度上，該程式友善了人們的學習和生活。

1、寫出小程式的前端基本樣式，後端對圖檔中文本字元分割的算法。

2、完善前端基本樣式，後端調用百度orc進行文字識别。

3、豐富小程式界面及功能，并進行排錯。

運作環境：Android

開發平台：pycharm、VS code、微信小程式開發者工具

開發語言：JS、python

本小程式的系統劃分：接口系統

接口系統分為：

1、擷取使用者手機的相機權限，若相機不授權，則無法使用拍照識圖功能。

2、擷取使用者手機的相冊權限，若相冊不授權，則無法上傳圖檔進行識别。

3、通過接口調用百度OCR，百度OCR無調用頻率限制，但每天有免費調用次數限制（最高50000次）。因為該小程式未添加資料庫系統，是以對于不同使用者進行識别時，會重複調用此接口。

4、擷取使用者微信賬戶資訊，其中包括該賬戶中所有的已公開資訊，若使用者不授權，則無法對相冊進行授權。

5、由于文字型系的龐大以及其複雜性，是以該小程式的服務幾乎都依賴于第三方，暫時無更好備選方案。該程式的穩定性取決于第三方庫的穩定性。

6、該程式的識别準确度，取決于照片的清晰度以及文字的标準程度，照片越清晰，文字越标準，則準确度越高。可以識别的内容包括漢字、數字、英文、标點符号等。

文檔源碼：https://gitee.com/rui-123/year-old-city