python OCR

2023-05-19 08:56:23

from cnocr import CnOcr
import re


def ocr_front(path):
    ocr = CnOcr()
    s = ocr.ocr(path)
    text = ''
    for txt in s:
        text += txt['text']
    # print(text)
    dict_txt = {'國籍': text.split('居')[0],
                '證件類别': text.split('國')[1].split('簽')[0],
                text.split('證')[1][:4]: text.split('關')[1].split('有')[0],
                '有' + text.split('有')[1][:3]: text.split('限')[1]
                }
    return dict_txt


def ocr_back(path):


    ocr = CnOcr()
    s = ocr.ocr(path)
    text = ''
    for txt in s:
        text += txt['text']
    # print(text)
    dict_txt = {'姓名': text[text.find('名')+1:text.find('别')-1],
                '性别': text[text.find('别')+1:text.find('民族')],
                '出生': re.sub(r'\D', '', text[text.find('生')+1:text.find('住')]),
                '住址': text[text.find('址')+1:text.find('公民')],
                '公民身份号碼': text[text.find('份号碼')+3:text.find('份号碼')+21]
                }
    return dict_txt


if __name__ == '__main__':
    Idc_front = ocr_front('Id_Card_n.jpeg')
    Idc_back = ocr_back('123456.png')
    for key in Idc_front:
        print("{}:{}".format(key, Idc_front[key]))
    for key in Idc_back:
        print("{}:{}".format(key, Idc_back[key]))

cnocr再訓練：

一、擷取源代碼

git clone https://github.com/breezedeus/cnocr.git

二、準備訓練資料

python OCR

引用+參考：CNOCR重訓練_蕭班的部落格-CSDN部落格_cnocr 訓練

如侵權，聯系删除

python OCR

繼續閱讀

httpd服務的部署、啟動、配置和簡單優化一、部署二、啟動三、配置檔案

配置網頁内容通路

手動安裝Intel network I217-LM網卡的Linux驅動

禁止ubuntu系統彈出報錯界面

Ubuntu Linux下Apache的配置檔案

無人機--飛控科普

Cloud Studio初體驗

使用 ctypes 進行 Python 和 C 的混合程式設計

【python】【資料處理】畫多元資料分布圖

samba伺服器的功能

【Linux】UDP廣播封包接收速率問題

【python】netconf協定對接管理裝置

「Python 網絡自動化」NETCONF —— Python 使用 NETCONF 管理配置 H3C 網絡裝置

Linux裝置模型（中）之上層容器

PowerPC平台 Linux移植三

在python中建立excel并寫入