天天看點

OCR:實作資訊結構化提取 助力資訊數字化管理 ——基于OCR的機動車銷售統一發票識别提取自動化應用案例

目前,機動車市場最常見的銷售流通模式主要以廠商授權、管道經銷為主,汽車廠商需要基于資料資訊掌握各管道(如經銷商、代理機構等)的銷售情況,以便實作銷售管理,準确評估銷售資源、規劃銷售網絡布局。

為及時掌握銷售資料,汽車廠商要求經銷商統一上傳機動車銷售統一發票掃描件或影印件,并在業務管理平台上填報相關銷售資料,錄入字段繁多,人工操作耗時費力且容易出錯。

為降低資訊提取成本、優化業務處理效率,深源恒際依托自身在OCR技術上的積累,打造了

機動車銷售統一發票

資訊識别提取自動化解決方案,自動檢測、識别、提取發票資訊,并根據實際應用需求輸出結構化文本,由計算機替代人工作業,高效、準确地完成資訊提取。

OCR:實作資訊結構化提取 助力資訊數字化管理 ——基于OCR的機動車銷售統一發票識别提取自動化應用案例

(機動車銷售統一發票識别示例)

在通用OCR技術基礎上,基于深度學習+專項訓練方法,深源恒際研發了

機動車銷售統一發票專用識别算法模型

,可自動檢測、識别、提取票面上的所有字段資訊,如機打代碼、機打号碼、開票日期、車輛識别代号/車架号碼(VIN)、價稅合計、不含稅價等。當經銷商上傳發票掃描件時,系統将自動識别并結構化提取發票上的核心字段資訊,并實作同步錄入。目前,字段識别準确率已超過98%,單張發票處理時長不超過1s。

為優化識别準确率,深源恒際在模型開發中内置了多重校驗規則:基于各字段間的内在邏輯和關聯關系,自動甄别置信度較低的字段資訊,并根據校驗邏輯對可能出錯的資訊進行智能糾正,讓識别準确率持續提升。

作為汽車銷售與購買的唯一憑證,在車主向稅務機關申報車購稅時或去車管所進行車輛登記時都會用到,這些場景下同樣涉及發票資訊資料的流轉。基于OCR自動識别提取資訊,不僅讓有用的資料在廠商與管道商之間有效流轉,也可以在車輛報稅和車輛登記環節幫助相關機構、部門高效提取資訊,甚至實作流程線上化、服務便民化。

目前,

機動車銷售統一發票OCR産品

已上線

阿裡雲雲市場

,使用者可通過

體驗服務。

未來,鑒于豐富場景下的多元化需求,深源恒際将依托OCR技術為使用者提供場景化的技術解決方案。以深度學習為引擎,為雲市場生态使用者建構滿足應用需求的專用識别模型,幫助使用者實作資訊管理數字化。

繼續閱讀