天天看點

RPA之眼:AI-OCR,Fax-OCR概述

文丨馬磊

OCR是一種與RPA機器人協作的一項重要技術,相當于機器人的眼睛。

OCR是英文“Optical Character Recognition/Reader”的簡稱,光學字元識别。從名字我們不難看出,OCR就是讀取手寫和印刷文字,并把讀取的資訊轉換成可以在電腦的Excel,World等軟體上使用的文字資訊處理技術。

 目前的資訊化社會,大量的檔案被電子化,紙質的檔案越來越少。但事實上依然存在很多不得不使用紙質檔案的情況,比如說街頭調查問卷。OCR技術的誕生可以取代人工讀取紙質檔案的工作,并将紙質檔案的資訊電子化。

RPA之眼:AI-OCR,Fax-OCR概述

RPA和OCR的協作

RPA目前活躍在以金融機關代表的企業中,但是這些企業的紙質媒體和列印資料等非電子化的資料僅僅依靠RPA來進行業務處理的話還是相當困難的。這就為RPA技術與OCR技術的協同合作提供了契機。

在隻有RPA的情況下,需要員工手動把紙質檔案的資訊錄入到Excel,Word等電子文檔中,然後運作RPA機器人讀取電子文檔中的資訊實作業務的自動化處理。

而RPA + OCR的情況下,隻需實作掃描好紙質檔案,OCR會自動讀取掃描檔案,将圖檔資訊讀取并寫入Excel等文檔中,然後RPA機器人運作,進行業務處理。這個過程完全替代了人工手動錄入,極大地節約了人力成本。

RPA之眼:AI-OCR,Fax-OCR概述

近年來, OCR引起了廣泛關注,但目前的OCR軟體存在精度不高和無法應對非固定檔案模闆等課題。未來通過在OCR中引入AI的深度機器學習等技術以後,相信一定會解決這個課題。

Fax-OCR是什麼?

RPA之眼:AI-OCR,Fax-OCR概述

Fax-OCR是把傳真機接收的訂單等紙質檔案通過OCR技術自動轉為文本資訊的技術。雖說現在社會尤其是國内公司,很多都是網上接單了,但是用傳真接收客戶訂單這種古老的方式還是在一定程度上存在的。尤其是日本的小型公司依然采用這種老舊的接收訂單的方式。如果把傳真資料自動讀入系統将減少大量人工錄入的費時操作,同時人工失誤也會大幅減少。

OCR的注意點

OCR技術确實可以自動實作資料的文本化,也是一項非常有效的效率改善的技術手段,但是現在的階段OCR并非無所不能。

1、無法對應多份檔案。

一般來說,OCR 需要讀取文本内容以及檔案内容的模闆,并定義好抽出的對象資料的位置。但是,由于客戶的檔案模闆并不統一,檔案模闆和資料坐标位置也不盡相同,這種情況應對起來就比較困難了。是以對于一些既有模闆以外的檔案要格外注意。

2、文字資料抽出後,必須進行人工确認。

雖然AI-OCR可以通過機器學習技術去識别手寫文字,但是很多不清楚,或者寫法不鮮明的文字還是很難做到完美識别。是以,資料抽出完畢後還是要通過人去确認資料的正确性。

原文位址: https://www.uibot.com.cn/news-7-1307.html

繼續閱讀