天天看點

人工智能中RPA、NLP、OCR介紹

1、NLP

自然語言處理( Natural Language Processing, NLP)是計算機科學領域與人工智能領域中的一個重要方向。主要研究能實作人與計算機之間用自然語言進行有效通信的各種理論和方法。自然語言處理是一門融語言學、計算機、于一體的。是以,這一領域的研究将涉及自然語言,即人們日常使用的語言,是以它與語言學的研究有着密切的聯系,但又有重要的差別。自然語言處理并不是一般地研究自然語言,而在于研制能有效地實作自然語言通信的計算機系統,特别是其中的軟體系統。因而它是計算機科學的一部分。主要是在文本資料基礎之上做各種應用,比如文本挖掘、搜尋推薦等,主要産品是文本智能化處理軟體系統,能夠幫助客戶完成文檔智能審閱、推薦、搜尋、客戶意見洞察等工作。

人工智能中RPA、NLP、OCR介紹

2、RPA

RPA(機器人流程自動化)是近兩年較為火熱的話題,它通過模仿最終使用者在電腦的手動操作方式,提供了另一種方式來使最終使用者手動操作流程自動化。簡單來說,這是一項橫向的、貼近業務流的技術,用于自動化處理重複、規則明确、并且需要人類切換不同系統來完成的工作。具體到産品形态,則是自動化軟體,模拟人類的互動完成重複性事務。

舉個例子,如果一個分析師每天需要關注一家上市公司的資料,每天要在同一個網站扒資料,并填到表内,那麼 RPA 機器人就可以自動完成擷取資料、填表、導出等工作。

傳統 RPA 産品由開發平台、控制中心、終端機器人組成。RPA 已推出銀行、财稅、政務、保險、證券基金等數十種不同崗位的機器人員工。在售後工單處理、商業案例報告生成、供應商準入核實、智慧政務行政審批、金融文檔的抽取驗查和填寫等場景中已開展工作

人工智能中RPA、NLP、OCR介紹

3、OCR

OCR (Optical Character Recognition,光學字元識别)是指電子裝置(例如掃描器或數位相機)檢查紙上列印的字元,通過檢測暗、亮的模式确定其形狀,然後用字元識别方法将形狀翻譯成計算機資料的過程。

針對印刷體字元,采用光學的方式将紙質文檔中的文字轉換成為黑白點陣的圖像檔案,并通過識别軟體将圖像中的文字轉換成文本格式,供文字處理軟體進一步編輯加工的技術。衡量一個OCR系統性能好壞的主要名額有:拒識率、誤識率、識别速度、産品的穩定性、易用性等。在多數組織的智能自動化流程業務中,OCR是應用最多的人工智能技術之一。OCR與RPA的結合可以将組織中超過70%的無紙化業務實作自動化,其效率将是人工的5倍以上。

人工智能中RPA、NLP、OCR介紹

4、RPA、NLP、OCR應用情況:

RPA目前被企業應用最多的還是實作業務流程自動化,在降低風險方面RPA同樣發揮了重要作用。許多世界頂級銀行已把RPA部署在營運部門,以幫助他們打擊那些涉及欺詐、洗錢等行為的使用者。金融機構利用RPA幫助識别這些進行非法活動的客戶,很好的為企業避免了重大損失。

RPA平台通過收集并定期分析客戶資料,包括:媒體新聞、搜尋引擎、征信系統等執行定期資料調查,以查出該使用者是否有觸犯法規的行為。例如在一家加拿大銀行的案例中,該公司在部署RPA後的六個月内不僅節省了750,000美元的成本,還查處了120個非法客戶成功避免了那些潛在的危險行為。

人工智能中RPA、NLP、OCR介紹

NLP主要幫助企業分析客戶需求,研究表明,大多數緻電企業售前客服咨詢業務時,都無法及時獲得所需要的幫助。當這種情況發生較多時,很多人都會産生厭倦感。NLP技術通過檢測語音通話,可以實時測量客戶的語調以及他們在對話中使用的單詞頻率等,有效的防止人們挫敗感的産生。一些呼叫中心使用NLP來提供實時的回報資訊。例如:如果一個人打電話給旅遊公司并多次提到“度假”,那麼NLP就會識别這一詞彙進行統計。當會話結束後,NLP會把會話中出現頻率最多的幾個詞統計出來,友善客服人員進行服務分析。

人工智能中RPA、NLP、OCR介紹

相對于NLP和RPA來說,目前OCR應該是應用層面最廣的技術。在具體的落地應用層面,目前卡證識别、票據識别等标準場景文字識别已經相對成熟,手寫文字識别在教育、物流等行業的應用也在不斷擴大。複雜動态場景下的OCR技術和應用成為近兩年的熱門研究方向,比如在無人駕駛、機器人等場景利用OCR對視場中出現的文字進行識别等。目前OCR識别技術,主要劃分為8項:

1)證件識别:主要識别證件資訊,用于金融、銀行、保險、汽車等領域(網際網路),支援大陸二代身份證、台灣身份證、香港身份證、澳門身份證、護照、行駛證、駕駛證、港澳台通行證等20餘種證件識别,支援Android/iOS、Windows/Linux 32/64位主流作業系統,目前有證件采集儀、護照閱讀器、門禁考勤機、人行通道閘機、人證一體掃描器、移動端證件識别SDK等産品中應用該項技術;

2)銀行卡識别:主要識别銀行卡卡号,用于移動支付綁卡,提升APP使用者體驗(網際網路)。支援國内各個銀行的信用卡、儲蓄卡,包括平面字型和凹凸字型銀行卡、橫版和豎版銀行卡、标準和異形銀行卡等識别,支援Android/iOS、Windows/Linux 32/64位主流作業系統,目前有移動端銀行卡識别SDK、雲端銀行卡識别API;

3)車牌識别:主要識别車牌号碼、車牌顔色、車牌類型、車标、車身顔色等車輛特征資訊,用于移動警務,占道停車,停車場管理,車險等領域(網際網路)中,支援識别普通藍牌、黃牌(雙層)、軍牌(雙)、武警牌(雙)、警牌、農用車牌、大使館車牌等各種常見規格的汽車号牌,支援Android/iOS、Windows/Linux 32/64位主流作業系統,目前有PC端車牌識别SDK、移動端車牌識别SDK、車牌識别抓拍相機、DSP嵌入式車牌識别、車型識别、車位檢測等産品應用了該項技術;

4)名片識别:主要識别名片内容,用于移動展業、CRM客戶管理系統等領域(網際網路),支援橫版、豎版名片識别,及其他闆式的各種名片,還支援多語種名片識别,支援Android/iOS、Windows/Linux 32/64位主流作業系統,目前有移動端名片識别、雲端名片識别API;

5)營業執照識别:主要識别營業執照資訊(統一社會信用代碼、公司名稱、二維碼等),用于需要代替人工提取營業執照資訊的領域(網際網路),支援Android/iOS、Windows/Linux 32/64位主流作業系統,目前有移動端營業執照識别SDK、文字識别SDK、掃描識别硬;

6)汽車VIN碼識别:主要識别車架号(汽車VIN碼),用于汽車管理、汽車服務、二手車交易、租車等領域(網際網路),支援Android/iOS、Windows/Linux 32/64位主流作業系統,目前有移動端汽車VIN碼識别SDK;

7)票據類OCR識别:主要識别增值稅發票等不同格式的票據内容,用于财務管理、汽車、銀行、金融等領域(網際網路),基于模闆機制,針對不同的票據,定制不同的識别要素,支援Android/iOS、Windows/Linux 32/64位主流作業系統,目前有表票識别掃描器、表票識别SDK;

8)文檔文字OCR識别:主要識别文檔文字,用于圖書館,報社等針對圖書、報紙、雜志等文本類,需要把這些紙質文檔進行電子化的領域(網際網路),需借助在掃描器,目前有移動端的文檔OCR識别、文檔識别掃描器,随着掃描器分辨率的提升,OCR軟體也在不斷更新,掃描器廠商現在已經把專業的OCR軟體搭配自己生産的掃描器出售。

人工智能中RPA、NLP、OCR介紹

5、RPA、NLP、OCR三者關系

目前,大部分的RPA工具都是基于微軟.NET Framework的WorkflowFoundation開發,整合OCR、NLP等AI技術,能夠以弱耦合,即不改變現有軟體系統部署的形式跨系統執行,且實作零出錯率。在技術上,RPA早已不是單個企業的定制化功能,事實上已經生長成融合AI技術、系統級的跨軟硬體、多賬戶的服務。

在NLP的産品體系中,OCR是關于文檔、檔案處理的基礎步驟,是無法回避和繞開的。

對任何一個業務流程自動化而言,都需要串接許多技術子產品。RPA+OCR+NLP的融合,減少了業務流程中人機互動、人工複核的環節,可以更全面的滿足企業自動化的需求。

下面這個執行個體主要幫助大家更好的了解RPA與OCR的工作原理:

1、使用者收到一封帶有圖檔的電子郵件。

2、RPA自動閱讀電子郵件。

3、對圖檔進行分類并選擇模闆。

4、通過OCR對分類的圖檔進行資料識别和提取。

5、RPA接收OCR轉化後的結構化資料。

6、進行資料校審确認。

7、自動将結構化資料放置或錄入到指定位置。

8、存儲所有結構化資料,并向使用者發送一封通知郵件,确認所有工作完畢。

人工智能中RPA、NLP、OCR介紹

目前全球的RPA廠商正在通過與不同的人工智能技術相結合,來提升競争力赢得市場。而OCR在頻率、業務範圍、以及對業務影響上都領先于其他技術。通過OCR來處理那些非結構化業務,也使得RPA的自動化範圍可以擴充到更多的領域中。

繼續閱讀