天天看點

OCR産品的介紹

1、文通(http://www.wintone.com.cn/a/prods/netocr/)

北京文通科技有限公司是享譽國内外的OCR(光學字元識别)技術生産商、文檔影像技術和應用解決方案提供商。經過多年的創新與發展,文通科技現已成長為國内知名的高新技術企業,在全國十餘個城市建立了分支機構,公司産品涉及多個領域。

示範位址:http://cloud.wintone.com.cn/

2、百度(http://apistore.baidu.com/apiworks/servicedetail/969.html)

示範位址:http://apistore.baidu.com/astore/toolshttpproxy?apiId=usu9zg&isAworks=1

3、靈雲(http://www.hcicloud.com/)

靈雲作為第一個開放的人工智能雲服務平台,将智能語音互動、圖像識别、語義了解、機器翻譯、生物特征識别等人工智能技術完美整合。使用者可通過移動互 聯網、網際網路,使用任何裝置,在任何時間、任何地點,随時随地享受靈雲提供的“聽、說、讀、寫、意……”等全方位的人工智能技術服務。目前,靈雲以“雲 + 端”的方式,通過靈雲開發者社群為開發者提供語音合成(TTS)、語音識别(ASR)、手寫識别(HWR)、光學字元識别(OCR)、機器翻譯(MT)、 語義了解(NLU)、聲紋識别(VPR)等多項人工智能核心技術能力服務。

示範位址:http://www.hcicloud.com/products/show/forward/ocr

4、微軟

微軟的牛津計劃中的一部分,對中文支援不怎麼好。

其中的人臉檢測,人臉識别,語音識别,目标檢測,場景了解,OCR(特别是英文)都做得很不錯。

示範位址:https://www.projectoxford.ai/demo/visions#Ocr

5、雲脈科技(http://www.yunmai.cn/)

廈門雲脈技術有限公司(原廈門思根科技有限公司),我司成立于2002年6月,總部位于環境優美,宜人宜居的廈門,是廈門最大的一家手機軟體研發公 司。雲脈技術在手機拍照文字識别、名片識别、手機資訊網絡/PC同步及管理技術方面處于領先地位,與100多家手機廠商、電信營運商、PC外接裝置制造 商、行業項目系統內建商及各大網際網路公司建立了深厚的合作關系。公司憑借先進的技術實力與良好的客戶關系,今後将以OCR識别引擎SDK合作、為各行業提 供移動辦公資訊化管理及移動電子商務解決方案作為公司下一階段研發和營運的戰略重點。

這家公司有手機版的車牌識别

示範位址:http://www.yunmai.cn/?viewnews-165.html

6、還有老毛子的公司ABBYYFineReader。号稱OCR中的奔馳,現在不知道如何了,是否被其他公司超越了呢。

7、漢王(http://www.hw99.com/)

國内的老牌子了,以前和文通都是OCR的領頭羊,現在很多新公司在慢慢的超越他們了。漢王也提供了雲服務,名片,身份證,人臉都包含進去了

示範位址:http://developer.hanvon.com/card/toCard.do

這裡有一個文章,對國内外産品進行了讨論比較:

http://www.zhihu.com/question/19593313

真正能把中文OCR做得比較專業的,一共也沒幾家,國内2家,國外2家。國内是文通和漢王,國外是ABBYY和IRIS(台灣原來有2家丹青和蒙恬,這兩年沒什麼動靜了)。像大家提到的紫光OCR、CAJViewer、MS Office、清華OCR、包括慧視小靈鼠,這些都是文通的産品或者使用文通的識别引擎,尚書則是漢王的産品,和中晶掃描器捆綁銷售的。這兩家的中文識别率都是非常不錯的。而國外的2家,主要特點是西方語言的識别率很好,而且支援多種西歐語言,産品化程度也很高,不過中文方面速度和識别率還是有差距的,當然這兩年人家也是在不斷進步。Google的開源項目(Tesseract ),至少在中文方面,和這些家相比,各項性能名額水準差距還蠻大的呢

光學字元識别(OCR)軟體比較

名稱 支援平台 程式設計語言 字型語言 輸出格式 備注
Tesseract

Windows/MacOSX

/Linux

C++, C 40+ 文本,hOCR,其他 開源,支援中文
ExperVisionTypeReader

Windows/MacOSX

/Linux

C/C++ 21 hOCR 多次獲獎;不支援中文
ABBYY FineReader

Windows/MacOSX

/Linux

C/C++ 198 DOC, DOCX, XLS, XLSX, PPTX, RTF, PDF, HTML, CSV, TXT, ODT, DjVu, EPUB, FB2 世界排名第一;識别精度達99%;
LEADTOOLS

Windows/MacOSX

/Linux

C/C++, .NET, Objective-C, Java, JavaScript 56 PDF, PDF/A, DOC, DOCX, XLS, XPS, RTF, HTML, ANSI Text, Unicode Text, CSV 支援拉丁語, 亞洲語言,阿拉伯語,MICR字元集;支援整頁或者部分區域的OCR識别;
CuneiForm/OpenOCR

Windows/MacOSX

/Linux

C/C++ 28 ? 企業級系統,可以儲存文本格式,并識别結構的複雜表格
Image to OCR Converter Windows C/C++, VB , .NET 40 PDF, Word, HTML, Text 讀取的圖像格式和PDF檔案,并可以從照相機掃描圖像
Dynamsoft OCR SDK Windows C/C++ 40+ PDF, TXT -
Puma.NET Windows C# 28 ? -
ocr

繼續閱讀