天天看點

開源自己編寫的半人工标注平台PaddleOCRLabel(.NET Winform版本)

最近開始從事曆史類工具的開發,以及人工智能,尤其是OCR技術,又重拾C#和winform的老本行,做了一個半人工标注平台PaddleOCRLabel,在gitee上開源,位址是:

https://gitee.com/BaoJianQiang/paddle-ocrlabel

大家好,

我是部落格園的老使用者了,許久不做.NET技術了,從2013年起,開始從事App技術,寫過書,在Linux上搭建區塊鍊,用GO寫智能合約,使用nodejs搭建過微服務,用python寫過爬蟲,寫過微信聊天機器人。

人到中年,已經寫不出20多歲時意氣風發的激揚文字了。

最近開始從事曆史類工具的開發,以及人工智能,尤其是OCR技術,又重拾C#和winform的老本行,做了一個半人工标注平台PaddleOCRLabel,在gitee上開源,位址是:https://gitee.com/BaoJianQiang/paddle-ocrlabel

寫這個軟體隻用了一周時間,很多遺忘的技術,上網搜一下,改一改代碼,基本就能為我所用。寫了17年代碼了,這是最直接的體會。

再比如說,要做一個操作復原的功能,用指令模式或備忘錄模式,也是得心應手,這也是08年開始研究設計模式的成果。

比較感慨的是,.NET生态真的不是很繁榮。舉一個例子,我這個軟體裡面要做類似于PhotoShop的圈鎖和浮層,竟然找不到好用的第三方庫,隻能直接使用最原始的GDI+繪制,效果不是很理想。我隐約記得有個.NET仿照PS做的Paint.NET開源項目,竟然官網已經不提供下載下傳了。隻能去一些網站付費下載下傳,打開才發現是很早的版本,現在的VisualStudio根本打不開。

再聊聊我步入ai這個大舞台的初步感受,我至今也沒入門這個領域,隻是機械性的知道tensorflow和pytorch搭模組化型的那些代碼,但是對于文字和圖像轉變成數字矩陣然後大量訓練就能得到結果,還是摸不着頭腦。

看一下這個開源項目的界面吧,如下圖所示:

開源自己編寫的半人工标注平台PaddleOCRLabel(.NET Winform版本)

這個軟體哦,其實還沒全做完,因為要和百度paddleocr合作,是以隻能使用百度的服務。

接下來,會在此基礎上,開發出更強大的一個項目,掃描一張圖檔,同時從騰訊、百度、阿裡、科大訊飛這幾家公司的ocr服務,傳回标注結果,供使用者選擇,這就是商用軟體了。

此外,我上個月還寫了一個一鍵生成的工具,可以把pdf直接轉換為ocr識别後的文本,軟體界面如下圖所示,過段時間我也會開源出來:

開源自己編寫的半人工标注平台PaddleOCRLabel(.NET Winform版本)

我的一個長期願景是整理古籍,把古籍中的文字搜集為一個很大的曆史資料庫,支援全文索引,如下圖所示(隻截取了兩晉十六國和民國的截圖,想看其他朝代的可以私聊),是我花了一年時間做的一個軟體,通過這個内容類收集軟體,可以快速把曆朝曆代的人物的傳記文章歸類,可以快速閱讀完一個朝代的曆史,這是我的初衷:

開源自己編寫的半人工标注平台PaddleOCRLabel(.NET Winform版本)
開源自己編寫的半人工标注平台PaddleOCRLabel(.NET Winform版本)

把這些工具結合在一起,就是一個非常牛逼的紙質書籍轉文本的一攬子解決方案。我主要針對古籍,因為這塊沒有版權的問題。

最後,因為咱們這個技術社群做.NET的人多一些,是以希望各位winform繪圖高手,以及python多線程高手,有興趣可以參與到我這個開源項目中來。

謝謝