天天看點

複旦博士寫了130行代碼,2分鐘解決繁瑣核酸報告核查

金磊 發自 凹非寺

量子位 | 公衆号 QbitAI

2分鐘,“啪的一下”。

800多人的核酸完成截圖就稽核完畢了。

這就是一位複旦大學生物醫學工程專業博士生,在最近共同抗疫期間開發的一項小程式發揮的作用。

而且僅僅是花費1小時、130行代碼的那種。

複旦大學官方對這個“抗疫利器”的評價是:

大大提高了核酸核查的效率和精度。

這位博士生的工作,也引來網友們的“膜拜”:

人民日報也對他的工作做出了評價,認為這波“操作火了”:

2分鐘搞定1小時工作

整件事的起因,是最近抗疫期間,複旦大學啟動了常态化核酸篩查工作。

而“痛點”也随之而來。

也就是要核查每位學生“健康雲”核酸完成截圖,需要花費大量的時間和人力。

但總的來說,這其實是一項重複性較高、單調且枯燥的工作:

一個班級的截圖可能就需要花上半小時核查,如果是人數多的院系可能需要更久,還可能會看錯看漏。

而複旦的這位博士生,身為學院2019級資訊1班輔導員,在此期間負責的正是這項工作。

于是,他便心生一計——

“搞個OCR識别代碼”。

△圖源:複旦大學

最初與學工同僚分享這個想法的時候,同僚還擔心會不會太難了。

而他卻回複說:

有現成的庫,import一下就好了。

然後,1個小時過去了……

“我寫好了”。

同僚見狀甚至感慨說“這就是博士嗎”。

于是乎,他的代碼程式就開始在自己的班級中“上崗”了。

在進行驗證之後,這段程式的準确率還是很高的,甚至還發現了此前人工核查時沒有發現的問題。

最重要的是,這項工作的速度有了大幅的提高。

例如原先要核查800張截圖,幾個從業人員要花費1個多小時,而現在,2分鐘即可拿到結果!

至于原理,這位博士生謙虛地說“并不複雜”。

他所用到的技術主要是OCR (光學字元識别),代碼語言則是Python。

根據複旦官方的介紹,這位博士生更具體的是用到了Python中的正規表達式。

正規表達式可以把想要的資訊從OCR識别的文本中篩選出來。

最後還會彙總到一張Excel檔案中,友善從業人員确認。

而且為了他為了友善不會程式設計的同僚使用,還把程式進行了封裝,隻需要輸入一行指令就可以使用了。

來自複旦大學的博士生

開發這項“抗疫利器”的博士生,是來自複旦大學的李小康。

有意思的是,他并非是計算機專業的學生,而是生物醫學工程專業。

其研究方向是醫學影像與人工智能。

對于這項工作,他認為:

雖然原理也很簡單,隻要是會寫代碼的人第一時間就會明白是怎麼回事,但是不做相關工作的感受不到這件事情的費時費力,自然也不會想出辦法。

我隻是用我學到的知識解決實際工作中的困難。

△圖源:複旦大學,李小康本人留言

據複旦大學官方介紹,在不久之後,師生可以不再手動收集核酸截圖,而是通過小程式直接上傳圖檔了。

……

最後,引用李小康本人的話:

這場戰“疫”我們一定可以勝利!

參考連結:

[1]https://mp.weixin.qq.com/s/RogQcUAsZszW5HkYwYcV-w

[2]https://mp.weixin.qq.com/s/l8u9JifKDlRDoz32-jZWQg

[3]https://weibo.com/1726918143/Lnn2Ll7KZ?type=comment#_rnd1649380649145

繼續閱讀