金磊 發自 凹非寺
量子位 | 公衆号 QbitAI
2分鐘,“啪的一下”。
800多人的核酸完成截圖就稽核完畢了。
這就是一位複旦大學生物醫學工程專業博士生,在最近共同抗疫期間開發的一項小程式發揮的作用。
而且僅僅是花費1小時、130行代碼的那種。
複旦大學官方對這個“抗疫利器”的評價是:
大大提高了核酸核查的效率和精度。
這位博士生的工作,也引來網友們的“膜拜”:
人民日報也對他的工作做出了評價,認為這波“操作火了”:
2分鐘搞定1小時工作
整件事的起因,是最近抗疫期間,複旦大學啟動了常态化核酸篩查工作。
而“痛點”也随之而來。
也就是要核查每位學生“健康雲”核酸完成截圖,需要花費大量的時間和人力。
但總的來說,這其實是一項重複性較高、單調且枯燥的工作:
一個班級的截圖可能就需要花上半小時核查,如果是人數多的院系可能需要更久,還可能會看錯看漏。
而複旦的這位博士生,身為學院2019級資訊1班輔導員,在此期間負責的正是這項工作。
于是,他便心生一計——
“搞個OCR識别代碼”。
△圖源:複旦大學
最初與學工同僚分享這個想法的時候,同僚還擔心會不會太難了。
而他卻回複說:
有現成的庫,import一下就好了。
然後,1個小時過去了……
“我寫好了”。
同僚見狀甚至感慨說“這就是博士嗎”。
于是乎,他的代碼程式就開始在自己的班級中“上崗”了。
在進行驗證之後,這段程式的準确率還是很高的,甚至還發現了此前人工核查時沒有發現的問題。
最重要的是,這項工作的速度有了大幅的提高。
例如原先要核查800張截圖,幾個從業人員要花費1個多小時,而現在,2分鐘即可拿到結果!
至于原理,這位博士生謙虛地說“并不複雜”。
他所用到的技術主要是OCR (光學字元識别),代碼語言則是Python。
根據複旦官方的介紹,這位博士生更具體的是用到了Python中的正規表達式。
正規表達式可以把想要的資訊從OCR識别的文本中篩選出來。
最後還會彙總到一張Excel檔案中,友善從業人員确認。
而且為了他為了友善不會程式設計的同僚使用,還把程式進行了封裝,隻需要輸入一行指令就可以使用了。
來自複旦大學的博士生
開發這項“抗疫利器”的博士生,是來自複旦大學的李小康。
有意思的是,他并非是計算機專業的學生,而是生物醫學工程專業。
其研究方向是醫學影像與人工智能。
對于這項工作,他認為:
雖然原理也很簡單,隻要是會寫代碼的人第一時間就會明白是怎麼回事,但是不做相關工作的感受不到這件事情的費時費力,自然也不會想出辦法。
我隻是用我學到的知識解決實際工作中的困難。
△圖源:複旦大學,李小康本人留言
據複旦大學官方介紹,在不久之後,師生可以不再手動收集核酸截圖,而是通過小程式直接上傳圖檔了。
……
最後,引用李小康本人的話:
這場戰“疫”我們一定可以勝利!
參考連結:
[1]https://mp.weixin.qq.com/s/RogQcUAsZszW5HkYwYcV-w
[2]https://mp.weixin.qq.com/s/l8u9JifKDlRDoz32-jZWQg
[3]https://weibo.com/1726918143/Lnn2Ll7KZ?type=comment#_rnd1649380649145