天天看點

福大軟工 · BETA 版沖刺前準備(團隊)

寫在前面

  • 本次作業位址
  • 林燊大哥

過去存在的問題

算法組

  • 沒有考慮到資料集不充足的情況。一開始我們将所有資料集按照8:1:1進行分割,分别配置設定給訓練集、開發集和測試集。然鵝後來發現采集到的資料不夠充足,這麼分割訓練效果不理想。
  • 由于本次資料數量有限,導緻CRNN文字識别子產品雖然能達到很高的識别正确率,但是泛化性始終不能達到預期的效果。以及對于添加摩爾紋或者被障礙物遮擋這方面的資料集不在訓練集中,導緻上述圖檔的識别效果不好。

開發組

  • 由于我們的算法對伺服器要求較高,原先采用的阿裡雲9.9元伺服器性能并不足以完整地載入模型進行運算。
  • alpha版本的軟體是針對安卓4.4進行編寫的,在權限的處理上存在不足,沒有動态申請權限。在安卓6.0及以上的手機上運作會出現沒有權限的問題。
  • 在子界面的傳回操作處理上,細節處理的不夠好。不符合安卓使用者慣用的通過“傳回鍵”傳回上一級界面的方式。

其他

  • 沒有規範的技術文檔,導緻開發很混亂,會出現某個功能完成後接入主程式的時候出現問題。
  • 沒有強制性的deadline,許多工作經常沒能按時完成。

我們已經做了哪些調整/改進

  • 考慮到采集到的資料量小,按9:1配置設定給訓練集和測試集。這樣就能夠提升模型效果。
  • 嘗試抛棄CRNN文字識别子產品,啟用YOLO中被删除的詞樹子產品來CRNN,由文字識别轉為對現有資料集按商店名進行分類。且在資料集中添加含有摩爾紋和障礙物以及不同光線條件下的資料集,增加算法的魯棒性。

  • 使用筆記本電腦搭建本地伺服器。
  • 現階段主要采用手動在系統設定裡賦予軟體軟線的方式。
  • 現階段主要是采用類似蘋果的用過左上角按鈕傳回的方式。

  • 我們查詢了相關文檔,了解如何寫技術文檔。
  • 未能按時送出的同學請喝奶茶(๑¯ิε ¯ิ๑)

我們在接下來的Beta沖刺中會有哪些改進

  • 多拍照片,擴大資料集。
  • 基于神經風格遷移、平移、選擇、高斯噪聲等一系列資料增強的手段在資料集擴充上起到了較佳的效果,但是自然場景下的中文識别的泛化性問題仍是當今難以解決的難題之一,我們計劃以目标檢測來代替文字識别,通過直接對商鋪招牌進行檢測,來盡可能避免文字識别子產品帶來的精度誤差。

  • 如果有柯老闆的天使投資,可以嘗試購買更好的雲伺服器。否則的話應該還是繼續使用本地電腦作為伺服器。
  • 後期将使用動态申請權限的方式,并給使用者友好的提示。
  • 後期将加上通過虛拟或者實體按鍵傳回的方式。

  • 如果時間上允許,我們會試着寫我們自己的技術文檔。
  • 未能按時送出任務的同學要扣貢獻度!