
在計算機視覺領域,如何疊代現有的視覺模型以保證識别效果,如何更好地應對碎片化的海量長尾模型,一直是需要攻克的難題。星小環将通過兩期Q&A大放送,解答Sophon AutoCV常見的使用問題,并以計算機視覺模組化的全流程展示平台如何加速模型的快速建構和落地。
一個需求
客戶Q1:我們想對生産的零部件做缺陷檢測和入庫計數,但是零件類别很多,現在已知的就有上千類,未來還會有新增。這些新增的類别都需要定制化開發模型嗎?難道沒有更好的工具可以解決?
星小環:新增的類别都需要重新标注資料,進行模型的定制化開發。Sophon AutoCV平台提供引導式的模組化方式,營運的同學都可以在平台上進行可視化的訓練,整個過程不需要算法人員再次參與,可以降低訓練疊代模型的成本。
客戶Q2:無論如何都需要重新開發模型,隻不過通過你的工具來縮短時間?
星小環:是的,Sophon AutoCV可以支援您自己來訓練模型。如果想直接用模型,我們可以幫您訓練好,其實也是基于這個平台。無論哪種方式都可以較快生成新類别的模型,但需要提供樣例資料來标注。
客戶Q3:模型訓練完後,如何部署呢?
星小環:硬體方面,我們提供軟硬一體的方案,如果您自己有硬體,我們可以直接提供軟體平台部署。接着需要您的質檢裝置接入我們的平台,後續模型可以一鍵部署上線。對于模型有一些業務邏輯的部分,我們提供可視化拖拽資料算子的形式,來搭建您的業務流程。
一個平台
客戶Q4:我們發現很多模型訓練完之後還是得要有業務化适配的過程,是否可以在你們平台上面示範一下此過程?
星小環:現在您看到的就是Sophon AutoCV平台的首頁,主要包括模型生産、模型應用、模型管理,以及OCR圖文識别。本次示範主要涉及前三個子產品,OCR識别暫不涉及。
模型的應用部分是從模型倉庫出發,選擇一個版本的模型進行部署。最核心的部分就是模型和業務化适配的過程,我們把這個過程叫做建構場景,即把訓練完的模型和業務邏輯串聯,形成一個解決具體問題的場景模闆,這個模闆就可以橫向遷移到其他類似的場景當中。
客戶Q5:是否可以示範一下Sophon AutoCV從一個模型的生産到落地上線,以及後續模型疊代優化的整體過程?
星小環:考慮到客戶的資料隐私,此次示範流程使用公開資料。首先是模型的生産部分,包含建立标注集、選擇樣本集資料、标注類型,目前支援分割、檢測、分類和OCR文本标注。
标注集建立成功後,可進入标注空間直接手動标注,也可以選擇智能标注或者多人協同标注。
客戶Q6:模型預标注指的是用模型來标注代替人工麼?
星小環:是的,可以選擇用已經上線的模型先識别一遍,但還是需要人工核查。流程上縮短了從0-1标注的時間。
客戶Q7:不知道模型預标注品質怎麼樣,會不會存在大量錯誤?
星小環:标注品質其實更多取決于模型的準确度,剛開始人工介入會相對較多,随着模型疊代,後續的人力投入會大幅降低。
客戶Q8:你們是如何保證标注的品質的呢?
星小環:無論是人工标注還是模型智能标注的資料,我們都設定了管理者稽核驗收的過程,隻有驗收過的資料才可以入庫,來保證标注的品質。
資料标注完成後,進入引導式模組化子產品,您隻需要選擇剛剛的資料集配置一些訓練參數,靜待訓練完成即可。過程可以檢視訓練日志,同時我們也會将訓練過程資訊通過可視化board展示出來,友善您更直覺的檢視訓練過程。
客戶Q9:一些基礎的算法是否是平台内預置的?
星小環:是的,我們針對分類、檢測和分割任務都預置了SOTA的算法架構,如果您有自己的網絡結構,也可以根據規範來預置到平台,通過上述可視化的方式進行模型的訓練。
客戶Q10:我們希望通過使用内置的算法快速助力業務提升,隻是單單使用内置的算法,其準确度有保障嗎?
星小環:模型的準确度很大程度上都取決于資料量,這個是最首要的影響因素。Sophon AutoCV作為一個工具平台,可以幫助您更好地串聯起整個模型生産和應用的過程,縮短落地的周期,并且通過平台化的操作,來進行模型的閉環疊代。
客戶Q11:Sophon AutoCV是如何進行AI模型評估,并且保證上線模型的準确度?
星小環:Sophon AutoCV關于模型的評估過程設計了兩個階段:
第一個階段是在模型的訓練過程,我們切分了部分資料集作為驗證集來得到該模型的一些“準确率名額”,比如召回率、mAP。如果您覺得目前名額過低,或想選擇新的算法來進行對比,可以重新建立訓練作業,直到訓練出一個滿意的模型,我們把這個過程叫做模型的驗證,是為了得到一個還不錯的模型上架到模型倉庫。
第二個階段我們叫做模型評測,是在模型上架模型倉庫之後,用平台提供的标準測試集進行模型的評測,得到模型的“性能名額”,當然其中也包括準确率的資訊。
以上這兩個階段都是為了保證上線模型的性能和準确度。