What is視覺生産
通過一個/一系列視覺過程,産出新的視覺表達。
産出:人或機器能夠感覺的圖像視訊,而不是标簽或特征;

2.視覺生産的分類
- 生成:從0到1
- 拓展:從1到N
- 摘要:從N到1
- 升維:從An到An+1
視覺生産的通用架構
3.視覺生産的五個關鍵次元
滿足視覺/美學表現;合乎語義/内容邏輯;保證結果的豐富性;提供使用者預期的抓手;帶來使用者/商業價值
1.識别
含義:知道是什麼
2.檢測
含義:識别+知道在哪兒
3.分割
含義:識别+檢測+知道每一個像素是什麼
含義 :資料嚴重不足,标注成本高
思路:複雜問題拆解:粗mask估計+精準matting,豐富資料樣本:設計圖像mask統一模型
視覺生成
鹿班是視覺生成領域在業界落地的先行者,對外提供大規模線上的Al設計服務
視覺生成的流程
理需求,定草圖,選狀态,調細節,生成圖,評好壞
視訊編輯
視訊植入
挖掘視訊,核心價值部分;擴大植入,珈蓋範圍;提升植入,效果效率
删除不要的内容
視覺增強
視覺增強——風格遷徙
經過SOTA顯著性檢測算法(SalGAN)驗證,該算法有效提升了風格遷移的Attention Consistency。
視覺遷徙——顔色擴充
即通過算法改變顔色
視覺制造——由虛入實
實體設計制造現狀
效率低:多次打樣,多次溝通(服裝設計平均30天)
·定制難:無法實作柔性生産
·協同差:設計、營銷、生成脫節、倒置
AI後流程
輸入,生成,多樣,生産
總結
深度學習的實質,是通過建構具有很多隐層的機器學習模型和海量的訓練資料,來學習更有用的特征,進而最終提升分類或預測的準确性。是以,“深度模型”是手段,“特征學習”是目的。差別于傳統的淺層學習,深度學習的不同在于:1)強調了模型結構的深度,通常有5層、6層,甚至10多層的隐層節點;2)明确突出了特征學習的重要性,也就是說,通過逐層特征變換,将樣本在原空間的特征表示變換到一個新特征空間,進而使分類或預測更加容易。與人工規則構造特征的方法相比,利用大資料來學習特征,更能夠刻畫資料的豐富内在資訊。