天天看點

視覺AI技術應用探索 What is視覺生産2.視覺生産的分類視覺生産的通用架構3.視覺生産的五個關鍵次元視覺生成視訊編輯視覺增強視覺制造——由虛入實總結

What is視覺生産

通過一個/一系列視覺過程,産出新的視覺表達。

産出:人或機器能夠感覺的圖像視訊,而不是标簽或特征;

視覺AI技術應用探索 What is視覺生産2.視覺生産的分類視覺生産的通用架構3.視覺生産的五個關鍵次元視覺生成視訊編輯視覺增強視覺制造——由虛入實總結

2.視覺生産的分類

  • 生成:從0到1
  • 拓展:從1到N
  • 摘要:從N到1
  • 升維:從An到An+1

視覺生産的通用架構

視覺AI技術應用探索 What is視覺生産2.視覺生産的分類視覺生産的通用架構3.視覺生産的五個關鍵次元視覺生成視訊編輯視覺增強視覺制造——由虛入實總結

3.視覺生産的五個關鍵次元

滿足視覺/美學表現;合乎語義/内容邏輯;保證結果的豐富性;提供使用者預期的抓手;帶來使用者/商業價值

1.識别

含義:知道是什麼

2.檢測

含義:識别+知道在哪兒

3.分割

含義:識别+檢測+知道每一個像素是什麼

含義 :資料嚴重不足,标注成本高

思路:複雜問題拆解:粗mask估計+精準matting,豐富資料樣本:設計圖像mask統一模型

視覺生成

鹿班是視覺生成領域在業界落地的先行者,對外提供大規模線上的Al設計服務

視覺生成的流程

理需求,定草圖,選狀态,調細節,生成圖,評好壞

視訊編輯

視訊植入

挖掘視訊,核心價值部分;擴大植入,珈蓋範圍;提升植入,效果效率

删除不要的内容

視覺增強

視覺增強——風格遷徙

經過SOTA顯著性檢測算法(SalGAN)驗證,該算法有效提升了風格遷移的Attention Consistency。

視覺遷徙——顔色擴充

即通過算法改變顔色

視覺制造——由虛入實

實體設計制造現狀

效率低:多次打樣,多次溝通(服裝設計平均30天)

·定制難:無法實作柔性生産

·協同差:設計、營銷、生成脫節、倒置

AI後流程

輸入,生成,多樣,生産

總結

深度學習的實質,是通過建構具有很多隐層的機器學習模型和海量的訓練資料,來學習更有用的特征,進而最終提升分類或預測的準确性。是以,“深度模型”是手段,“特征學習”是目的。差別于傳統的淺層學習,深度學習的不同在于:1)強調了模型結構的深度,通常有5層、6層,甚至10多層的隐層節點;2)明确突出了特征學習的重要性,也就是說,通過逐層特征變換,将樣本在原空間的特征表示變換到一個新特征空間,進而使分類或預測更加容易。與人工規則構造特征的方法相比,利用大資料來學習特征,更能夠刻畫資料的豐富内在資訊。

繼續閱讀