視覺産生
一、定義
通過一個/一系列視覺過程,産出新的視覺表達
産出:人或機器能夠感覺的圖像視訊,而不是标簽火特征;
要求:新的,和輸入的不一樣的

在過去我們使用一些視訊圖像軟體來生成他們,但是現在我們希望通過AI來自動生成這些。
視覺生産分類
生成:從0到1
拓展:從1到N
摘要:從N到1
升維:從An到An+1
增強/變換:從A到B
插入/合成:A+B=C
擦除:A-B=C
視覺生産通用架構
視覺生産五個關鍵次元
1.(可看)滿足視覺/沒學表現
2.(合理)合乎語義/内容邏輯
3.(多樣)保證結果的多樣性
4.(可控)提供使用者預期的抓手
5.(可用)帶來使用者/商業價值
二、精細了解
分割摳圖
1. 識别:知道是什麼
例:人的識别、物的識别
2. 檢測:識别+知道在哪
例:缺陷檢測、多目标檢測
3. 分割:識别+檢測+知道每一個像素是什麼
視覺分割是生産的必要前置步驟
例:全景分割、病竈分割
分割摳圖難點
複雜背景
遮擋
邊緣反色
透明材質
多尺度目标
精細摳圖
主要問題:資料嚴重不足,标注成本高
解題思路:
**1. 複雜問題拆解:粗mask估計+精準matting
- 豐富資料樣本:設計圖像mask統一模型**
分割摳圖模型架構
3.視覺生成—從無到有
視覺生産—架構流程
下面是一些例子:
鹿班場景智能美工
鹿班行業設計
視覺生産—AlibabaWood(短視訊生成)
視訊生成—架構流程
4.視覺編輯—移花接木
例1. 視訊植入
視覺編輯—視訊内容擦除
5.視覺增強—修舊如新
**例1. 人臉修複增強
例2. 渲染超分
例3. 視訊超分
例4. 視訊插幀
例5. HDR色彩拓展
例6. 風格遷移**
例7. 顔色拓展
6.視覺制造—由虛入實
實體設計制造缺點:
**效率低:多次打樣,多次溝通(平均更新時間長)
協同差:設計、有效、生成脫節
定制難:無法實作柔性生産**
AI視覺核心邏輯:
解決方案示例:神荼