視覺生産技術
視覺生産定義
通過一個或一系列視覺過程,産生新的視覺表達。
視覺生産分類
生成:從0到1
拓展:從1到N
摘要:從N到1
升維:從An到An+1
增強/變換
插入/合成
擦除
視覺生産通用架構
視覺生産五個關鍵次元
滿足視覺美學表現,可看
合乎語義内容邏輯
保證結果豐富性
提供使用者預期的抓手,可控
帶來使用者和商業價值
精細了解
精細了解 分割摳圖
視覺分割是生産的必要前置步驟,唯有了解方能生成。
識别:知道是什麼
檢測:識别+知道在哪裡
分割:識别+檢測
分割摳圖 難點
複雜背景
遮擋
發絲精扣
邊緣反色
透明材質
多尺度,多目标
資料嚴重不住,标注成本高
分割摳圖 解題思路
語義分割
執行個體分割
image matting
分割摳圖 模型架構
step1 mask粗分割
step2 mask品質統一
step3 估計精确alpha
分割摳圖 摳圖擴充
人像-分割不同區域
物體摳圖
場景
視覺生成
平面圖像設計生成——鹿班
架構流程:
需求-草圖-選狀态-調細節-生成-評價
樣例:電商需求設計,照圖生圖,個性化設計,智能美工,
視訊生成——AlibabaWood
素材準備-基礎特效-智能特效-智能編排
樣例:視訊封面,商品展示
視覺編輯
視訊的增删查改
視訊植入:廣告位檢測定位,廣告位跟蹤,遮擋,透視,素材比對,光影渲染
動态檢測分割
視訊内容擦除
擦除字幕,台标,廣告,場景文字
流程:
定位-分割-充填-訓練
畫幅變化
視訊畫幅變化:主體檢測分割+背景拉伸+背景補全+智能構圖裁剪+超分辨率=多保留有效畫面
圖像尺寸變化
視覺增強
主要包括:人臉增強,去噪聲,通用場景超分,LDR升HDR,視訊插幀等
人臉增強
場景超分
顔色擴充
視覺制造
包裝設計
服裝設計:3d,材質工藝,紋理圖案遷移,流行色,背景融合
視覺智能開放平台
vision
規模化、多樣化、細粒度、場景化