視覺生産概述
定義
通過一個/一系列視覺過程, 産出新的視覺表達
- 産出: 人或機器能夠感覺的圖像視訊, 而不是标簽或特征, 比如: 眼睛所看到的大熊貓的具體形象, 而不是口頭的一個符号.
- 要求: 輸出應該是經過加工的, 和輸入是不一樣的.
分類
- 生成: 從無到有
- 拓展: 從一到多
- 摘要: 從多到一
- 升維: 從靜态到動态
- 增強/變換, 插入/合成, 擦除.
通用架構

關鍵次元
- 可看: 滿足視覺
- 合理: 合乎語義
- 多樣: 結果豐富
- 可控: 提供預期
- 可用: 商業價值
技術簡介
分割摳圖
- 識别: 知道物體是什麼
- 檢測: 知道物體在什麼地方
- 分割: 知道圖像中的每一個像素是什麼
視覺分割是視覺生産的必要前置步驟.
- 難點: 複雜背景, 遮擋, 發絲, 邊緣反色, 多目标等.
- 思路:
複雜問題拆解: 粗mask估計+精準matting
豐富資料樣本: 設計圖像mask統一模型
- 模型:
mask粗分割
mask品質統一
估計精确alpha
視覺生成
- 架構
- 應用:
照圖生圖
個性話設計
短視訊設計: 場景化智能視訊, 規模化特效視訊,
視訊摘要, 視訊封面
視覺編輯
- 視訊植入: 比如廣告植入等.
- 植入位檢測與定位
- 動态檢測分割
- 視訊内容擦除: 字幕擦除, 台标擦除, 廣告擦除等.
- 畫幅變化, 圖像尺寸變化
視覺增強
- 人臉增強, 去噪聲等
- 渲染圖超分
- 視訊超分
- 視訊插幀
- HDR色彩擴充
- 風格遷移
- 顔色拓展
視覺制造
- 實體設計制造: 将數字化商品進行實體制造
- 包裝集合生成: 從2D變成3D的
- 材質工藝
- 視覺遷移及融合: 将紋理進行遷移等
- 多樣性拓展
- 2D與3D融合