視覺生産技術
一、定義和分類
定義:通過一個/一系列視覺過程,産出新的視覺表達
産出:人或機器 能夠感覺的圖像視訊,而不是标簽和物證
要求:新的和輸入的不一樣
分類:從0到1
拓展:從1到N
摘要:從N到1
升維:從An到An+1
增強/變換:從A到B
插入/合成:A+B=C
擦除:A-B=C
通用基礎架構
輸入(請求 Request)
生産類型(分發 Dispatch)
視覺生産引擎(服務Service)
輸出 圖像/視訊/3D(響應Response)
五個關鍵次元
1、滿足視覺/美學表現{可看}
2、合乎語義/内容邏輯{合理}
3、保證結果的豐富性{多樣}
4、提供使用者預期的抓手{可控}
5、帶來使用者/商業價格{可用}
二、精細了解-尋微入裡
1、識别 知道是什麼
2、檢測 識别+知道在哪兒
3、分割: 識别+檢測+知道每一個像素是什麼
分割摳圖-難點
複雜背景、遮擋、發絲精摳、邊緣反色、透明材質、多尺度/目标
分割摳圖-解題思路
1、複雜問題拆解:粗mask估計+精準matting
2、豐富資料樣本:設計圖像mask統一模型
分割摳圖-模型架構
1、mask粗分割
2、mask品質統一
3、估計精确alpha

分割摳圖-效果展示
分割摳圖-人像摳圖拓展
分割摳圖-物體摳圖拓展
細節部分處理
分割摳圖-場景摳圖拓展
3、視覺生成-從無到有
視覺生成-鹿班
平面圖像設計生成
鹿班是視覺生成領域在業界落地的先行者,對外提供大規模線上的AI設計服務;
視覺生成——架構流程
視覺生成-鹿班電商設計
照圖生圖:參考原圖,将風格、布局等資訊學習并遷移到目标資料上;
個性化設計:多元化設計風格,結合商品品類、投放場景、目标客群的差異設計訂制化設計
視覺生成-鹿班場景智能美工
鹿班在各行業中的應用
視訊、娛樂、母嬰等
視覺生成-AlibabaWood
視訊生成-架構流程
視覺生成-視訊封面
可以對視訊内容全自動完成品質稽核、内容分析與圖像增強,輸出多幀靜止或動圖。
圖像增強:在内容了解的基礎上裁剪或組合。
内容分析:基于深度學習的語義分析,根據吸引力挑選内容。
品質稽核:根據模糊、爆光等因素過濾低質圖像。
4、視覺編輯-移花接木
視覺編輯-視訊植入
挖掘視訊核心價值:擴充廣告爆光管道,創新廣告形式,提升使用者體驗。 電視劇植入
擴大植入覆寫範圍 :自動化批量處理視訊内容,挖掘海量短視訊、UGC内容等的廣告價值,擴大植入内容的覆寫面。電影植入
提升植入效果效率:取代手工後期,縮短植入周期,降低人力成本,給廣告招商留出充足時間,且不需要修改與流出媒資。綜藝植入
考慮各個環節細節
視覺編輯-動态檢測分割
自動檢測到要處理的部分
視覺編輯-視訊内容擦除
相關實用技術 :字幕擦除、台标擦除、廣告擦除、場景文字擦除、人體擦除
核心挑戰與亮點 粗定位、精分割、像素填充、線上訓練
視覺編輯-文字擦除
去掉後期字幕 去掉原生文字
提升視訊效果
視覺編輯-Logo擦除
視訊某邊角的平台Logo 擦除,
去掉廣告 (區域大,辨別無限)
去掉台标(辨別有限)
視覺編輯-畫幅變化
主體檢測分割+背景拉伸+背景補全+智能構圖裁剪+超分辨率=多保留50%有效畫面;
視覺編輯-圖像尺寸變化
5、視覺增強-修舊如新
視覺增強-視訊增強
視覺增強-人臉修複增強
人臉是最重要的目标對象,對人像進行細節修複增強,有很重要的意義和價值。如提升清晰度
視覺增強-視訊超分
整體提高視訊分辨率
視覺增強-視訊插幀
視覺增強-HDR色彩擴充
提升色彩 透亮
視覺增強-風格遷移
視覺遷移-顔色拓展
6、視覺制造-由虛入實
實體設計制造
視覺制造-核心編輯
視覺制造-包裝幾何生成
視覺制造-材質工藝
視覺制造-視覺遷移及融合
視覺制造-多樣化拓展
視覺制造-2D3D融合
7、視訊智能開放平台-萬劍歸宗
官網:vision.aliyun.com
通過以上的内容對視覺已經有了初步的認知
每天進步一點點!