視覺生産
一、定義:通過一個/一系列視覺過程,産出新的視覺表達
輸入(參數/素材)->(視覺生産)過程->産出(素材/成品)
二、.分類:1.生成:0->1;2.拓展:1->n 3.摘要n->1; 4.升維An->An+1 5.增強/變換:A->B; 6.插入/合成:A+B=C; 7.擦除:A-B=C
三、通用基礎架構
Request->Dispatch->Service->Response
四、五個關鍵次元
1.滿足視覺/美學表現(可看)
2.合乎語義/内容邏輯(合理)
3.保證結果的豐富性(多樣)
4.提供預期的抓手(可控)
5.*帶來使用者/商業價值(可用)
精細了解
一、分割摳圖
1.識别 2.檢測 3.分割
二、難點
資料嚴重不足,标注成本高
三、解題思路
1.複雜問題拆解:粗mask+精matting
2.豐富資料樣本
四、應用場景
頭發絲、相似背景、其他物體摳圖..
視覺生成
一、架構流程
1.理需求->2.定草圖->3.選狀态->4.調細節->5.生成圖->6.評好壞
二、鹿班場景智能美工
1.人工還原機器學習:JPG->PSD
2.模闆創作機器人:1PSD->100PSD
3.圖檔合成機器人:PSD->PNG
三、視訊
視訊封面
視覺編輯
一、視訊植入
廣告:核心挑戰與亮點:
位置、透視、尺寸、遮擋、時間
二、動态檢測分割
三、視訊内容擦除
核心挑戰與亮點:
粗定位-精分割-像素填充-線上訓練
應用:文字擦除、logo擦除
四、畫幅變化
主體檢測分割+背景拉伸+背景補全+智能構圖裁剪+超分辨率
視覺增強
一、視訊、圖檔增強
單點核心技術:人臉增強
核心挑戰:分辨率、幀率、色彩
二、視訊、圖檔超分
視訊插幀、HDR色彩擴充
三、風格遷移、顔色拓展
視覺制造
一、實體設計制造
幾何生成、視覺遷移及融合、多樣性拓展、2D3D融合
視覺智能開放平台
https://vision.aliyun.com/