天天看點

視覺AI訓練營-第一天

視覺生産

一、定義:通過一個/一系列視覺過程,産出新的視覺表達

輸入(參數/素材)->(視覺生産)過程->産出(素材/成品)

二、.分類:1.生成:0->1;2.拓展:1->n 3.摘要n->1; 4.升維An->An+1 5.增強/變換:A->B; 6.插入/合成:A+B=C; 7.擦除:A-B=C

三、通用基礎架構

Request->Dispatch->Service->Response

四、五個關鍵次元

1.滿足視覺/美學表現(可看)

2.合乎語義/内容邏輯(合理)

3.保證結果的豐富性(多樣)

4.提供預期的抓手(可控)

5.*帶來使用者/商業價值(可用)

精細了解

一、分割摳圖

1.識别 2.檢測 3.分割

二、難點

資料嚴重不足,标注成本高

三、解題思路

1.複雜問題拆解:粗mask+精matting

2.豐富資料樣本

四、應用場景

頭發絲、相似背景、其他物體摳圖..

視覺生成

一、架構流程

1.理需求->2.定草圖->3.選狀态->4.調細節->5.生成圖->6.評好壞

二、鹿班場景智能美工

1.人工還原機器學習:JPG->PSD

2.模闆創作機器人:1PSD->100PSD

3.圖檔合成機器人:PSD->PNG

三、視訊

視訊封面

視覺編輯

一、視訊植入

廣告:核心挑戰與亮點:

位置、透視、尺寸、遮擋、時間

二、動态檢測分割

三、視訊内容擦除

核心挑戰與亮點:

粗定位-精分割-像素填充-線上訓練

應用:文字擦除、logo擦除

四、畫幅變化

主體檢測分割+背景拉伸+背景補全+智能構圖裁剪+超分辨率

視覺增強

一、視訊、圖檔增強

單點核心技術:人臉增強

核心挑戰:分辨率、幀率、色彩

二、視訊、圖檔超分

視訊插幀、HDR色彩擴充

三、風格遷移、顔色拓展

視覺制造

一、實體設計制造

幾何生成、視覺遷移及融合、多樣性拓展、2D3D融合

視覺智能開放平台

https://vision.aliyun.com/

繼續閱讀