一、視覺生産的定義
通過一個/一系列視覺過程,産出新的視覺表達。
産出新的,和輸入不一樣的人或機器能夠感覺的圖像視訊,而不是标簽或特征。

二、視覺生産的分類
三、視覺生産通用基礎架構
有請求,分發,服務,相應四大部分,基本架構如圖
四、視覺生産的五個關鍵次元
帶來使用者/商業價值(可用)
提供使用者預期的抓手(可控)
保證結果的豐富性(多樣)
合乎語義/内容邏輯(合理)
滿足視覺/美學表現(可看)
為一個金字塔式由下至上
五、精細了解,分割摳圖
識别:知道是什麼
檢測:識别+知道在哪兒
分割:識别+檢測+每一個像素是什麼
六、模型架構,解題思路
六、視覺生成架構流程
其大概過程包括理需求、定草圖、選狀态、調細節、生成圖、評好壞 6 個步驟
七、視覺編輯
有視訊植入,視訊内容擦除,畫幅變化,圖像尺寸變化與修舊如新
視訊植入:視訊植入就是在視訊中加入一些本來沒有的内容
視覺内容擦除:要從視訊中擦除一些東西(精确)
畫幅變化:變化之後為了有完整的視覺效果,進行内容補全
圖像尺寸變化:圖像尺寸的自動變化,友善應用于其他場景中
修舊如新:視覺增強就是對視訊的内容進行一些改變,以達到視訊某些方面的改善效果。
八、視覺增強(分辨率、幀率、色彩)
人臉修複增強、渲染圖超分、視訊超分、插幀、HDR色彩擴充、風格遷移
九、視覺制造
實體設計制造、服裝幾何生成、多樣性拓展等
總結:通過今天的學習,我學習到AI視覺的很多定義與相應的應用執行個體,了解了AI視覺的學習需要大量的資料訓練、精确的模型識别。