阿裡雲高校計劃視覺AI五天訓練營教程 Day 1

視覺生産技術

一、定義和分類

定義：通過一個/一系列視覺過程，産出新的視覺表達

産出：人或機器能夠感覺的圖像視訊，而不是标簽和物證

要求：新的和輸入的不一樣

分類：從0到1

拓展：從1到N

摘要：從N到1

升維：從An到An+1

增強/變換：從A到B
插入/合成：A+B=C
擦除：A-B=C

通用基礎架構

輸入(請求 Request)

生産類型（分發 Dispatch）

視覺生産引擎（服務Service）

輸出圖像/視訊/3D（響應Response）

五個關鍵次元

1、滿足視覺/美學表現｛可看｝

2、合乎語義/内容邏輯｛合理｝

3、保證結果的豐富性｛多樣｝

4、提供使用者預期的抓手｛可控｝

5、帶來使用者/商業價格｛可用｝

二、精細了解-尋微入裡

1、識别知道是什麼

2、檢測識别+知道在哪兒

3、分割：識别+檢測+知道每一個像素是什麼

分割摳圖-難點

複雜背景、遮擋、發絲精摳、邊緣反色、透明材質、多尺度/目标

分割摳圖-解題思路

1、複雜問題拆解：粗mask估計+精準matting

2、豐富資料樣本：設計圖像mask統一模型

分割摳圖-模型架構

1、mask粗分割

2、mask品質統一

3、估計精确alpha

分割摳圖-效果展示

分割摳圖-人像摳圖拓展

分割摳圖-物體摳圖拓展

細節部分處理

分割摳圖-場景摳圖拓展

3、視覺生成-從無到有

視覺生成-鹿班

平面圖像設計生成

鹿班是視覺生成領域在業界落地的先行者，對外提供大規模線上的AI設計服務；

視覺生成——架構流程

視覺生成-鹿班電商設計

照圖生圖：參考原圖，将風格、布局等資訊學習并遷移到目标資料上；

個性化設計：多元化設計風格，結合商品品類、投放場景、目标客群的差異設計訂制化設計

視覺生成-鹿班場景智能美工

鹿班在各行業中的應用

視訊、娛樂、母嬰等

視覺生成-AlibabaWood

視訊生成-架構流程

視覺生成-視訊封面

可以對視訊内容全自動完成品質稽核、内容分析與圖像增強，輸出多幀靜止或動圖。

圖像增強：在内容了解的基礎上裁剪或組合。

内容分析：基于深度學習的語義分析，根據吸引力挑選内容。

品質稽核：根據模糊、爆光等因素過濾低質圖像。

4、視覺編輯-移花接木

視覺編輯-視訊植入

挖掘視訊核心價值：擴充廣告爆光管道，創新廣告形式，提升使用者體驗。電視劇植入

擴大植入覆寫範圍：自動化批量處理視訊内容，挖掘海量短視訊、UGC内容等的廣告價值，擴大植入内容的覆寫面。電影植入

提升植入效果效率：取代手工後期，縮短植入周期，降低人力成本，給廣告招商留出充足時間，且不需要修改與流出媒資。綜藝植入

考慮各個環節細節

視覺編輯-動态檢測分割

自動檢測到要處理的部分

視覺編輯-視訊内容擦除

相關實用技術：字幕擦除、台标擦除、廣告擦除、場景文字擦除、人體擦除

核心挑戰與亮點粗定位、精分割、像素填充、線上訓練

視覺編輯-文字擦除

去掉後期字幕去掉原生文字

提升視訊效果

視覺編輯-Logo擦除

視訊某邊角的平台Logo 擦除，

去掉廣告（區域大，辨別無限）

去掉台标（辨別有限）

視覺編輯-畫幅變化

主體檢測分割+背景拉伸+背景補全+智能構圖裁剪+超分辨率=多保留50%有效畫面；

視覺編輯-圖像尺寸變化

5、視覺增強-修舊如新

視覺增強-視訊增強

視覺增強-人臉修複增強

人臉是最重要的目标對象，對人像進行細節修複增強，有很重要的意義和價值。如提升清晰度

視覺增強-視訊超分

整體提高視訊分辨率

視覺增強-視訊插幀

視覺增強-HDR色彩擴充

提升色彩透亮

視覺增強-風格遷移

視覺遷移-顔色拓展

6、視覺制造-由虛入實

實體設計制造

視覺制造-核心編輯

視覺制造-包裝幾何生成

視覺制造-材質工藝

視覺制造-視覺遷移及融合

視覺制造-多樣化拓展

視覺制造-2D3D融合

7、視訊智能開放平台-萬劍歸宗

官網：vision.aliyun.com

通過以上的内容對視覺已經有了初步的認知

每天進步一點點！

阿裡雲高校計劃視覺AI五天訓練營教程 Day 1

視覺生産技術

一、定義和分類

二、精細了解-尋微入裡

3、視覺生成-從無到有

4、視覺編輯-移花接木

5、視覺增強-修舊如新

6、視覺制造-由虛入實

7、視訊智能開放平台-萬劍歸宗

繼續閱讀

K-近鄰算法以及圖像分類應用

小i機器人受邀赴韓交流，CFO首爾亞洲金融論壇演講

吳恩達deeplearning

吳恩達logistic回歸實作

【人工智能行業大師訪談1】吳恩達采訪 Geoffery Hinton

吳恩達機器學習筆記（3）

吳恩達j機器學習之過拟合

吳恩達機器學習(一) 介紹

深度學習模型分析人類複雜疾病的準确性

疾病研究：重症肌無力

人工智能如何有效地運用于自然語言處理

新聞 | Mapbox 牽手阿裡，飛豬旅行上線六大城市地圖功能

[HTML5]自定義屬性 data-* 和 jQuery.data 詳解

2021-2025年中國運動療法（KT）帶行業市場供需與戰略研究報告

2021年危險化學品經營機關安全管理人員考試題庫及危險化學品經營機關安全管理人員考試技巧

無人機--飛控科普