阿裡雲視覺AI 5天實踐訓練營

2020-09-23 23:50:00

1.視覺生産技術分類

生成：從無到有。

拓展：已經存在，拓展到更多。

摘要：濃縮在一起，提取出重要的部分。

升緯：比如圖像為2D，加上時間軸，就是2D加t。也可以是2D變3D。

增強/變換：一張圖通過增強或者變換得到另一張圖。

插入/合成：兩張圖合成或者一張圖插入一些内容。

擦除：就是去除一些内容。

2.視覺生産—通用基礎架構

截屏2020-09-24 上午11.25.47.png

3.五個關鍵緯度

可看：滿足美學表現。

合理：符合邏輯和語義。

多樣：結果豐富多樣。

可控：使用者提供參數可控結果。

可用：可以實際應用。

4.分割

想要進行視覺生産最基礎的就是分割。分割分為三步，第一步是識别需要知道這張圖是什麼？第二步，檢測需要知道問題和處理的地方在哪？第三步就是分割，知道每個像素都是些什麼東西，分割的難點在于資料不足，标注成本高。

分割大概有三種，第一是語義分割知道他是什麼類型的，比如知道一張圖檔裡面這是一個人。第二個是執行個體分割，比如知道那個人是誰？第三個是Matting。對于一些較難的複雜問題，一般進行拆分方法先粗mask估計，然後再精準的maltting。

5.視覺生成

除了分割，還有從無到有即視覺生成，比如有視訊摘要，将視訊中的重要部分選出來。視覺編輯，即可以在視訊中加入植入等，其它的還有動态分割，将視訊中指定的物品配出來、視訊内容擦除，比如擦掉模糊的字幕，logo等。還有畫幅變化、圖像尺寸變化等。

6.視覺增強

視訊增強、人臉修複、視訊插幀、HDR色彩擴充、風格遷移、顔色拓展等。

7.視覺制造

幾何生成，和傳統工業相結合、視覺遷移、多樣性拓展等

以短視訊設計生成平台——為例

架構流程

1、準備素材（場景選擇、關聯商品、素材準備、參數設定）

2、視訊算法（可以使用編輯器微調。核心）

3、渲染合成（将已編排好的視訊進行視訊合成後渲染出成品）

4、投放上傳平台

視訊摘要

将生成的視訊或原已有的視訊或多個視訊進行關鍵摘要（如15秒摘要，30秒摘要，60秒摘要等）

視訊封面

圖像增強：在内容了解的基礎上對圖檔進行裁剪群組合。

内容分析：通過AI的分析功能來對全視訊進行内容分析和挑選。

品質稽核：将模糊、曝光等低品質圖像進行過濾。

完成以上一系列操作後來抓取生成多幀靜止圖或動圖。随後可以進行各個平台的分發。

視覺編輯

視訊植入

PS:我個人認為這個功能比較有意思

場景：電視劇植入、電影植入、綜藝植入等。

可以将廣告内容與宿體内容本身不太符合的廣告以沒有太多【違和感】的形式植入，使廣告的植入範圍變得更廣，大大提升了廣告的植入效率，并且不會給使用者造成太大的反感。

阿裡雲視覺AI 5天實踐訓練營

繼續閱讀

新聞 | Mapbox 牽手阿裡，飛豬旅行上線六大城市地圖功能

241 Different Ways to Add Parentheses（C代碼版）

【趨高機器視覺】機器視覺技術原了解析及解決方案

CSMA/CD1． CSMA/CD的概述2． CSMA 的工作原理3． CSMA/CD控制規程及特點4． CSMA/CD協定5． CSMA/CD的優點6．結束語

極大似然法(ML)與最大期望法(EM)

[HTML5]自定義屬性 data-* 和 jQuery.data 詳解

2021-2025年中國運動療法（KT）帶行業市場供需與戰略研究報告

cs231n斯坦福基于卷積神經網絡的CV學習筆記（一）KNN和線性分類器/分類器損失/反向傳播一，KNN圖像分類算法二，線性分類器三，線性分類器損失四，反向傳播五，神經網絡

C++ 第十五周報告1--《冒泡法排序》

2021年危險化學品經營機關安全管理人員考試題庫及危險化學品經營機關安全管理人員考試技巧

筆試面試題目：滑動視窗(二)

資料結構與算法（27）——排序（二）

無人機--飛控科普

Dijkstra--簡易版（最短路徑）

GitHub連夜封殺！這份阿裡 10W 字内部 Java 字面試手冊到底有多強？

hdu7108哈希