视觉AI训练营(五天)

2020-09-23 23:50:00

视觉AI训练营第一天

(一)定义和分类

视觉理解，比如识别、检测、分割等；

视觉生产，也可以理解为怎么去产生视觉，指通过一个/ 一系列视觉过程，产出新的视觉表达。

我们希望通过技术实现过去由人工来完成的过程。

(二)主要应用

视觉生产主要包括生成、拓展、摘要、升维，另外还有增强/ 变换、插入/ 合成、擦除等。达摩院在该领域已经投入了很多人力和精力，也形成了一些产品，比如鹿班、画蝶、视觉智能开放平台等。

(三)通用基础框架

一般逻辑为，请求（Request）、分发（Dispatch）、服务（Service）和响应（Response）四大部分。

思路：

1.复杂问题拆解：粗mask估计+精准matting

2.丰富数据样本：设计图像mask统一模型

分析鹿班场景智能美工(平面)，AlibabWood(短视频)的框架流程，在各个行业的应用都会产生不同的效果，依据场景来进行赋能。

1.视觉编辑：主要包括增删查改等功能

2.视觉增强：对视频的内容进行一些改变，以达到视频某些方面的改善效果。

3.视觉制造：我们可以利用视觉制造技

术来解决实际生产过程中面临的效率低、协同差、定制难等问题。

阿里巴巴的视觉智能开放平台（vision.aliyun.com）