天天看点

3. 2020年《DeepMind&UCL深度学习讲座》第3讲:卷积神经网络的图像识别【中文字幕】

2020年《DeepMind&UCL深度学习讲座》第3讲:卷积神经网络的图像识别【中文字幕】

在之前的演讲之后,DeepMind研究科学家Viorica Patraucean介绍了图像分类以外的经典计算机视觉任务(对象检测,语义分割,光流估计),并描述了每种模型的最新状态以及标准基准。她讨论了用于视频处理,例如动作识别,跟踪和相关挑战的任务的类似模型。特别是,她提到了最近的工作,以提高视频处理效率,包括使用强化学习的元素。接下来,她描述了在单模式和多模式(视觉+音频,视觉+语言+语言)设置中进行自我监督学习的各种设置,其中大规模是有益的。 Viorica最后讨论了视觉方面的开放性问题以及计算机视觉研究在构建智能代理这一更广泛目标中的作用。

在此处下载幻灯片:

https://storage.googleapis.com/deepmind-media/UCLxDeepMind_2020/L4%20-%20UCLxDeepMind%20DL2020.pdf

在此处了解有关DeepMind如何增加科学获取机会的更多信息:

https://deepmind.com/about#access_to_science

演讲者简介:

Viorica是DeepMind的研究科学家,主要研究与计算机视觉相关的问题,重点是视频处理。她在法国图卢兹(Toulouse)攻读图像处理的统计模型博士学位,然后在巴黎和剑桥的博士后工作中专注于3D形状和视频分析。她的梦想是为人类视觉系统创建计算模型做出贡献。

关于讲座系列:

深度学习讲座系列是DeepMind与UCL人工智能中心之间的合作。在过去的十年中,深度学习已发展成为领先的人工智能范式,使我们能够以前所未有的准确性和规模从原始数据中学习复杂的功能。深度学习已应用于对象识别,语音识别,语音合成,预测,科学计算,控制等问题。由此产生的应用程序触动了我们在医疗保健和医学研究,人机交互,通信,运输,保护,制造以及许多其他人类努力领域中的一生。认识到这一巨大影响,深度学习的先驱获得了2019年图灵奖,这是计算机领域的最高荣誉。

在本系列讲座中,来自领先的AI研究实验室DeepMind的研究科学家针对深度学习中的一系列令人兴奋的主题进行了12次讲座,内容涵盖了通过围绕记忆,注意力和生成建模的先进思想来训练神经网络的基础知识,以及重要的负责任的创新主题。

继续阅读