天天看点

什么是计算机视觉?它到底有多牛?

作者:优雅雪梨9HO
什么是计算机视觉?它到底有多牛?

几十年来,人们一直梦想着创造出具有人类智能特征的机器,那些能像人类一样思考和行动的机器,而其中最吸引人的想法之一是赋予计算机“看到”并解读周围世界的能力。

由于人工智能和计算能力的进步,计算机视觉技术在融入我们的日常生活方面取得了巨大的飞跃。

在本文中,我们将回顾计算机视觉的概念,讨论这项技术是如何发展的,并分享一些将这项技术应用于我们生活中的优秀例子。

#01

什么是计算机视觉?

计算机视觉是计算机科学的一个领域,专注于创建能够以与人类相同的方式处理、分析和理解视觉数据(图像或视频)的数字系统。

计算机视觉的概念是基于教计算机处理像素级的图像并理解它,从技术上讲,机器试图检索视觉信息,处理它,并通过特殊的软件算法解释结果。

什么是计算机视觉?它到底有多牛?

以下是计算机视觉系统可用于的一些常见任务:

O对象分类:系统解析可视化内容,并将照片/视频上的对象分类到定义的类别中。例如,系统可以在图像中的所有物体中找到一只狗。

O 对象标识:该系统解析可视内容并识别照片/视频上的特定对象。例如,系统可以在图像中的狗中找到特定的狗。

O 对象跟踪:系统处理视频,找到符合搜索条件的对象(或多个对象)并跟踪其运动。

#02

计算机视觉是如何工作的?

计算机视觉技术倾向于模仿人类大脑的工作方式。但是我们的大脑是如何解决视觉物体识别的呢?其中一个流行的假设是,我们的大脑依靠模式来解码单个物体。这个概念被用于创建计算机视觉系统。

我们今天使用的计算机视觉算法是基于模式识别的。我们在大量的视觉数据上训练计算机——计算机处理图像,在图像上标记对象,并在这些对象中找到模式。例如,如果我们发送一百万张花的图像,计算机将分析它们,识别出与所有花相似的图案,在这个过程的最后,将创建一个模型“花”。因此,每当我们发送图片给计算机时,计算机将能够准确地检测出特定的图像是否是一朵花。

Golan Levin在他的文章《图像处理和计算机视觉》中提供了机器在解释图像时所遵循的过程的技术细节。简而言之,机器将图像解释为一系列像素,每个像素都有自己的一组颜色值。

例如,下面是一张亚伯拉罕·林肯的照片。该图像中每个像素的亮度由单个8位数字表示,范围从0(黑色)到255(白色)。当你输入图像时,软件会看到这些数字。这些数据作为输入提供给计算机视觉算法,该算法将负责进一步的分析和决策。

什么是计算机视觉?它到底有多牛?

#03

计算机视觉的发展

计算机视觉并不是一项新技术。

计算机视觉的第一次实验始于20世纪50年代,当时,它被用来解释打字和手写的文本。当时,计算机视觉分析程序相对简单,但需要人工操作员进行大量工作,他们必须手动提供数据样本进行分析,然而在手动执行时很难提供大量数据。另外,计算能力不够好,所以这个分析的误差范围相当高。

今天,我们并不缺乏计算机能力——云计算加上强大的算法,甚至可以帮助我们解决最复杂的问题。但是,推动计算机视觉技术向前发展的不仅仅是与复杂算法相结合的新硬件,我们每天产生的大量公开可用的视觉数据是这项技术最近发展的原因。

据《福布斯》报道,用户每天在网上分享超过30亿张图片,这些数据被用来训练计算机视觉系统。

#04

深度学习的革命

为了了解计算机视觉技术的最新进展,我们需要深入研究该技术所依赖的算法。

现代计算机视觉依赖于深度学习,这是机器学习的一个特定子集,它使用算法从数据中收集见解。另一方面,机器学习依赖于人工智能,而人工智能是这两种技术的基础(查看人工智能设计最佳实践,了解更多关于人工智能设计的信息)。

什么是计算机视觉?它到底有多牛?

深度学习代表了一种更有效的计算机视觉方法——它使用一种称为神经网络的特定算法。

神经网络用于从提供的数据样本中提取模式,而这些算法的灵感来自于人类对大脑功能的理解,特别是大脑皮层中神经元之间的相互联系。

神经网络的核心是感知器,它是生物神经元的数学表示。与大脑皮层中的生物神经元类似,有可能有几层相互连接的感知器。

输入值(原始数据)通过感知器创建的网络传递,最终到达输出层,这是一个预测,或者是对某个对象的高度有根据的猜测。例如,在分析结束时,机器可以以X%的置信度对对象进行分类。

什么是计算机视觉?它到底有多牛?

#05

在哪里应用计算机视觉技术

有些人认为计算机视觉是设计领域遥远的未来。不正确的。计算机视觉已经融入我们生活的许多领域。以下是我们今天如何使用这项技术的几个值得注意的例子:

内容组织

计算机视觉系统已经帮助我们组织我们的内容,Apple Photos就是一个很好的例子。

这款应用可以访问我们的照片收藏,它会自动为照片添加标签,让我们浏览更有条理的照片收藏,苹果照片的伟大之处在于,该应用程序为你创建了一个精心策划的最佳时刻视图。

什么是计算机视觉?它到底有多牛?

面部识别

面部识别技术用于将人们的面部照片与他们的身份相匹配。这项技术被集成到我们每天使用的主要产品中。例如,Facebook正在使用计算机视觉来识别照片中的人。

人脸识别是生物特征认证的一项关键技术,目前市场上的许多移动设备都允许用户通过显示自己的脸来解锁设备。前置摄像头用于面部识别;移动设备处理该图像,并根据分析,可以判断持有该设备的人是否在该设备上获得授权。

这项技术的美妙之处在于它的工作速度非常快。

增强现实

计算机视觉是增强现实应用程序的核心元素。

这项技术可以帮助AR应用实时检测物理对象(给定物理空间内的表面和单个对象),并利用这些信息将虚拟对象放置在物理环境中。

什么是计算机视觉?它到底有多牛?

自动驾驶汽车

计算机视觉使汽车能够感知周围环境。智能汽车有几个摄像头,可以从不同角度捕捉视频,并将视频作为输入信号发送给计算机视觉软件。

该系统对视频进行实时处理,并检测道路标记、汽车附近的物体(如行人或其他车辆)、交通信号灯等物体。这项技术最著名的应用之一就是特斯拉汽车的自动驾驶系统。

健康

图像信息是医学诊断的关键要素,因为它占所有医疗数据的90%。健康方面的许多诊断都是基于图像处理——x光、核磁共振成像和乳房x光检查等,并在医学扫描分析中验证了图像分割的有效性。

例如,计算机视觉算法可以检测糖尿病视网膜病变,这是导致失明的增长最快的原因。计算机视觉可以处理眼睛后部的图片(见下图),并对疾病的存在和严重程度进行评估。

什么是计算机视觉?它到底有多牛?

癌症检测是另一个值得注意的例子。准确诊断不同类型的癌症至关重要。据谷歌称,计算机视觉工具帮助检测癌症转移的精度比人类医生高得多。

下图是淋巴结活检的特写。组织中含有乳腺癌转移灶以及看起来与肿瘤相似但却是良性的区域。计算机视觉算法成功地识别了肿瘤区域(亮绿色),并且不会被看起来像肿瘤的正常区域所混淆。

什么是计算机视觉?它到底有多牛?

农业

许多农业组织采用计算机视觉来监测收成,并解决常见的农业问题,如杂草出现或营养缺乏。

计算机视觉系统处理来自卫星、无人机或飞机的图像,并试图在早期阶段发现问题,这有助于避免不必要的经济损失。

在有关新技术的文章中,计算机视觉是一个热门话题。使用数据的不同方法使这项技术与众不同。

我们每天创造的大量数据,有些人认为这是我们这一代人的诅咒,实际上这为我们带来了许多利益——数据可以教会计算机看到和理解物体。

这项技术也表明,我们的文明在创造像人类一样复杂的人工智能方面迈出了重要的一步。

Ref:

https://xd.adobe.com/ideas/principles/emerging-technology/what-is-computer-vision-how-does-it-work/

本文由WELLDESIGN独家编辑,未经授权请勿转载。

继续阅读