天天看點

什麼是計算機視覺?它到底有多牛?

作者:優雅雪梨9HO
什麼是計算機視覺?它到底有多牛?

幾十年來,人們一直夢想着創造出具有人類智能特征的機器,那些能像人類一樣思考和行動的機器,而其中最吸引人的想法之一是賦予計算機“看到”并解讀周圍世界的能力。

由于人工智能和計算能力的進步,計算機視覺技術在融入我們的日常生活方面取得了巨大的飛躍。

在本文中,我們将回顧計算機視覺的概念,讨論這項技術是如何發展的,并分享一些将這項技術應用于我們生活中的優秀例子。

#01

什麼是計算機視覺?

計算機視覺是計算機科學的一個領域,專注于建立能夠以與人類相同的方式處理、分析和了解視覺資料(圖像或視訊)的數字系統。

計算機視覺的概念是基于教計算機處理像素級的圖像并了解它,從技術上講,機器試圖檢索視覺資訊,處理它,并通過特殊的軟體算法解釋結果。

什麼是計算機視覺?它到底有多牛?

以下是計算機視覺系統可用于的一些常見任務:

O對象分類:系統解析可視化内容,并将照片/視訊上的對象分類到定義的類别中。例如,系統可以在圖像中的所有物體中找到一隻狗。

O 對象辨別:該系統解析可視内容并識别照片/視訊上的特定對象。例如,系統可以在圖像中的狗中找到特定的狗。

O 對象跟蹤:系統處理視訊,找到符合搜尋條件的對象(或多個對象)并跟蹤其運動。

#02

計算機視覺是如何工作的?

計算機視覺技術傾向于模仿人類大腦的工作方式。但是我們的大腦是如何解決視覺物體識别的呢?其中一個流行的假設是,我們的大腦依靠模式來解碼單個物體。這個概念被用于建立計算機視覺系統。

我們今天使用的計算機視覺算法是基于模式識别的。我們在大量的視覺資料上訓練計算機——計算機處理圖像,在圖像上标記對象,并在這些對象中找到模式。例如,如果我們發送一百萬張花的圖像,計算機将分析它們,識别出與所有花相似的圖案,在這個過程的最後,将建立一個模型“花”。是以,每當我們發送圖檔給計算機時,計算機将能夠準确地檢測出特定的圖像是否是一朵花。

Golan Levin在他的文章《圖像處理和計算機視覺》中提供了機器在解釋圖像時所遵循的過程的技術細節。簡而言之,機器将圖像解釋為一系列像素,每個像素都有自己的一組顔色值。

例如,下面是一張亞伯拉罕·林肯的照片。該圖像中每個像素的亮度由單個8位數字表示,範圍從0(黑色)到255(白色)。當你輸入圖像時,軟體會看到這些數字。這些資料作為輸入提供給計算機視覺算法,該算法将負責進一步的分析和決策。

什麼是計算機視覺?它到底有多牛?

#03

計算機視覺的發展

計算機視覺并不是一項新技術。

計算機視覺的第一次實驗始于20世紀50年代,當時,它被用來解釋打字和手寫的文本。當時,計算機視覺分析程式相對簡單,但需要人工操作員進行大量工作,他們必須手動提供資料樣本進行分析,然而在手動執行時很難提供大量資料。另外,計算能力不夠好,是以這個分析的誤差範圍相當高。

今天,我們并不缺乏計算機能力——雲計算加上強大的算法,甚至可以幫助我們解決最複雜的問題。但是,推動計算機視覺技術向前發展的不僅僅是與複雜算法相結合的新硬體,我們每天産生的大量公開可用的視覺資料是這項技術最近發展的原因。

據《福布斯》報道,使用者每天在網上分享超過30億張圖檔,這些資料被用來訓練計算機視覺系統。

#04

深度學習的革命

為了了解計算機視覺技術的最新進展,我們需要深入研究該技術所依賴的算法。

現代計算機視覺依賴于深度學習,這是機器學習的一個特定子集,它使用算法從資料中收集見解。另一方面,機器學習依賴于人工智能,而人工智能是這兩種技術的基礎(檢視人工智能設計最佳實踐,了解更多關于人工智能設計的資訊)。

什麼是計算機視覺?它到底有多牛?

深度學習代表了一種更有效的計算機視覺方法——它使用一種稱為神經網絡的特定算法。

神經網絡用于從提供的資料樣本中提取模式,而這些算法的靈感來自于人類對大腦功能的了解,特别是大腦皮層中神經元之間的互相聯系。

神經網絡的核心是感覺器,它是生物神經元的數學表示。與大腦皮層中的生物神經元類似,有可能有幾層互相連接配接的感覺器。

輸入值(原始資料)通過感覺器建立的網絡傳遞,最終到達輸出層,這是一個預測,或者是對某個對象的高度有根據的猜測。例如,在分析結束時,機器可以以X%的置信度對對象進行分類。

什麼是計算機視覺?它到底有多牛?

#05

在哪裡應用計算機視覺技術

有些人認為計算機視覺是設計領域遙遠的未來。不正确的。計算機視覺已經融入我們生活的許多領域。以下是我們今天如何使用這項技術的幾個值得注意的例子:

内容組織

計算機視覺系統已經幫助我們組織我們的内容,Apple Photos就是一個很好的例子。

這款應用可以通路我們的照片收藏,它會自動為照片添加标簽,讓我們浏覽更有條理的照片收藏,蘋果照片的偉大之處在于,該應用程式為你建立了一個精心策劃的最佳時刻視圖。

什麼是計算機視覺?它到底有多牛?

面部識别

面部識别技術用于将人們的面部照片與他們的身份相比對。這項技術被內建到我們每天使用的主要産品中。例如,Facebook正在使用計算機視覺來識别照片中的人。

人臉識别是生物特征認證的一項關鍵技術,目前市場上的許多移動裝置都允許使用者通過顯示自己的臉來解鎖裝置。前置攝像頭用于面部識别;移動裝置處理該圖像,并根據分析,可以判斷持有該裝置的人是否在該裝置上獲得授權。

這項技術的美妙之處在于它的工作速度非常快。

增強現實

計算機視覺是增強現實應用程式的核心元素。

這項技術可以幫助AR應用實時檢測實體對象(給定實體空間内的表面和單個對象),并利用這些資訊将虛拟對象放置在實體環境中。

什麼是計算機視覺?它到底有多牛?

自動駕駛汽車

計算機視覺使汽車能夠感覺周圍環境。智能汽車有幾個攝像頭,可以從不同角度捕捉視訊,并将視訊作為輸入信号發送給計算機視覺軟體。

該系統對視訊進行實時處理,并檢測道路标記、汽車附近的物體(如行人或其他車輛)、交通信号燈等物體。這項技術最著名的應用之一就是特斯拉汽車的自動駕駛系統。

健康

圖像資訊是醫學診斷的關鍵要素,因為它占所有醫療資料的90%。健康方面的許多診斷都是基于圖像處理——x光、核磁共振成像和乳房x光檢查等,并在醫學掃描分析中驗證了圖像分割的有效性。

例如,計算機視覺算法可以檢測糖尿病視網膜病變,這是導緻失明的增長最快的原因。計算機視覺可以處理眼睛後部的圖檔(見下圖),并對疾病的存在和嚴重程度進行評估。

什麼是計算機視覺?它到底有多牛?

癌症檢測是另一個值得注意的例子。準确診斷不同類型的癌症至關重要。據谷歌稱,計算機視覺工具幫助檢測癌症轉移的精度比人類醫生高得多。

下圖是淋巴結活檢的特寫。組織中含有乳腺癌轉移竈以及看起來與惡性良性腫瘤相似但卻是良性的區域。計算機視覺算法成功地識别了惡性良性腫瘤區域(亮綠色),并且不會被看起來像惡性良性腫瘤的正常區域所混淆。

什麼是計算機視覺?它到底有多牛?

農業

許多農業組織采用計算機視覺來監測收成,并解決常見的農業問題,如雜草出現或營養缺乏。

計算機視覺系統處理來自衛星、無人機或飛機的圖像,并試圖在早期階段發現問題,這有助于避免不必要的經濟損失。

在有關新技術的文章中,計算機視覺是一個熱門話題。使用資料的不同方法使這項技術與衆不同。

我們每天創造的大量資料,有些人認為這是我們這一代人的詛咒,實際上這為我們帶來了許多利益——資料可以教會計算機看到和了解物體。

這項技術也表明,我們的文明在創造像人類一樣複雜的人工智能方面邁出了重要的一步。

Ref:

https://xd.adobe.com/ideas/principles/emerging-technology/what-is-computer-vision-how-does-it-work/

本文由WELLDESIGN獨家編輯,未經授權請勿轉載。

繼續閱讀