天天看點

計算機視覺前沿技術探索

計算機視覺軟體正在改變行業,使使用者的生活變得不僅更容易,而且更有趣。作為一個有潛力的領域,計算機視覺已經獲得了大量的投資。北美計算機視覺軟體市場的總投資額為1.2億美元,而中國市場則飙升至39億美元。讓我們來看看一些最有前途和更有趣的技術,因為這些技術可以讓計算機視覺軟體開發市場增長的更快。 一、深度學

深度學習因其在提供準确結果方面而廣受歡迎。

傳統的機器學習算法盡管很複雜,但其核心仍然非常簡單。他們的訓練需要大量的專業領域的知識和資料(這是昂貴的),在訓練發生錯誤時需要進行人為幹預,而且,他們隻擅長于他們接受過訓練的任務。

另一方面,深度學習算法通過将任務映射為概念層次結構的神經元網絡了解手頭的任務。每個複雜的概念都由一系列更簡單的概念組合定義,而所有這些算法都可以自己完成。在計算機視覺的背景下,圖像分類需要首先識别亮區和暗區,然後在移向全畫面識别之前對線進行分類,然後進行形狀分類。

計算機視覺前沿技術探索

當你為他們提供更多資料時,深度學習算法也會表現得更好,這是典型的機器學習算法做不到的。對于計算機視覺,深度學習是一個好的方向。它不僅允許在深度學習算法的訓練中使用更多的圖檔和視訊,而且還減輕了許多與注釋和标記資料相關的工作。

零售業一直是實施計算機視覺軟體的先驅。2017年,ASOS在為他們的應用添加了一個按照照片搜尋的選項,之後許多零售商都跟進了。有些人甚至更進一步,并使用計算機視覺軟體将線上和離線體驗更緊密地結合在一起。

一家名為Lolli&Pops的美食糖果零售商使用面部識别來識别經常走進商店的購物者。是以,商店的員工可以通過提供個性化的産品推薦和千人千面的折扣來個性化購物體驗。

特殊待遇可以提升品牌忠誠度,并将偶爾的購物者轉變為經常性購物者。

二、邊緣計算的興

連接配接到網際網路和雲的機器能夠從整個網絡收集的資料中學習并相應地進行調整,進而優化系統的性能。但是,并不能保證機器能夠始終連接配接到網際網路和雲,這就是邊緣計算的用武之地。

邊緣計算是指附接到實體機器的技術,例如瓦斯輪機,噴氣發動機或MRI掃描器。它允許在收集資料的地方處理和分析資料,而不是在雲中或資料中心。

邊緣計算不能取代雲。它隻是允許機器在需要時單獨處理新的資料。換句話說,邊緣的機器可以根據自己的經驗學習和調整,而不依賴于更大的網絡。

邊緣計算解決了網絡可通路性和延遲的問題。在邊緣計算的發展下,裝置可以放置在網絡連接配接不良或不存在的區域,此外,邊緣計算還可以抵消用于資料共享的雲計算的使用和維護的一些成本。

對于計算機視覺軟體,這意味着可以實時更好地響應,并且隻将相關資料發送到雲中進行進一步分析,此功能對自動駕駛汽車特别有用。

為了安全運作,車輛将需要收集和分析與其周圍環境,方向和天氣狀況有關的大量資料,更不用說與路上的其他車輛通信,所有這些都沒有延遲。如果通過雲中心化的解決方案來分析資料可能很危險,因為延遲可能導緻事故。

三、點雲( point cloud )對 識别

最近在對象識别和對象跟蹤中更頻繁使用的技術是點雲。簡而言之,點雲是在三維坐标系内定義的資料點的集合。

該技術通常在空間(例如房間或容器)内使用,其中每個對象的位置和形狀由坐标清單(X,Y和Z)表示,坐标清單稱為“點雲”。

計算機視覺前沿技術探索
該技術準确地表示了物體在空間中的位置,并且可以精确地跟蹤任何移動。點雲的應用是無止境的。以下是一些行業的例子以及他們從這項技術中獲得的好處:

  • ·      

    記錄:資産監測,跟蹤施工現場,故意破壞檢測;

  • 分類:城市規劃,審計工具,便于分析,繪制必要的公用事業工作
  • 變更檢測:資産管理,貨物跟蹤,自然災害管理。
  • 預測性維護:持續監控資産和基礎設施,以預測何時需要維修。
四、融合現實:VR和AR增強

今天,任何VR或AR系統都會建立一個沉浸式3D環境,但它與使用者所處的真實環境幾乎沒有關系。大多數AR裝置可以執行簡單的環境掃描(例如,Google ARCore可以檢測平面和光線條件的變化),VR系統可以通過頭部跟蹤,控制器等檢測使用者的運動,但他們的功能也就這樣了。

計算機視覺軟體正在推動VR和AR進入下一階段的開發,有些人稱之為Merged Reality(MR)。

借助外部攝像頭和傳感器映射環境,以及眼動跟蹤解決方案和陀螺儀來定位使用者,VR和AR系統能夠:

  • 感覺環境并引導使用者遠離牆壁,物品或其他使用者等障礙物。
  • 檢測使用者的眼睛和身體運動并相應地采用VR環境。
  • 提供室内環境,公共場所,地下等的指引。

Lowe's五金店已在他們的商店中使用它,每個購物者都可以借用AR裝置來制作他們的購物清單,并獲得商店中每件商品的訓示。AR裝置可以實時使用樓層平面圖,庫存資訊和環境映射以給出準确的訓示。

我們也可以通過實時3D面部識别功能更新虛拟藝術家應用程式,讓客戶可以看到不同的化妝産品在他們的臉上和不同光線條件下的外觀。

五、語義執行個體分割

為了了解語義執行個體分割是什麼,讓我們首先将這個概念分為兩​​部分:語義分割和執行個體分割。

執行個體分割在像素級别識别對象輪廓,而語義分割僅将像素分組到特定對象組。讓我們使用氣球圖像來說明與其他技術相比的兩種技術:

計算機視覺前沿技術探索
  • 分類:此圖像中有一個氣球;
  • 語義分割:這些都是氣球像素;
  • 物體檢測:此圖像中有7個氣球,我們開始考慮重疊的對象;
  • 執行個體分割:這些位置有7個氣球,這些是屬于每個氣球的像素;

如果放在一起,語義執行個體分割方法将成為一個強大的工具。該工具不僅可以檢測屬于圖檔中對象的所有像素,還可以确定哪些像素屬于哪個對象以及對象所在的圖檔中的位置。

語義執行個體分割是土地覆寫分類的有用工具,具有各種應用。通過衛星圖像進行的土地制圖可以用于政府機構監測森林砍伐(特别是非法),城市化交通等。

許多建築師事務所也将這些資料用于城市規劃和建築開發,有些人甚至更進一步将其與AR裝置相結1合,以了解他們的設計在現實生活中的樣子。

本文由

阿裡雲雲栖社群

組織翻譯。

文章原标題《trends-computer-vision-technology-applications》

作者:

Valeryia Shchutskaya

  譯者:虎說八道,審校:。

文章為簡譯,更為詳細的内容,請檢視

原文

繼續閱讀