天天看點

計算機視覺新手指南

通過機器的眼睛看

通過計算機或手機等機器觀察周圍環境的方法稱為計算機視覺。模拟人眼的嚴峻工作可以追溯到50年代,我們已經在這個領域走了很長一段路。計算機視覺已經通過不同的電子商務或相機應用進入到了我們的手機。

當機器擁有像人一樣的眼睛,機器将會做更多的事情。人眼有着複雜的結構,而通過眼睛觀察來了解環境是一個更加複雜的現象。以類似的方式,使機器能夠看到事物并使其具有足夠的能力以了解它們所看到的内容并進一步對其進行分類,仍然是一項艱巨的工作。

使用計算機視覺等效于眨眼間就可以進行數百萬次計算,其準确性幾乎與人眼相同。這不僅涉及将圖檔轉換為像素,然後嘗試通過這些像素了解圖檔中的内容,也将不得不首先了解如何從這些像素中提取資訊并了解其代表的内容。

計算機視覺新手指南

1、了解如何通過機器看

A.用數字表示顔色:在計算機科學中,每種顔色都由指定的十六進制值表示。這就是機器了解圖像像素組成顔色的一種編碼方式。而作為人類,我們擁有能力根據深淺來區分不同的顔色。

計算機視覺新手指南
B.圖像分割:計算機被用來識别相似的顔色組,然後分割圖像,即将前景與背景區分開。顔色漸變技術用于查找不同對象的邊緣。
計算機視覺新手指南
C.查找角點:分割後,然後查找圖像中的某些特定的特征,也可被稱為角點。簡而言之,算法會搜尋以一定角度相交的線,并以一種顔色的陰影覆寫圖像的特定部分。特征(也稱為角點)像是積木,可幫助查找圖像中包含的更詳細的資訊。
計算機視覺新手指南
D.查找紋理:正确識别圖像的另一個重要方面是區分圖像中的紋理。兩個對象之間的紋理差異使機器更容易正确地對對象進行分類。
計算機視覺新手指南
E.做出猜測:執行上述步驟後,機器需要做出大機率正确的猜測,并将圖像與資料庫中存在的圖像進行比對。
計算機視覺新手指南

F.最後看大圖:最後,一台機器會看到更大,更清晰的畫面,并根據所提供的算法說明檢查是否正确識别了該畫面。在過去的幾年中準确性得到了很大的提高,但是當機器要求處理帶有混合物體的圖像時,機器仍然會犯錯誤。

2、擁有計算機視覺研究組的大學

美國大學:

卡内基梅隆大學機器人學院

加州大學洛杉矶分校

北卡羅來納大學教堂山分校

華盛頓大學

加州大學伯克利分校

斯坦福大學

麻省理工學院

康奈爾大學

賓夕法尼亞大學

加州大學爾灣分校

哥倫比亞大學

伊利諾伊大學香槟分校

南加州大學

密西根大學

普林斯頓大學

羅切斯特大學

德克薩斯大學奧斯汀分校

馬裡蘭大學學院公園

布朗大學

中央佛羅裡達大學

紐約大學

密西根州立大學

麻省大學,阿默斯特

西北大學

加州大學聖地亞哥分校

加拿大大學:

艾伯塔大學

多倫多大學

不列颠哥倫比亞大學

西蒙弗雷澤大學

歐洲大學:

INRIA法國

牛津大學(http://www.robots.ox.ac.uk/~vgg/)

蘇黎世聯邦理工學院

德國馬克斯·普朗克研究所

愛丁堡大學

薩裡大學

弗萊堡大學

瑞典KTH

德累斯頓大學

達姆施塔特工業大學

瑞士EPFL

魯汶大學

巴塞羅那計算機視覺中心

瑞士IDIAP

倫敦帝國理工學院

海德堡國際機場

曼徹斯特大學

波昂大學

亞琛工業大學

阿姆斯特丹大學

慕尼黑工業大學

捷克技術大學

劍橋大學

格拉茨

IST奧地利

倫敦瑪麗皇後大學

蘇黎世大學

代爾夫特大學

利茲大學

伯爾尼大學

隆德大學

特倫托大學,意大利

意大利佛羅倫薩大學

斯圖加特大學

薩爾大學

巴黎中央學校

巴黎理工學院

奧盧大學

卡爾斯魯厄理工學院

3.如果是計算機視覺領域的新手,可以在下面找到一個必須了解的詳盡主題清單。

A.初學者水準

數學:

  1. 線性代數
  2. 奇異值分解
  3. 入門級模式識别
  4. 主成分分析
  5. 卡爾曼濾波
  6. 傅裡葉變換
  7. 小波

圖像處理:

  1. 杜克大學在Coursera上提供的線上課程
  2. 岡薩雷斯和伍茲的數字圖像處理

B.進階

  1. 線性判别分析
  2. 機率,貝葉斯規則,最大似然,MAP
  3. 混合物和期望最大化算法
  4. 入門級統計學習
  5. 支援向量機
  6. 遺傳算法
  7. 隐馬爾可夫模型
  8. 貝葉斯網絡

要獲得有關事物如何工作(尤其是算法)的實踐知識,需要從計算機視覺的角度開始學習OpenCV:

  • 學習OpenCV:使用OpenCV庫的計算機視覺
  • Tombone的計算機視覺部落格

提示:使用C,C ++,Python進行程式設計時,我們可以使用OpenCV庫實作計算機視覺相關操作。在使用MATLAB進行程式設計時,我們可以使用計算機視覺系統工具箱。同樣,如果使用其他語言進行程式設計,則還有更多的開源庫。

我們還應該了解該領域的一些關鍵詞和關鍵工作,在這裡我們可以從中學習到它們中的一些:

  1. SIFT:通用視覺的經典描述符
  2. HOG:衆所周知的描述符,特别适合人類檢測
  3. Viola-Jones:偉大的人臉檢測器
  4. Shape Contexts
  5. Deformable Part Models

必讀書籍清單包括:

入門級:

1. 計算機視覺:算法與應用

2. 計算機視覺:現代方法David A. Forsyth,Jean Ponce

3. 計算機視覺中的多視圖幾何 作者:Richard Hartley,Andrew Zisserman

這裡當也少不了我們小白老師的書啦~

4.OpenCV4快速入門(購買連結如下哦~)

進階水準—走向深度學習:

4. Michael Nielsen的“神經網絡和深度學習”線上書;這是一個很棒的,溫和的介紹:神經網絡和深度學習

5. Ian Goodfellow,Yoshua Bengio和Aaron Courville撰寫的深度學習書TED觀看談話:

1.李飛飛:我們如何教計算機了解圖檔

2. BlaiseAgüera和Arcas:PhotoSynth如何連接配接世界圖像

3. 淺川千惠子:新技術如何幫助盲人探索世界

4. 詹妮弗·希利:如果汽車可以說話,事故是可以避免的

5. 戈蘭·萊文(Golan Levin):回望你的藝術

6. Paul Debevec:制作真實照片的數字臉動畫

7. 戈蘭·萊文:軟體藝術線上課程:

  1. Udacity:計算機視覺概論
  2. 斯坦福大學的CS231n:用于視覺識别的卷積神經網絡
  3. 中央佛羅裡達大學-Mubarak Shah教授的視訊講座
  4. 将您所有的知識應用于從上述資源中獲得的概念和算法,以解決一些任務并自行完成一個項目。

進階水準—走向深度學習:

  1. 傑夫·欣頓(Geoff Hinton)在Coursera上的神經網絡講座
  2. 斯坦福大學課程:用于自然語言處理的深度學習
  3. 斯坦福大學課程:用于視覺識别的卷積神經網絡

講座課程:

  1. 計算機視覺中的深度學習(Sanja Fidler教授)
  2. 先進的計算機視覺(James Hays教授)

4.全球項目

計算機視覺新手指南
  1. 微軟計算機科學家和研究人員正在努力“解決”癌症
  2. 東京項目 —提供支援AI的原型,以增強盲人或視力障礙者對社交,實體和文本環境的認識。
  3. 教學機預測未來
計算機視覺新手指南

最左側的列顯示操作開始之前的幀,其下方是算法的預測。右列顯示視訊的下一幀。

另一種方式確定自己了解計算機視覺領域正在進行的研究就是跟随作者,從自已額頂級會議中查找并閱讀他們的論文,比如在CVPR, ICCV, ECCV, BMVC.5.與專家的對話

以下是我與兩位對計算機視覺領域充滿熱情的專家的交談中的摘錄。A.與Devi Parikh教授的對話| Facebook AI Research的客座研究員| 佐治亞理工學院(以前是弗吉尼亞理工學院)助理教授

計算機視覺新手指南

計算機視覺是人工智能的一個子領域,其目标是建構可與人腦智能視覺相比拟的計算機。機器學習是任何機器教學的通用術語,但是計算機視覺專門處理視覺資料。在機器學習中,我們更多地使用統計工具,而計算機視覺可以同時包括統計工具和非統計工具。例如,計算機視覺領域的3D重建傾向于使用機器學習工具的頻率要比圖像分類和模式識别低。許多計算機視覺任務都有其自己的需求,我們為此開發了特定的機器學習工具。

對于任何想開始學習該領域的學生,我建議他們通過研究人員的網頁并選擇他們認為有趣的問題來選擇問題。大多數情況下,人們都在研究最前沿的問題,這些問題可以從那裡獲得可用的标準資料集。他們可以選擇一個問題,一個資料集以及一個他們可能想使用的庫,然後動手做。

在攻讀碩士或博士學位的學生中,我通常會尋找的是具有責任心,積極性和決心的學生。使您的基本概念清晰明了。嘗試閱讀研究論文。嘗試了解全世界研究人員正在研究的AI前沿問題。

B.與Richa Agrawal的對話 | 賓夕法尼亞大學校友| Whodat的計算機視覺研究工程師

計算機視覺新手指南

我畢業于MNIT Japur,在那裡學習期間我加入了機器人小組。我們做了一些項目,然後參加了IIT Roorkee的國家級比賽。我們赢得了比賽,這鼓舞了我的士氣。完成學士學位後,我開始在Yahoo工作。我意識到這不是我想要或想做的事情,是以去了賓夕法尼亞大學攻讀碩士學位。那時,我通過學習不同的課程探索了不同的研究領域,并最終決定将計算機視覺作為我的主要研究興趣。畢業後,我在美國的一家初創公司工作,并希望在印度尋找類似的機會,因為該領域甚至在這裡都開始發展。在Whodat(一家基于班加羅爾的計算機視覺初創公司)中,我們使用增強現實和可視化技術進行處理。舉例來說,您打算為自己的房屋購買家具;您去商店并在家庭環境中可視化後選擇商店。家具傳遞後,您會意識到它太大或太小,但已經為時已晚。我們正在嘗試通過建構一個解決方案來幫助您,該解決方案将使您在家中的家具可視化。這将使您能夠做出更好的決定,并輕松地購買物品。

在學習時,很多時候我都無法盡力而為,經常感到沮喪,但我朋友的忠告解救了我。他告訴我-“隻有少數人(不到0.1%)能夠做到這一點(從國外做碩士,并且在計算機視覺等技術領域也是如此),并且您已經證明了自己是其中之一。而且,您隻需要加倍努力。隻有您自己可以做到,沒有其他人可以做到。最後,隻有您的學習才是最重要的。

對于學生入門的一些建議是與其他大學的同齡人交談,并詢問他們從事什麼樣的項目。然後他們可以與上司者組成團隊并開始實驗。我還建議參加比賽和黑客馬拉松。重要的是要找到自己的興趣并與他們一起去,而不是在自己不喜歡的地方工作。例如,計算機視覺在印度是一個廣闊的領域,在印度擁有廣闊的發展空間,在這個領域,您所需要的隻是一台照相機,它現在已經開始滲透到更小的城市。是以,計算機視覺的未來絕對是光明的。

計算機視覺新手指南

 End 

計算機視覺新手指南

繼續閱讀