天天看點

人工智能學習路線(資料分析|機器學習|深度學習|NLP|CV)

導讀:大陸政府高度重視人工智能的技術進步與産業發展,人工智能已上升國家戰略。《新一代人工智能發展規劃》提出“到2030年,使中國成為世界主要人工智能創新中心”。自2006年深度學習算法被提出,人工智能技術應用取得突破性發展。2012年以來,資料的爆發式增長為人工智能提供了充分的“養料”,深度學習算法在語音和視覺識别上實作突破,令人工智能産業落地和商業化發展成為可能。人工智能市場前景巨大,預計到2025年人工智能應用市場總值将達1270億美元。

第一、學習并掌握數學知識(人工智能必備的基礎)

高等數學是基礎中的基礎,一切理工科都需要這個打底,資料挖掘、人工智能、模式識别此類跟資料打交道的又尤其需要多元微積分運算基礎線性代數很重要,一般來說線性模型是你最先要考慮的模型,加上很可能要處理多元資料,你需要用線性代數來簡潔清晰的描述問題,為分析求解奠定基礎機率論、數理統計、随機過程更是少不了,涉及資料的問題,不确定性幾乎是不可避免的,引入随機變量順理成章,相關理論、方法、模型非常豐富。很多機器學習的算法都是建立在機率論和統計學的基礎上的,比如貝葉斯分類器、高斯隐馬爾可夫鍊。

再就是優化理論與算法,除非你的問題是像二進制一次方程求根那樣有現成的公式,否則你将不得不面對各種看起來無解但是要解的問題,優化将是你的GPS為你指路有以上這些知識打底,就可以開拔了,針對具體應用再補充相關的知識與理論,比如說一些我覺得有幫助的是數值計算、圖論、拓撲,更理論一點的還有實/複分析、測度論,偏工程類一點的還有信号處理、資料結構。

一、資料分析

1)常數e

2)導數

3)梯度

4)Taylor

5)gini系數

6)資訊熵與組合數

7)梯度下降

8)牛頓法

二、機率論

1)微積分與逼近論

2)極限、微分、積分基本概念

3)利用逼近的思想了解微分,利用積分的方式了解機率

4)機率論基礎

5)古典模型

6)常見機率分布

7)大數定理和中心極限定理

8)協方差(矩陣)和相關系數

9)最大似然估計和最大後驗估計

三、線性代數及矩陣

1)線性空間及線性變換

2)矩陣的基本概念

3)狀态轉移矩陣

4)特征向量

5)矩陣的相關乘法

6)矩陣的QR分解

7)對稱矩陣、正交矩陣、正定矩陣

8)矩陣的SVD分解

9)矩陣的求導

10)矩陣映射/投影

四、凸優化

1)凸優化基本概念

2)凸集

3)凸函數

4)凸優化問題标準形式

5)凸優化之Lagerange對偶化

6)凸優化之牛頓法、梯度下降法求解

第二、掌握經典機器學習理論和算法

如果有時間可以為自己建立一個機器學習的知識圖譜,并争取掌握每一個經典的機器學習理論和算法。機器學習人工智能的核心,是使計算機具有智能的根本途徑,其應用遍及人工智能的各個領域,它主要使用歸納、綜合而不是演繹。

一、機器學習

1)機器學習概述

機器學習(Machine Learning, ML)是一門多領域交叉學科,涉及機率論、統計學、逼近論、凸分析、算法複雜度理論等多門學科。專門研究計算機怎樣模拟或實作人類的學習行為,以擷取新的知識或技能,重新組織已有的知識結構使之不斷改善自身的性能。

二、監督學習

1)邏輯回歸

2)softmax分類

3)條件随機場

4)支援向量機svm

5)決策樹

6)随機森林

7)GBDT

8)內建學習

三、非監督學習

1)高斯混合模型

2)聚類

3)PCA

4)密度估計

5)LSI

6)LDA

7)雙聚類

四、資料處理與模型調優

1)特征提取

2)資料預處理

3)資料降維

4)模型參數調優

5)模型持久化

6)模型可視化

第三、掌握一種程式設計工具,比如Python

一方面Python是腳本語言,簡便,拿個記事本就能寫,寫完拿控制台就能跑;另外,Python非常高效,效率比java、r、matlab高。matlab雖然包也多,但是效率是這四個裡面最低的。

1、了解行業最新動态和研究成果,比如各大牛的經典論文、部落格、讀書筆記、微網誌微信等媒體資訊。

2、買一個GPU,找一個開源架構,自己多動手訓練深度神經網絡,多動手寫寫代碼,多做一些與人工智能相關的項目。

3、選擇自己感興趣或者工作相關的一個領域深入下去人工智能有很多方向,比如NLP、語音識别、計算機視覺等等,生命有限,必須得選一個方向深入的專研下去,這樣才能成為人工智能領域的大牛,有所成就。

一、容器

1)清單:list

2)元組:tuple

3)字典: dict

4)數組: Array

5)切片

6)清單推導式

7)淺拷貝和深拷貝

二、函數

1)lambda表達式

2)遞歸函數及尾遞歸優化

3)常用内置函數/高階函數

4)項目案例:約瑟夫環問題

三、常用庫

1)時間庫

2)并發庫

3)科學計算庫(Numpy)

4)Matplotlib可視化繪圖庫

5)鎖和線程

6)多線程程式設計

資料分析處理庫-Pandas、可視化庫-Matplotlib、可視化庫-Seaborn等學習資料都可找我領取

第四、深度學習

深度學習是一種機器學習的方法,它試圖使用包含複雜結構或由多重非線性變換構成的多個處理層(神經網絡)對資料進行高層抽象的算法。深度學習可以了解為神經網絡的發展,神經網絡是對人腦或生物神經網絡基本特征進行抽象和模組化,可以從外界環境中學習,并以與生物類似的互動方式适應環境。

第五、自然語言處理

自然語言處理是計算機科學領域與人工智能領域中的一個重要方向。它研究能實作人與計算機之間用自然語言進行有效通信的各種理論和方法。自然語言處理是一門融語言學、計算機科學、數學于一體的科學。是以,這一領域的研究将涉及自然語言,即人們日常使用的語言,是以它與語言學的研究有着密切的聯系,但又有重要的差別。自然語言處理并不是一般地研究自然語言,而在于研制能有效地實作自然語言通信的計算機系統,特别是其中的軟體系統。因而它是計算機科學的一部分。

人工智能學習路線(資料分析|機器學習|深度學習|NLP|CV)
  • 1)詞(分詞,詞性标注)代碼實戰
  • 2)詞(深度學習之詞向量,字向量)代碼實戰
  • 3)詞(深度學習之實體識别和關系抽取)代碼實戰
  • 4)詞(關鍵詞提取,無用詞過濾)代碼實戰
  • 5)句(句法分析,語義分析)代碼實戰
  • 6)句(自然語言了解,一階邏輯)代碼實戰
  • 7)句(深度學習之文本相似度)代碼實戰

第六、圖像處理

圖像處理(image processing)又稱為影像處理,是用計算機對圖像進行達到所需結果的技術。應用廣泛,多用于測繪學、大氣科學、天文學、美圖、使圖像提高辨識等

圖像處理是對圖像進行分析、加工、和處理,使其滿足視覺、心理以及其他要求的技術。圖像處理是信号處理在圖像域上的一個應用,目前大多數的圖像是以數字形式存儲,因而圖像處理很多情況下指數字圖像處理。

人工智能學習路線(資料分析|機器學習|深度學習|NLP|CV)

1、位圖和矢量圖

2、常見的圖像檔案格式

3、圖像像素基本屬性:像素深度、分辨率

4、圖像的品質:

與清晰度相關的主要因素

  • 模糊
  • 對比度
  • 顔色飽和度
  • 亮度
  • 圖像尺寸大小

5、圖像處理基本術語

圖像拓撲:常用于二值圖像并借助形态學

領域:圍繞一個給定像素的周圍構成它的領域,4領域 8領域

鄰接;通路;連接配接性;組元

6、數字圖像處理的硬體

7、圖像數字化:(時間或者空間)采樣、(幅度上)量化

8、圖像的顔色

顔色的形成

顔色的三要素

顔色的三基色原理(加色系統和減色系統)

RGB模型

CIE模型

小編吐血整理了有關Python人工智能的資料,有圖像處理opencv\自然語言處理、機器學習、數學基礎等資源庫,200G人工智能大禮包内含:Pytorch、TensorFlow實戰架構視訊、圖像識别、OpenCV、計算機視覺、深度學習與神經網絡等視訊、代碼、PPT以及人工智能書籍,想學習人工智能或者轉行到高薪資行業的,大學生也非常實用,無任何套路免費提供~

人工智能學習路線(資料分析|機器學習|深度學習|NLP|CV)
人工智能學習路線(資料分析|機器學習|深度學習|NLP|CV)

繼續閱讀