天天看點

開源!《AI 算法工程師手冊》中文教程正式釋出!

最近紅色石頭在浏覽網頁的時候,偶然發現一份非常不錯的 AI 資源,就是這本《AI 算法工程師手冊》 。本文将給大家推薦這本優秀教材,并作詳細的介紹。

這本《AI 算法工程師手冊》已正式開源,無需購買紙質書籍,可以直接線上閱讀,體驗感爆棚。線上閱讀位址為:

http://www.huaxiaozhuan.com/

作者簡介

首先不得不提一下本書的作者,作者華校專,曾經在阿裡巴巴擔任資深算法工程師,現任智易科技首席算法研究員。他還是《Python 大戰機器學習》書籍的作者。

書籍介紹

這本《AI 算法工程師手冊》是作者多年以來學習總結的筆記,經整理之後開源于世。關于為什麼将完整書籍開源,作者是這樣說的:曾有出版社約稿,但是考慮到出版時間周期較長,而且書本購買成本高不利于技術廣泛傳播,是以就采取開源的形式。

既然本書是 AI 算法工程師的手冊,是以内容非常豐富,基本涵蓋了機器學習、深度學習等領域的很多重要理論知識和實戰經驗,同時也介紹了工程應用中經常使用的 AI 工具和程式設計庫。

書籍整體包含了 5 大塊内容,分别是:

  • 數學基礎
  • 統計學習
  • 深度學習
  • 自然語言處理
  • 工具

下面我們分别來看一下各子產品的内容。

1. 數學基礎

提升 AI 内功心法離不開紮實的數學基礎。本書數學基礎這部分,作者主要介紹了最重要的 4 點:

1. 線性代數基礎 

2. 機率論基礎

3. 數值計算基礎 

4. 蒙特卡洛方法與 MCMC 采樣 

例如線性代數部分最基本的基礎知識:

開源!《AI 算法工程師手冊》中文教程正式釋出!

2. 統計學習

這部分内容作者花了比較大的篇幅,主要介紹的是機器學習中一些常見的算法,包括線性回歸、感覺機、支援向量機、決策樹、內建學習等。同時還包括模型評估、特征選擇、降維等。具體内容如下:

0. 機器學習簡介 

2. 支援向量機 

3. 樸素貝葉斯

4. 決策樹

5. knn 

6. 內建學習 

7. 梯度提升樹

8. 特征工程 

9. 模型評估

10. 降維 

11. 聚類 

12. 半監督學習 

13. EM算法 

14. 最大熵算法

15. 隐馬爾可夫模型

16. 機率圖與條件随機場

17. 邊際機率推斷

每個算法的理論介紹非常詳細、數學推導完整,例如支援向量機中關于對偶問題的推導:

開源!《AI 算法工程師手冊》中文教程正式釋出!
開源!《AI 算法工程師手冊》中文教程正式釋出!
開源!《AI 算法工程師手冊》中文教程正式釋出!
開源!《AI 算法工程師手冊》中文教程正式釋出!

3. 深度學習

這部分主要介紹深度學習神經網絡的基本知識和模型,包括前饋神經網絡、卷積神經網絡、循環神經網絡等。具體内容如下:

0. 深度學習簡介

2. 反向傳播算法

3. 正則化

4. 最優化基礎

5. 卷積神經網絡

6. 循環神經網絡

7. 工程實踐指導原則

這部分詳細介紹了神經網絡模型的基本結構和訓練方法,例如列舉了經典 CNN 結構:LeNet、AlexNet、VGG-Net、Inception、ResNet、ResNet 變種、SENet、DenseNet。

開源!《AI 算法工程師手冊》中文教程正式釋出!

4. 自然語言處理

這部分作者主要介紹了自然語言處理領域的 2 個方面:

1. 主題模型 

  • Unigram Model 
  • pLSA Model 
  • LDA Model 
  • 型讨論 

2. 詞向量 

  • 向量空間模型 VSM 
  • LSA 
  • Word2Vec 
  • GloVe

5. 工具

這部分主要介紹了 AI 常用工具和函數庫,具體内容如下:

1. CRF

2. lightgbm

3. xgboost

4. scikit-learn

5. spark

6. numpy

7. scipy

8. matplotlib

9. pandas

這部分的内容更加側重于 AI 實戰,包含很多具體函數庫的使用教程和代碼。例如 lightbgm 是一個快速的,分布式的,高性能的基于決策樹算法的梯度提升架構。可用于排序,分類,回歸以及很多其他的機器學習任務中。本書對 lightbgm 的安裝、各參數含義、調參、使用等都作了詳細的介紹,宛如一份優秀的中文文檔!

這裡附上 lightbgm 簡單的 pip 安裝方法:

pip install lightgbm

pip install --no-binary :all: lightgbm #從源碼編譯安裝

pip install lightgbm --install-option=--mpi #從源碼編譯安裝 MPI 版本

pip install lightgbm --install-option=--gpu #從源碼編譯安裝 GPU 版本

pip install lightgbm --install-option=--gpu --install-option="--opencl-include-dir=/usr/local/cuda/include/" --install-option="--opencl-library=/usr/local/cuda/lib64/libOpenCL.so" #從源碼編譯安裝,指定配置

#可選的配置有:

# boost-root

# boost-dir

# boost-include-dir

# boost-librarydir

# opencl-include-dir

# opencl-library

同樣,像 xgboost、scikit-learn 等庫,書中也作了詳盡的解釋。除此之外,還有 spark 的内容哦,可以說是非常全面了。

最後

不得不說,這本《AI 算法工程師手冊》是一本比較完備的 AI 書籍,既包含了算法理論,也有實戰 AI 算法庫的使用。作為一份參考手冊還是非常不錯的!

更重要的是本書完全開源,直接線上閱讀就好了。不過注意該書籍僅供個人學習使用,非作者同意不得應用于商業領域。