天天看點

Reinforcement learning and Deep learning1.Artificial Intelligence2. Machine Learning3. Reinfrocement Learning4. Deep Learning5.Reinforcement Learning和Deep learning的差別6. Reference

Author: LiChong0309

Lable: Reinforcement intelligence 、Deep learning、Artificial Intelligence、Machine Learning

  • 1.Artificial Intelligence
  • 2. Machine Learning
  • 3. Reinfrocement Learning
  • 4. Deep Learning
  • 5.Reinforcement Learning和Deep learning的差別
  • 6. Reference
Reinforcement learning and Deep learning1.Artificial Intelligence2. Machine Learning3. Reinfrocement Learning4. Deep Learning5.Reinforcement Learning和Deep learning的差別6. Reference

從圖中可以看出,人工智能提出的最早,機器學習提出的稍晚,深度學習最晚。

1.Artificial Intelligence

①:弱人工智能:行為方式是人類預先設定好的,知識是有限的,運算過程是一個相對封閉的環境。即使它的能力在今後的發展中得到非常大的提升,也隻知識量的提高、運算速度的提升和運算範圍的擴大。這樣的人工智能是受人類掌控的,對人類自身來說是先對安全的。

②: 強人工智能:有可能制造出真正能推理和解決問題的智能機器,這樣的機器是有知覺的,有自我意識的。

而目前業界的真實的人工智能還處于早期人工智能階段,或者叫做弱人工智能,終結者這樣的機器人應該才算強人工智能.不過目前離這個目标還有些遙遠.人工智能往往結合着制造業,是以說人工智能的時候往往會說機器人。而目前業界的真實的人工智能還處于早期人工智能階段,或者叫做弱人工智能,終結者這樣的機器人應該才算強人工智能,不過目前離這個目标還有些遙遠,人工智能往往結合着制造業,是以說人工智能的時候往往會說機器人。

2. Machine Learning

機器學習是實作人工智能的一種手段,也是目前被認為比較有效的實作人工智能的手段,目前在業界使用機器學習比較突出的領域很多,例如:計算機視覺、自然語言處理、推薦系統等等。大家生活中經常用到的比如高速上的ETC的車牌識别,今日頭條的新聞推薦,天貓上的評價描述。

Machine Learning 可以分為三種:

①:監督學習

②:無監督學習

③:半監督學習

3. Reinfrocement Learning

※:是一種機器學習的技術

※:又稱為再勵學習、評價學習

※:Reinforcement learning是智能系統(agent)從環境(state)到行為(action)映射的學習,以使獎勵信号函數值最大。

※:由于外部給出的資訊很少,是以智能系統必須要依靠自身的經曆進行自我學習,通過這種學習擷取知識,改進行動方案以适應環境。

Reinforcement Learing三要素是:

①:狀态(State)

②:行為(action)

③:環境獎勵(reward)

4. Deep Learning

※:是機器學習的一種技術。

※:最初的深度學習網絡是利用神經網絡來解決特征層分布的一種學習過程。

神經網絡是受人類大腦的啟發而來的:神經元之間的互相連接配接關系。但是,人類大腦中的神經元可以與特定範圍内的任意神經元連接配接,而人工神經網絡中資料傳播要經曆不同的層,傳播方向也不同。

舉個例子,你可以将一張圖檔切分為小塊,然後輸入到神經網絡的第一層中。在第一層中做初步計算,然後神經元将資料傳至第二層。由第二層神經元執行任務,依次類推,直到最後一層,然後輸出最終的結果。

通常我們了解的DNN(深度神經網絡),CNN(卷積神經網絡),RNN(循環神經網絡),LSTM(長短期記憶網絡)都是隸屬于深度學習的範疇

5.Reinforcement Learning和Deep learning的差別

關于強化學習和深度學習的執行個體,最典型的莫過于谷歌的AlphaGo和AlphaZero兩位了,前者通過深度學習中的深度卷積神經網絡,在訓練了大約三千萬組人類的下棋資料,無數度電的情況下才搞出來的模型,而後者使用強化學習的方式,通過自己和自己下棋的方式搞出來的模型.而最終的實驗結果也很讓人震撼.AlphaGo幹敗了人類圍棋頂尖高手,而AlphaZero幹敗了AlphaGo。

深度學習技術可以用到強化學習上,叫深度強化學習。

6. Reference

基本概念:人工智能,機器學習,深度學習,強化學習的差別和簡介:

https://my.oschina.net/lums/blog/1808968

繼續閱讀