文章是下面這個公開課的個人筆記,推薦的筆記裡記的比較全,完全依據視訊課程(有少量小錯誤),我的筆記依據課程按自己的了解記錄一些重點,友善快速回顧。另外自己開始學這門課時搜到的好的資料,推薦給大家:
|— Coursera上斯坦福大學Andrew Ng教授的“機器學習公開課”
|—- 類 别:适合入門
|—- 網頁位址: https://www.coursera.org/learn/machine-learning/outline
|—- 學習筆記:推薦 @小小人_V 同學這門課程的學習筆記:http://vdisk.weibo.com/s/J4rRX/1373287206
|—- 網盤位址(全視訊版和字幕,ppt和筆記):
百度雲分享: http://pan.baidu.com/s/1i31QDTF 密碼: 1a36
360雲盤分享:http://yunpan.cn/cJYpBDKUqrzNR (提取碼:6e99)
1 機器學習介紹
1.1 什麼是機器學習?
機器學習:研究的是如何賦予計算機在沒有被明确程式設計的情況下仍能夠學習的能力。 Machine learning is the field of study that gives computers the ability to learn without being explicitly programmed.
機器學習:對于某個任務 T 和表現的衡量 P,當計算機程式在該任務 T 的表現上,經過 P 的衡量, 随着經驗 E 而增長,我們便稱計算機程式能夠通過經驗 E 來學習該任務。Computer program is said to learn from experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, improves with experience E.
(在跳棋遊戲的例子中,任務 T 是玩跳棋遊戲,P 是遊戲的輸赢,E 則是一局又一局的遊戲。)
機器學習的應用舉例:
-  資料庫挖掘
- 一些無法通過手動程式設計來編寫的應用:如自然語言處理,計算機視覺
- 一些自助式的程式:如推薦系統
- 了解人類是如何學習的
1.2 監督學習(Supervised Learning)
監督學習:已有的樣本已知要預測的變量。用已知來預測未知。
回歸問題(Regression):預測的結果是連續地值。例如:預測房價
分類問題(Classification):預測的結果是離散有限的分類,能夠學會如何将資料分類到不同的類裡。例如:預測是否是惡性惡性良性腫瘤
1.3 非監督學習(Unsupervised Learning)
非監督學習:現有資料中并沒有結果,我們有的隻是特征,因而非監督學習要解決的問題是發現這些資料是否可以分為不同的組。
在未知的資料中,依據資料特征,對資料分組。
聚類問題(Clustering):在未知的資料中,依據資料特征,對資料分組。
例子:
- 對一個大型的資料中心的網絡傳輸數 據情況進行分析,發現那些多數時候是在協作的計算機。
- 根據是否具有某些基因而将這些人聚類
- 市場分類
-
雞尾酒會問題:房間中有多個人在同時在講話,利用多個麥克風來錄音,分離出每個人的講話。隻有一行的機器學習算法(Octave)可以非常漂亮地将兩個人的說話給分離開來:
[W,s,v]=svd((repmat(sum(x.∗x,1),size(x,1),1).∗x)∗x′);
Stanford公開課機器學習---week1-1.Intrduction 機器學習介紹1 機器學習介紹