網易公開課學習筆記
機器學習的定義
Arthur Samuel:“在不直接針對問題進行程式設計的情況下,賦予計算機學習能力的一個研究領域”
讓計算機學會如何下棋,并超過自己
Tom Mitchell:給計算機一個任務T和性能測試方法P,如果在經驗E的影響下,P對T的測量結果得到了改進,我們說程式從E中得到了學習
E(experience):程式不斷和自己下棋的經曆
T(task):下棋
P(performance):程式和人下棋勝出的機率
一、supervised learning(監督性學習)
學習标準輸入和标準答案間的關系,給我們提供一個某種意義上的正确答案
回歸問題 regression problem,需要測量的變量是連續的:房屋面積和房屋價格的關系
分類問題 classification
problem,需要測量的變量是離散的:乳腺癌惡性良性腫瘤資料,惡性良性腫瘤大小和惡性良性腫瘤是否為良性的關系(是否為良性,取值隻有0或1),
通過惡性良性腫瘤大小,病人年齡,惡性良性腫瘤是否良性的資料來預測新輸入的病人資料結果是否為良性
支援向量算法,将資料映射到無線緯的空間中,處理無限種特征
二、learning theory(學習理論)
三、unsupervised learning(無監督性學習)
聚類問題,使用者畫像、分類
計算機群組織、社交網絡分析、市場劃分
四、reinforcement learning(加強學習)
進行一次性決策,如何定義一個好的行為
應用:機器人領域、網頁爬取