天天看點

機器學習之聚類、回歸、分類算法

機器學習從學習的種類分為“無監督學習”(不對樣本資料做任何标記甚至是過程幹預)和“有監督學習”(總結訓練樣本向量與标簽的映射關系)。

一。聚類:

是非常典型的無監督學習的一種。聚類的行為本源還是人自身。聚類是通過劃分一個個範圍,把輸入樣例進入符合條件的範圍,通過映射關系輸出一個合理的結果。類比于人類的行為,我們分的清猴子和汽車,猴子的種類很多,他們有些行為、樣貌迥異,但是我們卻不會把他們和汽車弄混,我們認為在一定的差異範圍内,他仍然屬于猴子的範圍。

在這個過程中,從獲得具體的樣本向量,到得到聚類結果,人們是不用進行幹預的,進而得到了“非監督”的概念。

二。回歸

簡單來說就是“由果索因”的過程,是一種歸納的思想。最常用的回歸有兩大類----線性回歸,非線性回歸。

Loss越小,越精準。會把收集到的資料集分為訓練集和驗證集。七三開,八二開都可以。訓練集一側用資料多的那部分。

非線性回歸當屬邏輯回歸。