天天看點

machine learning參數确定

需要确定的參數:

1. training set的大小m。

2. regularization parameter λ 。

3. 多項式的項數 θ 的數目n。

4. *在神經網絡中還可以優化神經網絡層數

優化方法:

1. 把data set分成三部分,比例是training set: 60%,CV set: 20%,test set: 20%。

2. 用training set确定最優 θ 。

3. 用CV set 确定需要選擇的參數m, λ 或n。

4. 用test set 驗證優化後的machine learning模型的最終效果。

優化方式選擇:

high bias(underfitting):more features, smaller λ

high variance(overfitting):larger training set, fewer features, larger λ

繼續閱讀