1.1 試給出相應的版本空間。
首先有一個“假設空間”,現實問題中假設空間一般很大。然後有許多政策是可以對假設空間進行搜尋,搜尋過程中删除與正例不一緻的假設、和反例一緻的假設。最後選出來的假設的集合,就叫做“版本空間”。

1.2 若使用最多包含k個合取式的析合範式來表達表1.1西瓜分類問題的假設空間,估算共有多少種可能的假設。
至少看到色澤有2種取值、根蒂有3種取值、敲聲有3種取值。可能的假設(“假設空間”的規模大小):3*4*4+1=49。
1.3 若資料包含噪聲,則假設空間中有不存在與所有訓練樣本都一緻的假設。在此情形下,試設計一種歸納偏好用于假設選擇。
有多個假設,從已有的訓練樣本,無法判定哪個假設更好,但是我們必須要産生一個模型。就需要用到“歸納偏好”。更偏好“平滑”的曲線。
1.4* 不使用“分類錯誤率”而用新的性能度量來對分類器進行評估,試證明“沒有免費的午餐定理”仍成立。
1.5 試述機器學習能在網際網路搜尋的哪個環節起什麼作用。
用在搜尋結果推薦。利用已有的某個使用者的曆史資料(如曾經搜尋看過什麼結果、使用者裝置資訊等),猜測他可能對哪一條搜尋結果感興趣。感興趣度應該是一系列的值,最後按照值的高度逆序排列。