天天看點

《寫給程式員的資料挖掘實踐指南》——第1章 資料挖掘簡介及本書使用方法

第1章 資料挖掘簡介及本書使用方法

寫給程式員的資料挖掘實踐指南

假想150年前一個美國小鎮的生活情形:大家都互相認識;百貨店某天進了一批布料,店員注意到這批布料中某個特定毛邊的樣式很可能會引起clancey夫人的高度興趣,因為他知道clancey夫人喜歡亮花紋樣;于是他在心裡記着等clancey夫人下次光顧時将該布料拿給她看看;chow winkler告訴酒吧老闆wilson先生,他考慮将多餘的雷明頓(renmington)1來福槍出售;wilson先生将這則消息告訴bud barclay,因為他知道bud正在尋求一把好槍;valquez警長及其下屬知道lee pye是需要重點留意的對象,因為lee pye喜歡喝酒,并且性格暴躁、身體強壯。100年前的小鎮生活都與人和人之間的聯系有關。

人們知道你的喜好、健康和婚姻狀況。不管是好是壞,大家得到的都是個性化的體驗。那時,這種高度個性化的社群生活占據了當時世界上的大部分角落。

《寫給程式員的資料挖掘實踐指南》——第1章 資料挖掘簡介及本書使用方法

時間走過100年之後來到了20世紀60年代。個性化互動的可能性雖然有所下降但仍然存在。本地書店的店員可能會告訴某個常客“書店裡上架了james michener2的新書”,這是因為他知道該顧客喜歡james michener的作品。或者,店員可能向顧客推薦barry goldwater3寫的the conscience of a conservative,這是因為他知道該顧客是個堅定的保守派。某個常客去餐館就餐,服務員可能會問“是不是像以往一樣點餐?”

即使到今天,個性化仍然大量存在。我去mesilla的一個本地咖啡店,咖啡店員會問我:“來一大杯加強的濃縮拿鐵咖啡?”這是因為他知道這是我每天必點的品種。我将貴婦犬交給寵物美容師,她也不需要問我要修剪的樣式。她知道我喜歡無修飾運動型及德式耳型。

但是從100年前的小鎮開始,情況就有所改變。大型百貨店和商場代替了街坊的百貨店和其他商店。這種改變剛開始時,人們的選擇還十分有限。henry ford曾經說過“隻要這車是黑的,顧客就可以把車漆成任何他想要的顔色”4。唱片店出售的唱片數目是有限的,而書店出售的書也有限。想要冰激淩?隻有香草味、巧克力味或者是草莓味幾種。想要洗衣機?1950年時本地sears商店5隻有兩種型号:一種是售價55美元的标準型,另一種是售價95美元的豪華型。

繼續閱讀