1 關聯規則産生
關聯規則反應的是一個事物與其他事物之間的關聯關系,被稱為購物籃模型,最初産生為啤酒喝尿布的故事。電商網站多用于商品推薦、聯合發券、品類聯合促銷等方面。
2 關聯規則名額
1)支援度為事物在資料集中發生的機率,支援度的意義在于度量項集在整個事務集中出現的頻次,我們希望關注頻次高的項集。
Support(A)=A/U
2)置信度,在A發生的條件下B發生的機率
Confidence(A-->B)=P(AB)/P(A)
3)提升度
Lift(A→B) = P(B|A) / P(B)=P(AB)/P(A)P(B)、
4)頻繁項集:經常一起出現的項集
3 關聯規則 ----Apriori算法原理
假設交易記錄
item1 | A | B | C | D |
item2 | B | C | D | |
item3 | C | D | ||
item4 | B | F | G | H |
item5 | A | C | D |
3.1 生成關聯規則
4關聯規則R語言實作
4.1讀資料變換成交易記錄集
#format有兩種格式single原始記錄和basket購物籃記錄
rp<-read.transactions('D:\\R\\Apriori_id_50.csv',
format = 'single',
sep=',',
cols=c(1,2))
4.2 生成關聯規則
#關聯模型
asso_rules <- apriori(rp, parameter = list(supp = 0.001, #支援度
conf = 0.5, #置信度
minlen = 2 #規則長度最小數
))
4.3規則結果展示
4.4檢視和儲存規則
檢視規則:inspect(asso_rules)
儲存規則:write.csv(asso_rules,file='D:\\R\\asso_rules.csv')