天天看點

關聯規則算法1------關聯規則Apriori原理和R實作

1 關聯規則産生

關聯規則反應的是一個事物與其他事物之間的關聯關系,被稱為購物籃模型,最初産生為啤酒喝尿布的故事。電商網站多用于商品推薦、聯合發券、品類聯合促銷等方面。

2 關聯規則名額

1)支援度為事物在資料集中發生的機率,支援度的意義在于度量項集在整個事務集中出現的頻次,我們希望關注頻次高的項集。

Support(A)=A/U

2)置信度,在A發生的條件下B發生的機率

Confidence(A-->B)=P(AB)/P(A)

3)提升度

Lift(A→B) = P(B|A) / P(B)=P(AB)/P(A)P(B)、

4)頻繁項集:經常一起出現的項集

3  關聯規則 ----Apriori算法原理

假設交易記錄

item1 A B C D
item2 B C D
item3 C D
item4 B F G H
item5 A C D

3.1 生成關聯規則

關聯規則算法1------關聯規則Apriori原理和R實作

4關聯規則R語言實作

4.1讀資料變換成交易記錄集

#format有兩種格式single原始記錄和basket購物籃記錄

rp<-read.transactions('D:\\R\\Apriori_id_50.csv',

                      format = 'single',

                      sep=',',

                      cols=c(1,2))

4.2 生成關聯規則

#關聯模型

asso_rules <- apriori(rp, parameter = list(supp = 0.001,  #支援度

                                      conf = 0.5,   #置信度

                                      minlen = 2  #規則長度最小數

))

4.3規則結果展示

關聯規則算法1------關聯規則Apriori原理和R實作

4.4檢視和儲存規則

檢視規則:inspect(asso_rules)

儲存規則:write.csv(asso_rules,file='D:\\R\\asso_rules.csv')

繼續閱讀