天天看點

Fast Algorithms for Mining Association Rules 論文筆記

論文連結:

論文位址:Fast Algorithms for Mining Association Rules

論文所屬領域:

資料挖掘算法,挖掘頻繁項集,資料的關聯分析

相關算法:

  • Apriori
  • FP-Tree(FP-growth)
  • IHT-growth
  • BSHT

相關定義:

  • 事務:每一條交易稱為一個事務。
  • 項:交易的每一個物品稱為一個項,一個事務包含一個或多個項。
  • 項集:包含零個或多個項的集合稱為項集。
  • k-項集:包含

    k

    個項的項集,例如 1-項集,2-項集。
  • 支援度計數:項集在事務出現的次數。
  • 支援度(

    support

    ):支援度計數除以總的事務數。
  • 頻繁項集:支援度大于等于某個門檻值的的項集。
  • 置信度(

    confidence

    ):在關聯規則

    A -> B

    中,公式

    confidence = sup(AUB) / sup(A)

    ,也就是同時購買 {

    A,B

    } 的支援度除以購買

    A

    的支援度,

繼續閱讀