Apriori算法是種挖掘關聯規則的頻繁項集算法,壹種最有影響的挖掘布爾關聯規則頻繁項集的算法。
它利用逐層搜索的叠代方法找出數據庫中項集的關系,以形成規則,其過程由連接(類矩陣運算)與剪枝(去掉那些沒必要的中間結果)組成。該算法中項集的概念即為項的集合。包含K個項的集合為k項集。項集出現的頻率是包含項集的事務數,稱為項集的頻率。如果某項集滿足最小支持度,則稱它為頻繁項集。Apriori算法是第壹個關聯規則挖掘算法,也是最經典的算法。
關聯規則挖掘是數據挖掘中最活躍的研究方法之壹 。最早是由 Agrawal 等人提出的1993最初提出的動機是針對購物籃分析問題提出的,其目的是為了發現交易數據庫中不同商品之間的聯系規則。這些規則刻畫了顧客購買行為模式,可以用來指導商家科學地安排進貨,庫存以及貨架設計等。之後諸多的研究人員對關聯規則的挖掘問題進行了大量的研究。
apriori關聯規則算法的應用
Apriori算法廣泛應用於商業中,應用於消費市場價格分析中,它能夠很快的求出各種產品之間的價格關系和它們之間的影響。
通過數據挖掘,市場商人可以瞄準目標客戶,采用個人股票行市、最新信息、特殊的市場推廣活動或其他壹些特殊的信息手段,從而極大地減少廣告預算和增加收入。百貨商場、超市和壹些老字型大小的零售店也在進行數據挖掘,以便猜測這些年來顧客的消費習慣。
Apriori算法應用於網絡安全領域,比如網絡入侵檢測技術中。早期中大型的電腦系統中都收集審計信息來建立跟蹤檔,這些審計跟蹤的目的多是為了性能測試或計費,因此對攻擊檢測提供的有用信息比較少。
它通過模式的學習和訓練可以發現網絡用戶的異常行為模式。采用作用度的Apriori算法削弱了Apriori算法的挖掘結果規則,是網絡入侵檢測系統可以快速的發現用戶的行為模式,能夠快速的鎖定攻擊者,提高了基於關聯規則的入侵檢測系統的檢測性。
以上內容參考:百度百科-APRIORI