天天看點

《資料挖掘:實用案例分析》——第1章 初識資料挖掘 1.1 什麼是資料挖掘

随着計算機技術、網絡技術、通信技術和internet技術的發展,以及各行各業業務操作流程的自動化,企業内積累了大量業務資料,這些資料動辄以tb計算。這些資料和由此産生的資訊是企業的财富,它如實地記錄着企業運作的狀況。面對大量的資料,迫使人們不斷尋找新的工具,來對企業的營運規律進行探索,為商業決策提供有價值的資訊,使企業獲得利潤。能滿足企業這一迫切需求的有力工具就是資料挖掘。對于企業而言,資料挖掘有助于發現業務的趨勢,揭示已知的事實,預測未知的結果。從這個意義上講,知識是力量,資料挖掘是财富。

資料挖掘(data mining,dm):就是從大量資料(包括文本)中挖掘出隐含的、未知的、對決策有潛在價值的關系、模式和趨勢,并用這些知識和規則建立用于決策支援的模型,提供預測性決策支援的方法、工具和過程;是利用各種分析工具在海量資料中發現模型和資料之間關系的過程。這些模型和關系可以被企業用來分析風險、進行預測。

資料挖掘的目的就是從資料中“淘金”,就是從資料中擷取智能的過程。

gartner group提出:“資料挖掘是通過仔細分析大量資料來揭示有意義的新的關系、模式和趨勢的過程。它使用模式認知技術、統計技術和數學技術。”

the meta group的aaron zornes表示:“資料挖掘是一個從大型資料庫中提取以前不知道的可操作性資訊的知識挖掘過程。”

總之,由于企業内産生了大量的業務資料,這些資料和由此産生的資訊是企業的财富,它如實記錄了企業運作的狀況。通過資料挖掘分析,能幫助企業發現業務的趨勢,揭示已知的事實,預測未知的結果。資料挖掘已成為企業保持競争力的必要方法。

繼續閱讀