天天看點

資料挖掘與資料化營運實戰. 2.1 資料挖掘的發展曆史

<b>2.1 資料挖掘的發展曆史</b>

資料挖掘起始于20世紀下半葉,是在當時多個學科發展的基礎上發展起來的。随着資料庫技術的發展應用,資料的積累不斷膨脹,導緻簡單的查詢和統計已經無法滿足企業的商業需求,急需一些革命性的技術去挖掘資料背後的資訊。同時,這期間計算機領域的人工智能(artificial intelligence)也取得了巨大進展,進入了機器學習的階段。是以,人們将兩者結合起來,用資料庫管理系統存儲資料,用計算機分析資料,并且嘗試挖掘資料背後的資訊。這兩者的結合促生了一門新的學科,即資料庫中的知識發現(knowledge discovery in databases,kdd)。1989年8月召開的第11屆國際人工智能聯合會議的專題讨論會上首次出現了知識發現(kdd)這個術語,到目前為止,kdd的重點已經從發現方法轉向了實踐應用。

而資料挖掘(data mining)則是知識發現(kdd)的核心部分,它指的是從資料集合中自動抽取隐藏在資料中的那些有用資訊的非平凡過程,這些資訊的表現形式為:規則、概念、規律及模式等。進入21世紀,資料挖掘已經成為一門比較成熟的交叉學科,并且資料挖掘技術也伴随着資訊技術的發展日益成熟起來。

總體來說,資料挖掘融合了資料庫、人工智能、機器學習、統計學、高性能計算、模式識别、神經網絡、資料可視化、資訊檢索和空間資料分析等多個領域的理論和技術,是21世紀初期對人類産生重大影響的十大新興技術之一。