天天看點

商業智能BI的三個層次-----資料報表、資料分析、資料挖掘

    一直對三者之間的關系有點糊塗,剛好看到一篇個人認為有道理的文章就轉載過來

    經過幾年的積累,大部分中大型的企事業機關已經建立了比較完善的CRM、ERP、OA等基礎資訊化系統。這些系統的統一特點都是:通過業務人員或者使用者的操作,最終對資料庫進行增加、修改、删除等操作。上述系統可統一稱為OLTP(Online Transaction Process,線上事務處理),指的就是系統運作了一段時間以後,必然幫助企事業機關收集大量的曆史資料。但是,在資料庫中分散、獨立存在的大量資料對于業務人員來說,隻是一些無法看懂的天書。業務人員所需要的是資訊,是他們能夠看懂、了解并從中受益的抽象資訊。此時,如何把資料轉化為資訊,使得業務人員(包括管理者)能夠充分掌握、利用這些資訊,并且輔助決策,就是商業智能主要解決的問題。

       如何把資料庫中存在的資料轉變為業務人員需要的資訊?大部分的答案是報表系統。簡單說,報表系統已經可以稱作是BI了,它是BI的低端實作。 現在國外的企業,大部分已經進入了中端BI,叫做資料分析。有一些企業已經開始進入高端BI,叫做資料挖掘。而我國的企業,目前大部分還停留在報表階段。

資料報表不可取代 

        傳統的報表系統技術上已經相當成熟,大家熟悉的Excel、水晶報表、Reporting Service等都已經被廣泛使用。但是,随着資料的增多,需求的提高,傳統報表系統面臨的挑戰也越來越多。

1. 資料太多,資訊太少

      密密麻麻的表格堆砌了大量資料,到底有多少業務人員仔細看每一個資料?到底這些資料代表了什麼資訊、什麼趨勢?級别越高的上司,越需要簡明的資訊。如果我是董事長,我可能隻需要一句話:目前我們的情況是好、中還是差?

2. 難以互動分析、了解各種組合

     定制好的報表過于死闆。例如,我們可以在一張表中列出不同地區、不同産品的銷量,另一張表中列出不同地區、不同年齡段顧客的銷量。但是,這兩張表無法回答諸如“華北地區中青年顧客購買數位相機類型産品的情況”等問題。業務問題經常需要多個角度的互動分析。

3. 難以挖掘出潛在的規則

      報表系統列出的往往是表面上的資料資訊,但是海量資料深處潛在含有哪些規則呢?什麼客戶對我們價值最大,産品之間互相關聯的程度如何?越是深層的規則,對于決策支援的價值越大,但是,也越難挖掘出來。

4. 難以追溯曆史,資料形成孤島

      業務系統很多,資料存在于不同地方。太舊的資料(例如一年前的資料)往往被業務系統備份出去,導緻宏觀分析、長期曆史分析難度很大。 是以,随着時代的發展,傳統報表系統已經不能滿足日益增長的業務需求了,企業期待着新的技術。

       資料分析和資料挖掘的時代正在來臨。值得注意的是,資料分析和資料挖掘系統的目的是帶給我們更多的決策支援價值,并不是取代資料報表。報表系統依然有其不可取代的優勢,并且将會長期與資料分析、挖掘系統一起并存下去。

資料挖掘看穿你的需求 

       廣義上說,任何從資料庫中挖掘資訊的過程都叫做資料挖掘。從這點看來,資料挖掘就是BI。但從技術術語上說,資料挖掘(Data Mining)特指的是:源資料經過清洗和轉換等成為适合于挖掘的資料集。資料挖掘在這種具有固定形式的資料集上完成知識的提煉,最後以合适的知識模式用于進一步分析決策工作。從這種狹義的觀點上,我們可以定義:資料挖掘是從特定形式的資料集中提煉知識的過程

。資料挖掘往往針對特定的資料、特定的問題,選擇一種或者多種挖掘算法,找到資料下面隐藏的規律,這些規律往往被用來預測、支援決策。

關聯銷售案例:

       美國的超市有這樣的系統:當你采購了一車商品結賬時,售貨員小姐掃描完了你的産品後,計算機上會顯示出一些資訊,然後售貨員會友好地問你:我們有一種一次性紙杯正在促銷,位于F6貨架上,您要購買嗎?

這句話決不是一般的促銷。因為計算機系統早就算好了,如果你的購物車中有餐巾紙、大瓶可樂和沙拉,則86%的可能性你要買一次性紙杯。結果是,你說,啊,謝謝你,我剛才一直沒找到紙杯。 這不是什麼神奇的科學算命,而是利用資料挖掘中的關聯規則算法實作的系統。

      每天,新的銷售資料會進入挖掘模型,與過去N天的曆史資料一起,被挖掘模型處理,得到目前最有價值的關聯規則。同樣的算法,分析網上書店的銷售業績,計算機可以發現産品之間的關聯以及關聯的強弱。

        資料報表、資料分析、資料挖掘是BI的三個層面。我們相信未來幾年的趨勢是:越來越多的企業在資料報表的基礎上,會進入資料分析與資料挖掘的領域。商業智能所帶來的決策支援功能,會給我們帶來越來越明顯的效益。