天天看點

BI和資料倉庫:企業分析決策真的離不開資料倉庫嗎?數倉:BI背後的引擎(或管道)從現代商業決策視角,重新審視BI與資料倉庫的關系企業建構分析決策架構的靈活政策

很長一段時間,BI和資料倉庫幾乎都是如影随形、難舍難分。企業如果想要實行“資料驅動決策-決策推動業務發展”的機制,就必須先有資料倉庫充當中央存儲庫,供BI查詢和調取,然後再在BI上進行資料的分析與可視化。

但資料分析和商業決策發展至今,企業想要實作資料驅動決策,是否還是無法繞過資料倉庫?在現代商業環境中重新定義BI和資料倉庫,我們又能不能找到合适的替代方案?

今天,我們就這個命題展開讨論,希望能給大家提供一些思路。

數倉:BI背後的引擎(或管道)

資料倉庫:從字面意義上即資料的倉庫,是為了把操作型資料內建到統一的環境中,以提供決策型資料通路。資料倉庫關注的是解決資料一緻性,可信性,集合性.......這些問題,把越來越複雜的業務資料轉化成對于業務營運、業務分析來說簡單易用的資料形式;資料倉庫的終極目标是讓資料應用人員(無論是CEO還是普通分析師)思考怎麼使用資料倉庫裡的這些資料,創造更多的資訊與價值;而不是發愁資料在哪裡,資料對不對。

BI(商業智能):BI是分析資料并擷取洞察力、進而幫助企業做出決策的一系列方法、技術和軟體。相比資料倉庫,BI中還包含了資料挖掘,資料可視化,多元分析,标簽分類等方面。拿多元分析舉個例子,資料倉庫中隻是提供了次元化的資料,但是基于某些工具,比如Ebay的kylen或者IBM的Cognos等,可以支援使用者在一定範圍内任意組合次元與名額,那這就上升到了決策支援的層面而不是“進階資料倉儲”層面了,也就是使用了資料倉庫的資料,但不是資料倉庫的功能。

BI和資料倉庫:企業分析決策真的離不開資料倉庫嗎?數倉:BI背後的引擎(或管道)從現代商業決策視角,重新審視BI與資料倉庫的關系企業建構分析決策架構的靈活政策

BI與資料倉庫的相關性(圖檔來源于網絡)

傳統BI項目的建構路徑決定了其必須依賴資料倉庫才能進行資料分析。比如MicroStrategy,SAP BW,微軟 Analysis Server, IBM的Cognos,Oracle的OBIEE,這些傳統BI工具不具備使資料內建标準化的能力,資料倉庫的存在就是幫助他們建立資料治理結構,解決資料備援、不一緻、錯誤、無法輕松通路等問題。

另一方面,BI對資料倉庫的這種依賴其實存在着極大的缺陷。一般來說,資料倉庫通常需要花費高經濟成本、時間成本從規劃到落地,但創造的價值大多數情況比較有限,ROI較低。搭建成功後,資料倉庫也僅支援極少數特定類型的分析,如果企業業務出現調整或者需要處理新類型的資料,屆時又将重新面臨重大的開發工作。

從現代商業決策視角,重新審視BI與資料倉庫的關系

在如今轉向服務導向架構(SOA)(*由Gartner提出,以“服務”為基本元素來組建企業IT架構的方式。SOA要解決的主要問題是:快速建構與應用內建,現已成為解決企業業務發展需求與企業IT支援能力之間沖突的最佳方案。)的技術大背景中,耗費巨大心力進行大規模的資料整合和資料內建操作是否還有必要?建構數倉的收益是否能大于你将付出的成本?

再加上企業資料體量不斷提升,業務發展越來越迅速,對快速印證分析決策也提出了更高要求,更多的企業希望能夠降低技術設施成本,做到近乎實時地通路操作源資料,在極短的時間内響應使用者請求。

BI和資料倉庫:企業分析決策真的離不開資料倉庫嗎?數倉:BI背後的引擎(或管道)從現代商業決策視角,重新審視BI與資料倉庫的關系企業建構分析決策架構的靈活政策

資料倉庫和BI的體系結構(圖檔來源于網絡)

于是我們看到了越來越多沒有數倉的BI項目。一方面,靈活BI的興起,允許使用者快速接入各類資料源,無需借助數倉即可實作資料導入-處理-分析的流程。而另一方面,新一代AI+BI智能資料分析平台,則在快速接入、靈活分析的基礎上,實作了更進一步的應用:

  1. 自帶輕量的分布式資料存儲與資料流處理子產品,提供從資料抽取、資料模組化、資料分析,到資料可視化、預警分發的一站式資料分析應用能力;
  2. 即便不抽取資料,也可實作多資料源的聯邦動态分析(關聯、鑽取、動态參數等互動分析功能)。

在這個角度上來看,一定程度上可以在沒有資料倉庫的前提下實作智能資料分析,但是,這僅限于資料量有限的中小型企業,不意味着我們推薦直接拿資料分析平台上的資料存儲當做資料倉庫來用。

因為随着企業使用者資料量、分析複雜度的不斷提升,資料分析平台上輕量式資料存儲與資料流處理子產品是難以承受巨大的計算壓力的,從企業長遠發展的角度上考量,還是需要有計劃地建設資料倉庫或資料平台。

企業建構分析決策架構的靈活政策

企業分析決策架構的未來前景,取決于業務驅動因素以及技術的發展方向。如今企業資料呈指數級增長,對實時分析的需求比以往任何時候都要強烈,鑒于此,如何兼顧快速落地與高可擴充性,有機結合資料倉庫來建構企業分析決策架構,仍是擺在衆多企業面前的一個巨大難題。

對此,我們推薦的最佳實踐是:

  1. 在數倉尚未搭建或分析思路尚未成型時,直接在BI平台内快速建構分析應用,快速回報、快速疊代,實作quick win。
  2. 在分析結果得到業務的印證後,再将資料沉澱和複雜分析邏輯逐漸固化到資料倉庫或資料平台裡面實施,此時BI平台僅擔負輕量的資料分析與可視化壓力。

我們認為,資料分析的本質是為業務發展、商業決策而服務,而不是建立一堆無用的可視化圖表。通過以上提到的這種靈活開發,快速印證,不斷沉澱的過程,将能夠更大程度上確定企業分析決策架構的方向正确,獲得業務端的認同,驅動業務發展,進而産生真正的商業價值。

繼續閱讀