天天看點

BI的選型要抓住要點

要選型,首先要了解目前市場上主流的BI産品:

    資料庫方面,有DB2、Oracle、SQL Server、Teradata,早先還有專門用于資料倉庫的Redbrick(被IBM收編以後,退出曆史舞台)。

    ETL工具上,像Datastage、Powercenter都是比較主流的,此外,還有很多公司也有自己的ETL産品,例如SAS的ETL Server、BO的Data Integrator等。

    OLAP工具上,則還可以細分為MOLAP(MuiltDimension OLAP,多元度型線上分析系統)和ROLAP(Relational OLAP,關系型線上分析系統),前者可以選擇Hyperion、Cognos、Microsoft公司的産品,而後者可供選擇的餘地就不多,像 Microstrategy可能是目前能夠看得見市場佔有率比較大的,以前和Redbrick一起。此外,還有一個叫Metacube的ROLAP工具,早在2000年以後也退出市場。

    資料挖掘産品領域,有SAS、SPSS等兩大廠家,而像IBM、Teradata也都有自己的挖掘工具。除此之外,在報表伺服器、前端工具上的選擇可就多了,其中,Cognos、BO、Brio是比較主流的。

    從這些主流産品來看,大多是舶來品。國内也有研發BI産品的,但多限于ETL、前端以及資料挖掘産品。從目前各類使用者的産品選型過程來看,問題多出在以下幾個方面。

    其一,隻見樹木不見森林,隻顧得降低單個工具的成本,卻忽視了總體成本。有些大企業在IT建設上一擲千金,從不在乎在購買産品上投入多少,每一塊都是選用最好的。但是,更多的企業則不得不出于成本考慮,能省則省。除了資料庫和OLAP工具兩項之外,經常動心思的地方就是,設想如果把ETL和前端展現自己來開發是不是會省點資金出來。

    然而問題是,如果僅僅從單個産品的成本考慮而忽視綜合的項目成本,最後很可能會被難以維護的程式所困擾,甚至要完全推翻重來,這樣的成本恐怕會更高。而對于那些财大氣粗的大企業來說,即便選擇了每個領域最好的産品,組合起來也不一定就是最好的。

    其二,評估報告難以客觀。企業負責産品選型的人,通常要求廠商提供一份評估報告,要列出幾種方案選擇,各自優劣何在,最後得出哪種方案是最适合自己的。

    如果從字面上了解此報告,某種産品哪方面比較好,哪方面不好,這并不客觀。對于廠商而言,這就是一筆單子,當然會盡量把自己産品的優勢展現出來,而回避自己的弱勢。同時對于選型負責人來說,也許其早就對某種工具有好感,或是跟某個廠家的關系不錯,甚至有更進一步的交易。這樣的情況,想客觀一點不容易。

    選型要點

    其實,如果是選擇這些主流的産品的話,大家知道一句話,“沒有最好的,隻有最合适的”。什麼是最合适?抛開上面提到的幕後因素,其實也就是三點需要考慮——産品成本、開發人員對這個産品的熟悉程度、有沒有類似案例。

    首先看成本。NCR、IBM和Oracle的産品線完整,但卻很貴。微軟的産品便宜些,可如果資料量大,恐怕又不太敢用它,就更别談那些不要錢的開源産品了。當然,成本不光是産品本身的價格決定的,後面人員學習、項目延期、客戶滿意度低都要作為成本考慮,這些隐型成本才是難以計算的。提到成本,就不能不提一下BI模型,因為BI産品中模型是最昂貴的一部分,在國内很大一部分企業采用的自主開發的方式,采用這種方式可以避免高額的費用,但卻無法學習到國外先進的商業經驗。

    再看人員的經驗。人的學習曲線是不可避免的,不要妄想人們接觸一個新産品就能立馬成為高手,能夠基于陌生的産品做出良好架構。這方面,顯然Oracle 和微軟有優勢,因為在這兩家産品上有經驗的人多,好找。當然,如果你們原來的業務系統用的就是這幾家産品之一,不妨仍然用它。

    其次案例比白皮書更重要。如今很多BI廠商可以提供全方位解決方案,提供一站式服務。像IBM、Oracle、SAS都稱自己是這樣的全方案提供商,也就是說它們的産品線已經包含了資料庫、OLAP、ETL等各類工具。直接選用它們,就不用再為工具選型煩惱了,但企業有時由于各方面的原因,決定不使用一家産品時,要考慮他們之間是否相容。但如果你要是從産品的白皮書裡去尋找此類資訊,會發現說得很美,互相之間會如何完美地“無縫”相容,但實際上卻不是那麼回事。是以,不要去看這些文字的東西,要去尋找同行業類似的案例,如果同行業沒有,就去尋找資料量類似、業務複雜度類似以及相似應用的其他行業案例。

繼續閱讀