我認為計算機曆史上最扯淡的詞應該當BI莫屬,BI已經成為花花綠綠圖表的代名詞。很多IT人士張嘴閉嘴BI,也不嫌丢人,明明是個統計圖表系統,非要說成是大資料或者商業智能(Business Intelligence)。
計算機行業技術發展的速度快,愛造詞兒已經成為了社會的共識,更何況還有像Garnter這樣的專業造瓷機器。
其實大資料BI的曆史要追溯到資料庫的發展。自從Codd博士利用關系代數,徹底打敗了層次資料庫和網絡資料庫後,SQL吸收了關系代數的特性,與關系型資料庫一舉成為統治資訊技術世界的工具。
程式設計的本質:網頁連結
面向對象的本質:網頁連結
資料庫是放在磁盤中的速度不快,成為了很多程式員的噩夢,資料量一大也為了大量的程式員提供了非常長久并且安逸的工作機會。稍微有經驗的程式員上來不是做系統設計,首先想的是表結構、join方案以及分庫分表的性能問題。
BI的技術實際上OLAP,這個詞兒也是Codd的博士力排衆議最後确定下來的。當時覺得非要把資料庫分為OLTP和OLAP,但實際技術上并沒有什麼特殊的區分,其實大家骨子裡都是覺得有點扯。 Codd博士為這個區分歸納了兩個理由:
資料分散在不同的資料庫中是一個事實,貫穿資料查詢的需求客觀存在是另一個事實。兩個事實都無法否認,自然這個概念就立住了。
考慮到當時Codd博士正在大資料BI廠商海波龍當顧問拿錢,這裡面多多少少有點為了五鬥米折腰的意思。
是以OLAP的本質實際上就是把業務資料庫中的資料抽出來,如果是要做統計就需要按照後來kimball提出的次元模型來進行,再存一份,然後再進行分析。
其實這就是整個BI所代表的技術基礎,說到這裡你當然也聽得出來這個和大資料、智能沒啥關系,其實如果要做多表Join長鍊路聯查,還需要借助SQL的複雜語句來實作。
如果要為OLAP取個恰當的名字,應該是資料統計報表系統,如果稍微往上擡一點,就可以叫做輔助決策支援系統,輔助嘛,稍微幫上點兒忙也算幫上。但無論如何也難以稱得上是智能。
直到今天,如何快速擷取統計資料仍然是大資料行業的熱點:從大資料hadoop到spark,一直到最近流行的大資料Flink,其本質都是如何從大資料業務資料庫中快速獲得想要的統計結果。
大詞兒雖然用完了,但世界依舊還要前行。
最後問題來了,你認為真正的商業智能應該是什麼呢?評論區見!
#大資料##人工智能##程式員#