天天看點

《大資料系統建構:可擴充實時資料系統建構原理與最佳實踐》一 1.3 NoSQL不是萬能的

過去的十年,可擴充資料系統已經取得了大量的創新,其中包括如hadoop這樣的大規模計算系統,如cassandra和riak這樣的資料庫。這些系統可以處理大量的資料,但是需要認真的權衡。

比如hadoop可以在非常大量的資料上并行化大規模批量計算,但計算具有較高的延遲。對于任何需要低延遲結果的計算,hadoop是不适用的。

又如cassandra這樣的nosql資料庫,通過提供一個比sql中使用得更有限的資料模型,來實作可擴充性。壓縮應用程式到這些有限的資料模型中是非常複雜的,且因為資料庫是可變的,是以它們不能容忍人為錯誤。

這些工具單獨使用時并不是萬能的。但如果智能地結合使用,那麼就可以生成能處理容忍人為錯誤和最低複雜性的任意資料問題的可擴充系統。這就是本書中将介紹的lambda 架構。