天天看點

【閱讀】《千萬不要讓關系資料庫跟這十樣事物摻合到一起》要點

      剛剛看了《千萬不要讓關系資料庫跟這十樣事物摻合到一起》這篇文章,作為資料庫方面的菜鳥,将其中的要點進行摘要整理,同時将一些概念單獨拿出進行說明,友善日後回顧。

====================================

文章中說到的不應該與關系型資料庫參合在一起的事物列舉如下:

搜尋 - 關鍵詞:大多數 rdbms 産品沒能實作真正的搜尋擴充

推薦 - 關鍵詞:跨越式關系會讓 rdbms 非常被動

頻繁交易 - 關鍵詞:關系資料庫在設計上并不适合這類任務

産品目錄 - 關鍵詞:産品資料映射采用字元映射方案是噩夢;采用圖形類資料庫,映射工作會變得簡單易行

使用者/群組與acl - 關鍵詞:“使用者”與“角色”等表格在任何企業環境下都毫無必要的

日志分析 - 關鍵詞:關系資料庫的最大賣點及首要訴求時低延遲,而非日志分析及彙總工作

媒體資源庫 - 關鍵詞:rdbms 中的 blob 仍然不足以有效處理圖像及其它二進制檔案

電子郵件 - 關鍵詞:關系資料庫并不擅長存儲具有非結構化特性的中繼資料

分類廣告 - 關鍵詞:關系資料庫不如檔案類資料庫 mongodb 處理這類問題的能力

時間排序/預報 - 關鍵詞:關系資料庫在時間排序問題方面的表現一直飽受争議

【rac】

rac ,全稱 real application clusters ,譯為“實時應用叢集”,是 oracle 新版資料庫中采用的一項新技術,是高可用性的一種,也是 oracle 資料庫支援網格計算環境的核心技術。

【pl/sql】

pl/sql 也是一種程式語言,叫做過程化 sql 語言(procedural language/sql)。pl/sql 是 oracle 資料庫對 sql 語句的擴充。在普通 sql 語句的使用上增加了程式設計語言的特點,是以 pl/sql 就是把資料操作和查詢語句組織在 pl/sql 代碼的過程性單元中,通過邏輯判斷、循環等操作實作複雜的功能或者計算的程式語言。

【atg】

atg, art technology group (atg), a leading provider of ecommerce software and related on demand commerce optimization applications.

【blob】

blob ,binary large object ,二進制大對象,是一個可以存儲二進制檔案的容器。在計算機中,blob 常常是資料庫中用來存儲二進制檔案的字段類型。blob 是一個大檔案,典型的 blob 是一張圖檔或一個聲音檔案,由于它們的尺寸,必須使用特殊的方式來處理(例如:上傳、下載下傳或者存放到一個資料庫)。根據 eric raymond 的說法,處理 blob 的主要思想就是讓檔案處理器(如資料庫管理器)不去理會檔案是什麼,而是關心如何去處理它。但也有專家強調,這種處理大資料對象的方法是把雙刃劍,它有可能引發一些問題,如存儲的二進制檔案過大,會使資料庫的性能下降。在資料庫中存放體積較大的多媒體對象就是應用程式處理 blob 的典型例子。

【cms】

cms ,即 content management system ,網站内容管理系統。

cms 的功能并不隻限于文本處理,它也可以處理圖檔、flash 動畫、聲像流、圖像甚至電子郵件檔案。

cms 其實是一個很廣泛的稱呼,從一般的部落格程式,新聞釋出程式,到綜合性的網站管理程式都可以被稱為内容管理系統。

【隻言片語】

couchbase 2.0 或者 mongodb 屬于檔案資料庫。

ldap 專門為使用者、群組及 acl 所設計,能夠恰到好處地滿足此類需求。

像日志資訊這樣多少帶有些非結構化特性的資料,正是 mapreduce 公司的 hadoop 以及像 pig 這樣的語言所擅長的領域。

目前各類主流監控工具仍然在以 rdbms 為主要對象。

電子郵件實際是一種具備适度非結構化特性的中繼資料。

檔案類資料庫 mongodb 擅長搜尋、打理中繼資料,非常适合處理廣告的固有特性,對資訊一緻性有足夠的保障。幾乎等于是為廣告量身打造的檔案類資料庫。

如果把時間類任務作為主要處理對象,那麼像 cassandra 這樣能夠與 mapreduce 列簇産品家族良好對接的方案無疑更為理想。

redis 是一個單機的存儲方案;redis 不适合作為海量資料存儲方案。redis 适合在資料規模較小,性能要求較高的條件下應用。redis 是一個非常快速和強大的 key-value 存儲(持久化)系統,相對于一般的 nosql 存儲系統,它最大的特點是支援豐富的資料結構。特别是其 zset(sorted set) 資料結構,堪稱表達能力最強的結構之一( 其它強大的資料結構如 sorted hashmap ),可以直接地表達業務邏輯。