天天看點

Redis應用場景

Redis适用場景

 1.少量資料存儲,高速讀寫通路。此類産品通過資料全部in-momery 的方式來保證高速通路,同時提供資料落地的功能,實際這正是Redis最主要的适用場景。

  2.海量資料存儲,分布式系統支援,資料一緻性保證,友善的叢集節點添加/删除。

  3.這方面最具代表性的是dynamo和bigtable 2篇論文所闡述的思路。前者是一個完全無中心的設計,節點之間通過gossip方式傳遞叢集資訊,資料保證最終一緻性,後者是一個中心化的方案設計,通過類似一個分布式鎖服務來保證強一緻性,資料寫入先寫記憶體和redo log,然後定期compat歸并到磁盤上,将随機寫優化為順序寫,提高寫入性能。

  4.Schema free,auto-sharding等。比如目前常見的一些文檔資料庫都是支援schema-free的,直接存儲json格式資料,并且支援auto-sharding等功能,比如mongodb。

  面對這些不同類型的NoSQL産品,我們需要根據我們的業務場景選擇最合适的産品。

       Redis最适合所有資料in-momory的場景,雖然Redis也提供持久化功能,但實際更多的是一個disk-backed的功能,跟傳統意義上的持久化有比較大的差别,那麼可能大家就會有疑問,似乎Redis更像一個加強版的Memcached,那麼何時使用Memcached,何時使用Redis呢?

       如果簡單地比較Redis與Memcached的差別,大多數都會得到以下觀點:

     1 、Redis不僅僅支援簡單的k/v類型的資料,同時還提供list,set,zset,hash等資料結構的存儲。

     2 、Redis支援資料的備份,即master-slave模式的資料備份。

     3 、Redis支援資料的持久化,可以将記憶體中的資料保持在磁盤中,重新開機的時候可以再次加載進行使用。

2.  Redis常用資料類型

Redis最為常用的資料類型主要有以下:
String
Hash
List
Set
Sorted set
pub/sub
Transactions      

在具體描述這幾種資料類型之前,我們先通過一張圖了解下Redis内部記憶體管理中是如何描述這些不同資料類型的:

Redis應用場景

       首先Redis内部使用一個redisObject對象來表示所有的key和value, redisObject最主要的資訊如上圖所示:

         type代表:一個value對象具體是何種資料類型,

         encoding:是不同資料類型在redis内部的存儲方式,

         比如:type=string代表value存儲的是一個普通字元串,那麼對應的encoding可以是raw或者是int,如果是int則代表實際redis内部是按數值型類存儲和表示這個字元串的,當然前提是這個字元串本身可以用數值表示,比如:"123" "456"這樣的字元串。

       這裡需要特殊說明一下vm字段,隻有打開了Redis的虛拟記憶體功能,此字段才會真正的配置設定記憶體,該功能預設是關閉狀态的,該功能會在後面具體描述。通過上圖我們可以發現Redis使用redisObject來表示所有的key/value資料是比較浪費記憶體的,當然這些記憶體管理成本的付出主要也是為了給Redis不同資料類型提供一個統一的管理接口,實際作者也提供了多種方法幫助我們盡量節省記憶體使用。

3.  各種資料類型應用和實作方式

  • String:

Strings 資料結構是簡單的key-value類型,value其實不僅是String,也可以是數字.

常用指令:  set,get,decr,incr,mget 等。

應用場景:String是最常用的一種資料類型,普通的key/ value 存儲都可以歸為此類.即可以完全實作目前 Memcached 的功能,并且效率更高。還可以享受Redis的定時持久化,記錄檔及 Replication等功能。除了提供與 Memcached 一樣的get、set、incr、decr 等操作外,Redis還提供了下面一些操作:

    • 擷取字元串長度
    • 往字元串append内容
    • 設定和擷取字元串的某一段内容
    • 設定及擷取字元串的某一位(bit)
    • 批量設定一系列字元串的内容
實作方式:String在redis内部存儲預設就是一個字元串,被redisObject所引用,當遇到incr,decr等操作時會轉成數值型進行計算,此時redisObject的encoding字段為int。
  • Hash

常用指令:hget,hset,hgetall 等。

應用場景:在Memcached中,我們經常将一些結構化的資訊打包成HashMap,在用戶端序列化後存儲為一個字元串的值,比如使用者的昵稱、年齡、性别、積分等,這時候在需要修改其中某一項時,通常需要将所有值取出反序列化後,修改某一項的值,再序列化存儲回去。這樣不僅增大了開銷,也不适用于一些可能并發操作的場合(比如兩個并發的操作都需要修改積分)。而Redis的Hash結構可以使你像在資料庫中Update一個屬性一樣隻修改某一項屬性值。

        我們簡單舉個執行個體來描述下Hash的應用場景,比如我們要存儲一個使用者資訊對象資料,包含以下資訊:

使用者ID為查找的key,存儲的value使用者對象包含姓名,年齡,生日等資訊,如果用普通的key/value結構來存儲,主要有以下2種存儲方式:

Redis應用場景
第一種方式将使用者ID作為查找key,把其他資訊封裝成一個對象以序列化的方式存儲,這種方式的缺點是,增加了序列化/反序列化的開銷,并且在需要修改其中一項資訊時,需要把整個對象取回,并且修改操作需要對并發進行保護,引入CAS等複雜問題。
Redis應用場景

第二種方法是這個使用者資訊對象有多少成員就存成多少個key-value對兒,用使用者ID+對應屬性的名稱作為唯一辨別來取得對應屬性的值,雖然省去了序列化開銷和并發問題,但是使用者ID為重複存儲,如果存在大量這樣的資料,記憶體浪費還是非常可觀的。

那麼Redis提供的Hash很好的解決了這個問題,Redis的Hash實際是内部存儲的Value為一個HashMap,并提供了直接存取這個Map成員的接口,如下圖:

Redis應用場景

也就是說,Key仍然是使用者ID, value是一個Map,這個Map的key是成員的屬性名,value是屬性值,這樣對資料的修改和存取都可以直接通過其内部Map的Key(Redis裡稱内部Map的key為field), 也就是通過 key(使用者ID) + field(屬性标簽) 就可以操作對應屬性資料了,既不需要重複存儲資料,也不會帶來序列化和并發修改控制的問題。很好的解決了問題。

這裡同時需要注意,Redis提供了接口(hgetall)可以直接取到全部的屬性資料,但是如果内部Map的成員很多,那麼涉及到周遊整個内部Map的操作,由于Redis單線程模型的緣故,這個周遊操作可能會比較耗時,而另其它用戶端的請求完全不響應,這點需要格外注意。

實作方式:

上面已經說到Redis Hash對應Value内部實際就是一個HashMap,實際這裡會有2種不同實作,這個Hash的成員比較少時Redis為了節省記憶體會采用類似一維數組的方式來緊湊存儲,而不會采用真正的HashMap結構,對應的value redisObject的encoding為zipmap,當成員數量增大時會自動轉成真正的HashMap,此時encoding為ht。

  • List

常用指令:lpush,rpush,lpop,rpop,lrange等。

應用場景:

Redis list的應用場景非常多,也是Redis最重要的資料結構之一,比如twitter的關注清單,粉絲清單等都可以用Redis的list結構來實作。

Lists 就是連結清單,相信略有資料結構知識的人都應該能了解其結構。使用Lists結構,我們可以輕松地實作最新消息排行等功能。Lists的另一個應用就是消息隊列,

可以利用Lists的PUSH操作,将任務存在Lists中,然後工作線程再用POP操作将任務取出進行執行。Redis還提供了操作Lists中某一段的api,你可以直接查詢,删除Lists中某一段的元素。

Redis list的實作為一個雙向連結清單,即可以支援反向查找和周遊,更友善操作,不過帶來了部分額外的記憶體開銷,Redis内部的很多實作,包括發送緩沖隊列等也都是用的這個資料結構。

  • Set

常用指令:

sadd,spop,smembers,sunion 等。

Redis set對外提供的功能與list類似是一個清單的功能,特殊之處在于set是可以自動排重的,當你需要存儲一個清單資料,又不希望出現重複資料時,set是一個很好的選擇,并且set提供了判斷某個成員是否在一個set集合内的重要接口,這個也是list所不能提供的。

Sets 集合的概念就是一堆不重複值的組合。利用Redis提供的Sets資料結構,可以存儲一些集合性的資料,比如在微網誌應用中,可以将一個使用者所有的關注人存在一個集合中,将其所有粉絲存在一個集合。Redis還為集合提供了求交集、并集、差集等操作,可以非常友善的實作如共同關注、共同喜好、二度好友等功能,對上面的所有集合操作,你還可以使用不同的指令選擇将結果傳回給用戶端還是存集到一個新的集合中。

set 的内部實作是一個 value永遠為null的HashMap,實際就是通過計算hash的方式來快速排重的,這也是set能提供判斷一個成員是否在集合内的原因。

  • Sorted Set

zadd,zrange,zrem,zcard等

使用場景:

Redis sorted set的使用場景與set類似,差別是set不是自動有序的,而sorted set可以通過使用者額外提供一個優先級(score)的參數來為成員排序,并且是插入有序的,即自動排序。當你需要一個有序的并且不重複的集合清單,那麼可以選擇sorted set資料結構,比如twitter 的public timeline可以以發表時間作為score來存儲,這樣擷取時就是自動按時間排好序的。

另外還可以用Sorted Sets來做帶權重的隊列,比如普通消息的score為1,重要消息的score為2,然後工作線程可以選擇按score的倒序來擷取工作任務。讓重要的任務優先執行。

Redis sorted set的内部使用HashMap和跳躍表(SkipList)來保證資料的存儲和有序,HashMap裡放的是成員到score的映射,而跳躍表裡存放的是所有的成員,排序依據是HashMap裡存的score,使用跳躍表的結構可以獲得比較高的查找效率,并且在實作上比較簡單。

  • Pub/Sub
Pub/Sub 從字面上了解就是釋出(Publish)與訂閱(Subscribe),在Redis中,你可以設定對某一個key值進行消息釋出及消息訂閱,當一個key值上進行了消息釋出後,所有訂閱它的用戶端都會收到相應的消息。這一功能最明顯的用法就是用作實時消息系統,比如普通的即時聊天,群聊等功能。
  • Transactions
誰說NoSQL都不支援事務,雖然Redis的Transactions提供的并不是嚴格的ACID的事務(比如一串用EXEC送出執行的指令,在執行中伺服器當機,那麼會有一部分指令執行了,剩下的沒執行),但是這個Transactions還是提供了基本的指令打包執行的功能(在伺服器不出問題的情況下,可以保證一連串的指令是順序在一起執行的,中間有會有其它用戶端指令插進來執行)。Redis還提供了一個Watch功能,你可以對一個key進行Watch,然後再執行Transactions,在這過程中,如果這個Watched的值進行了修改,那麼這個Transactions會發現并拒絕執行。

4.  Redis實際應用場景

        Redis在很多方面與其他資料庫解決方案不同:它使用記憶體提供主存儲支援,而僅使用硬碟做持久性的存儲;它的資料模型非常獨特,用的是單線程。另一個大差別在于,你可以在開發環境中使用Redis的功能,但卻不需要轉到Redis。

轉向Redis當然也是可取的,許多開發者從一開始就把Redis作為首選資料庫;但設想如果你的開發環境已經搭建好,應用已經在上面運作了,那麼更換資料庫架構顯然不那麼容易。另外在一些需要大容量資料集的應用,Redis也并不适合,因為它的資料集不會超過系統可用的記憶體。是以如果你有大資料應用,而且主要是讀取通路模式,那麼Redis并不是正确的選擇。

        然而我喜歡Redis的一點就是你可以把它融入到你的系統中來,這就能夠解決很多問題,比如那些你現有的資料庫處理起來感到緩慢的任務。這些你就可以通過Redis來進行優化,或者為應用建立些新的功能。在本文中,我就想探讨一些怎樣将Redis加入到現有的環境中,并利用它的原語指令等功能來解決 傳統環境中碰到的一些常見問題。在這些例子中,Redis都不是作為首選資料庫。

1、顯示最新的項目清單

下面這個語句常用來顯示最新項目,随着資料多了,查詢毫無疑問會越來越慢。

  1. SELECT * FROM foo WHERE ... ORDER BY time DESC LIMIT 10   

        在Web應用中,“列出最新的回複”之類的查詢非常普遍,這通常會帶來可擴充性問題。這令人沮喪,因為項目本來就是按這個順序被建立的,但要輸出這個順序卻不得不進行排序操作。

        類似的問題就可以用Redis來解決。比如說,我們的一個Web應用想要列出使用者貼出的最新20條評論。在最新的評論邊上我們有一個“顯示全部”的連結,點選後就可以獲得更多的評論。

        我們假設資料庫中的每條評論都有一個唯一的遞增的ID字段。

        我們可以使用分頁來制作首頁和評論頁,使用Redis的模闆,每次新評論發表時,我們會将它的ID添加到一個Redis清單:

  1. LPUSH latest.comments <ID>   

       我們将清單裁剪為指定長度,是以Redis隻需要儲存最新的5000條評論:

       LTRIM latest.comments 0 5000 

      每次我們需要擷取最新評論的項目範圍時,我們調用一個函數來完成(使用僞代碼):

      這裡我們做的很簡單。在Redis中我們的最新ID使用了常駐緩存,這是一直更新的。但是我們做了限制不能超過5000個ID,是以我們的擷取ID函數會一直詢問Redis。隻有在start/count參數超出了這個範圍的時候,才需要去通路資料庫。

        我們的系統不會像傳統方式那樣“重新整理”緩存,Redis執行個體中的資訊永遠是一緻的。SQL資料庫(或是硬碟上的其他類型資料庫)隻是在使用者需要擷取“很遠”的資料時才會被觸發,而首頁或第一個評論頁是不會麻煩到硬碟上的資料庫了。

2、删除與過濾

      我們可以使用LREM來删除評論。如果删除操作非常少,另一個選擇是直接跳過評論條目的入口,報告說該評論已經不存在。

       有些時候你想要給不同的清單附加上不同的過濾器。如果過濾器的數量受到限制,你可以簡單的為每個不同的過濾器使用不同的Redis清單。畢竟每個清單隻有5000條項目,但Redis卻能夠使用非常少的記憶體來處理幾百萬條項目。

3、排行榜相關

      另一個很普遍的需求是各種資料庫的資料并非存儲在記憶體中,是以在按得分排序以及實時更新這些幾乎每秒鐘都需要更新的功能上資料庫的性能不夠理想。

      典型的比如那些線上遊戲的排行榜,比如一個Facebook的遊戲,根據得分你通常想要:

         - 列出前100名高分選手

         - 列出某使用者目前的全球排名

      這些操作對于Redis來說小菜一碟,即使你有幾百萬個使用者,每分鐘都會有幾百萬個新的得分。

      模式是這樣的,每次獲得新得分時,我們用這樣的代碼:

      ZADD leaderboard  <score>  <username> 

     你可能用userID來取代username,這取決于你是怎麼設計的。

      得到前100名高分使用者很簡單:ZREVRANGE leaderboard 0 99。

      使用者的全球排名也相似,隻需要:ZRANK leaderboard <username>。

4、按照使用者投票和時間排序

      排行榜的一種常見變體模式就像Reddit或Hacker News用的那樣,新聞按照類似下面的公式根據得分來排序:

       score = points / time^alpha 

      是以使用者的投票會相應的把新聞挖出來,但時間會按照一定的指數将新聞埋下去。下面是我們的模式,當然算法由你決定。

      模式是這樣的,開始時先觀察那些可能是最新的項目,例如首頁上的1000條新聞都是候選者,是以我們先忽視掉其他的,這實作起來很簡單。

      每次新的新聞貼上來後,我們将ID添加到清單中,使用LPUSH + LTRIM,確定隻取出最新的1000條項目。

      有一項背景任務擷取這個清單,并且持續的計算這1000條新聞中每條新聞的最終得分。計算結果由ZADD指令按照新的順序填充生成清單,老新聞則被清除。這裡的關鍵思路是排序工作是由背景任務來完成的。

5、處理過期項目

      另一種常用的項目排序是按照時間排序。我們使用unix時間作為得分即可。

      模式如下:

       - 每次有新項目添加到我們的非Redis資料庫時,我們把它加入到排序集合中。這時我們用的是時間屬性,current_time和time_to_live。

       - 另一項背景任務使用ZRANGE…SCORES查詢排序集合,取出最新的10個項目。如果發現unix時間已經過期,則在資料庫中删除條目。

6、計數

       Redis是一個很好的計數器,這要感謝INCRBY和其他相似指令。

       我相信你曾許多次想要給資料庫加上新的計數器,用來擷取統計或顯示新資訊,但是最後卻由于寫入敏感而不得不放棄它們。

       好了,現在使用Redis就不需要再擔心了。有了原子遞增(atomic increment),你可以放心的加上各種計數,用GETSET重置,或者是讓它們過期。

       例如這樣操作:

         INCR user:<id> EXPIRE 

         user:<id> 60 

       你可以計算出最近使用者在頁面間停頓不超過60秒的頁面浏覽量,當計數達到比如20時,就可以顯示出某些條幅提示,或是其它你想顯示的東西。

7、特定時間内的特定項目

        另一項對于其他資料庫很難,但Redis做起來卻輕而易舉的事就是統計在某段特點時間裡有多少特定使用者通路了某個特定資源。比如我想要知道某些特定的注冊使用者或IP位址,他們到底有多少通路了某篇文章。

      每次我獲得一次新的頁面浏覽時我隻需要這樣做:

       SADD page:day1:<page_id> <user_id> 

      當然你可能想用unix時間替換day1,比如time()-(time()%3600*24)等等。

      想知道特定使用者的數量嗎?隻需要使用SCARD page:day1:<page_id>。

       需要測試某個特定使用者是否通路了這個頁面?SISMEMBER page:day1:<page_id>。

8、實時分析正在發生的情況,用于資料統計與防止垃圾郵件等

        我們隻做了幾個例子,但如果你研究Redis的指令集,并且組合一下,就能獲得大量的實時分析方法,有效而且非常省力。使用Redis原語指令,更容易實施垃圾郵件過濾系統或其他實時跟蹤系統。

9、Pub/Sub

       Redis的Pub/Sub非常非常簡單,運作穩定并且快速。支援模式比對,能夠實時訂閱與取消頻道。

10、隊列

        你應該已經注意到像list push和list pop這樣的Redis指令能夠很友善的執行隊列操作了,但能做的可不止這些:比如Redis還有list pop的變體指令,能夠在清單為空時阻塞隊列。

       現代的網際網路應用大量地使用了消息隊列(Messaging)。消息隊列不僅被用于系統内部元件之間的通信,同時也被用于系統跟其它服務之間的互動。消息隊列的使用可以增加系統的可擴充性、靈活性和使用者體驗。非基于消息隊列的系統,其運作速度取決于系統中最慢的元件的速度(注:短闆效應)。而基于消息隊列可以将系統中各元件解除耦合,這樣系統就不再受最慢元件的束縛,各元件可以異步運作進而得以更快的速度完成各自的工作。

    此外,當伺服器處在高并發操作的時候,比如頻繁地寫入日志檔案。可以利用消息隊列實作異步處理。進而實作高性能的并發操作。

11、緩存

        Redis的緩存部分值得寫一篇新文章,我這裡隻是簡單的說一下。Redis能夠替代memcached,讓你的緩存從隻能存儲資料變得能夠更新資料,是以你不再需要每次都重新生成資料了。

此部分内容的原文位址:http://antirez.com/post/take-advantage-of-redis-adding-it-to-your-stack.html

5.  國内外三個不同領域巨頭分享的Redis實戰經驗及使用場景

     随着應用對高性能需求的增加,NoSQL逐漸在各大名企的系統架構中生根發芽。這裡我們将為大家分享社交巨頭新浪微網誌、傳媒巨頭Viacom及圖檔分享領域佼佼者Pinterest帶來的Redis實踐,首先我們看新浪微網誌 @啟盼cobain的Redis實戰經驗分享:

一、新浪微網誌:史上最大的Redis叢集

Tape is Dead,Disk is Tape,Flash is Disk,RAM Locality is King. — Jim Gray

Redis不是比較成熟的memcache或者Mysql的替代品,是對于大型網際網路類應用在架構上很好的補充。現在有越來越多的應用也在紛紛基于Redis做架構的改造。首先簡單公布一下Redis平台實際情況:

  • 2200+億 commands/day 5000億Read/day 500億Write/day
  • 18TB+ Memory
  • 500+ Servers in 6 IDC 2000+instances

應該是國内外比較大的Redis使用平台,今天主要從應用角度談談Redis服務平台。

Redis使用場景

1.Counting(計數)

計數的應用在另外一篇文章裡較詳細的描述,計數場景的優化 http://www.xdata.me/?p=262這裡就不多加描述了。

可以預見的是,有很多同學認為把計數全部存在記憶體中成本非常高,我在這裡用個圖表來表達下我的觀點:

Redis應用場景

很多情況大家都會設想純使用記憶體的方案會很有很高成本,但實際情況往往會有一些不一樣:

  • COST,對于有一定吞吐需求的應用來說,肯定會單獨申請DB、Cache資源,很多擔心DB寫入性能的同學還會主動将DB更新記入異步隊列,而這三塊的資源的使用率一般都不會太高。資源算下來,你驚異的發現:反而純記憶體的方案會更精簡!
  • KISS原則,這對于開發是非常友好的,我隻需要建立一套連接配接池,不用擔心資料一緻性的維護,不用維護異步隊列。
  • Cache穿透風險,如果後端使用DB,肯定不會提供很高的吞吐能力,cache當機如果沒有妥善處理,那就悲劇了。
  • 大多數的起始存儲需求,容量較小。

2.Reverse cache(反向cache)

面對微網誌常常出現的熱點,如最近出現了較為火爆的短鍊,短時間有數以萬計的人點選、跳轉,而這裡會常常湧現一些需求,比如我們向快速在跳轉時判定使用者等級,是否有一些賬号綁定,性别愛好什麼的,已給其展示不同的内容或者資訊。

普通采用memcache+Mysql的解決方案,當調用id合法的情況下,可支撐較大的吞吐。但當調用id不可控,有較多垃圾使用者調用時,由于memcache未有命中,會大量的穿透至Mysql伺服器,瞬間造成連接配接數瘋長,整體吞吐量降低,響應時間變慢。

這裡我們可以用redis記錄全量的使用者判定資訊,如string key:uid int:type,做一次反向的cache,當使用者在redis快速擷取自己等級等資訊後,再去Mc+Mysql層去擷取全量資訊。如圖:

Redis應用場景

當然這也不是最優化的場景,如用Redis做bloomfilter,可能更加省用記憶體。

3.Top 10 list

産品營運總會讓你展示最近、最熱、點選率最高、活躍度最高等等條件的top list。很多更新較頻繁的清單如果使用MC+MySQL維護的話緩存失效的可能性會比較大,鑒于占用記憶體較小的情況,使用Redis做存儲也是相當不錯的。

4.Last Index

使用者最近通路記錄也是redis list的很好應用場景,lpush lpop自動過期老的登陸記錄,對于開發來說還是非常友好的。

5.Relation List/Message Queue

這裡把兩個功能放在最後,因為這兩個功能在現實問題當中遇到了一些困難,但在一定階段也确實解決了我們很多的問題,故在這裡隻做說明。

Message Queue就是通過list的lpop及lpush接口進行隊列的寫入和消費,由于本身性能較好也能解決大部分問題。

6.Fast transaction with Lua

Redis 的Lua的功能擴充實際給Redis帶來了更多的應用場景,你可以編寫若幹command組合作為一個小型的非阻塞事務或者更新邏輯,如:在收到message推送時,同時1.給自己的增加一個未讀的對話 2.給自己的私信增加一個未讀消息 3.最後給發送人回執一個完成推送消息,這一層邏輯完全可以在Redis Server端實作。

但是,需要注意的是Redis會将lua script的全部内容記錄在aof和傳送給slave,這也将是對磁盤,網卡一個不小的開銷。

7.Instead of Memcache

  1. 很多測試和應用均已證明,
  2. 在性能方面Redis并沒有落後memcache多少,而單線程的模型給Redis反而帶來了很強的擴充性。
  3. 在很多場景下,Redis對同一份資料的記憶體開銷是小于memcache的slab配置設定的。
  4. Redis提供的資料同步功能,其實是對cache的一個強有力功能擴充。

Redis使用的重要點

1.rdb/aof Backup!

我們線上的Redis 95%以上是承擔後端存儲功能的,我們不僅用作cache,而更為一種k-v存儲,他完全替代了後端的存儲服務(MySQL),故其資料是非常重要的,如果出現資料污染和丢失,誤操作等情況,将是難以恢複的。是以備份是非常必要的!為此,我們有共享的hdfs資源作為我們的備份池,希望能随時可以還原業務所需資料。

2.Small item & Small instance!

由于Redis單線程(嚴格意義上不是單線程,但認為對request的處理是單線程的)的模型,大的資料結構list,sorted set,hash set的批量處理就意味着其他請求的等待,故使用Redis的複雜資料結構一定要控制其單key-struct的大小。

另外,Redis單執行個體的記憶體容量也應該有嚴格的限制。單執行個體記憶體容量較大後,直接帶來的問題就是故障恢複或者Rebuild從庫的時候時間較長,而更糟糕的是,Redis rewrite aof和save rdb時,将會帶來非常大且長的系統壓力,并占用額外記憶體,很可能導緻系統記憶體不足等嚴重影響性能的線上故障。我們線上96G/128G記憶體伺服器不建議單執行個體容量大于20/30G。

3.Been Available!

業界資料和使用比較多的是Redis sentinel(哨兵)

http://www.huangz.me/en/latest/storage/redis_code_analysis/sentinel.html

http://qiita.com/wellflat/items/8935016fdee25d4866d9

2000行C實作了伺服器狀态檢測,自動故障轉移等功能。

但由于自身實際架構往往會複雜,或者考慮的角度比較多,為此 @許琦eryk和我一同做了hypnos項目。

hypnos是神話中的睡神,字面意思也是希望我們工程師無需在休息時間處理任何故障。:-)

其工作原理示意如下:

Redis應用場景

Talk is cheap, show me your code! 稍後将單獨寫篇部落格細緻講下Hypnos的實作。

4.In Memory or not?

發現一種情況,開發在溝通後端資源設計的時候,常常因為習慣使用和錯誤了解産品定位等原因,而忽視了對真實使用使用者的評估。也許這是一份曆史資料,隻有最近一天的資料才有人進行通路,而把曆史資料的容量和最近一天請求量都抛給記憶體類的存儲現實是非常不合理的。

是以當你在究竟使用什麼樣的資料結構存儲的時候,請務必先進行成本衡量,有多少資料是需要存儲在記憶體中的?有多少資料是對使用者真正有意義的。因為這其實對後端資源的設計是至關重要的,1G的資料容量和1T的資料容量對于設計思路是完全不一樣的

Plans in future?

1.slave sync改造

全部改造線上master-slave資料同步機制,這一點我們借鑒了MySQL Replication的思路,使用rdb+aof+pos作為資料同步的依據,這裡簡要說明為什麼官方提供的psync沒有很好的滿足我們的需求:

假設A有兩個從庫B及C,及 A `— B&C,這時我們發現master A伺服器有當機隐患需要重新開機或者A節點直接當機,需要切換B為新的主庫,如果A、B、C不共享rdb及aof資訊,C在作為B的從庫時,仍會清除自身資料,因為C節點隻記錄了和A節點的同步狀況。

故我們需要有一種将A`–B&C 結構切換切換為A`–B`–C結構的同步機制,psync雖然支援斷點續傳,但仍無法支援master故障的平滑切換。

實際上我們已經在我們定制的Redis計數服務上使用了如上功能的同步,效果非常好,解決了運維負擔,但仍需向所有Redis服務推廣,如果可能我們也會向官方Redis提出相關sync slave的改進。

2.更适合redis的name-system Or proxy

細心的同學發現我們除了使用DNS作為命名系統,也在zookeeper中有一份記錄,為什麼不讓使用者直接通路一個系統,zk或者DNS選擇其一呢?

其實還是很簡單,命名系統是個非常重要的元件,而dns是一套比較完善的命名系統,我們為此做了很多改進和試錯,zk的實作還是相對複雜,我們還沒有較強的把控粒度。我們也在思考用什麼做命名系統更符合我們需求。

3.後端資料存儲

大記憶體的使用肯定是一個重要的成本優化方向,flash盤及分布式的存儲也在我們未來計劃之中。(原文連結: Largest Redis Clusters Ever)

二、Pinterest:Reids維護上百億的相關性

      Pinterest已經成為矽谷最瘋故事之一,在2012年,他們基于PC的業務增加1047%,移動端采用增加1698%, 該年3月其獨立通路數量更飙升至533億。在Pinterest,人們關注的事物以百億記——每個使用者界面都會查詢某個board或者是使用者是否關注的行為促成了異常複雜的工程問題。這也讓Redis獲得了用武之地。經過數年的發展,Pinterest已經成為媒體、社交等多個領域的佼佼者,其輝煌戰績如下:

  • 獲得的推薦流量高于Google+、YouTube及LinkedIn三者的總和
  • 與Facebook及Twitter一起成為最流行的三大社交網絡
  • 參考Pinterest進行購買的使用者比其它網站更高( 更多詳情)

如您所想,基于其獨立通路數,Pinterest的高規模促成了一個非常高的IT基礎設施需求。

Redis應用場景

通過緩存來優化使用者體驗

近日,Pinterest工程經理Abhi Khune對其公司的使用者體驗需求及Redis的使用經驗 進行了分享。即使是滋生的應用程式打造者,在分析網站的細節之前也不會了解這些特性,是以先大緻的了解一下使用場景:首先,為每個粉絲進行提及到的預檢查;其次,UI将準确的顯示使用者的粉絲及關注清單分頁。高效的執行這些操作,每次點選都需要非常高的性能架構。

不能免俗,Pinterest的軟體工程師及架構師已經使用了MySQL及memcache,但是緩存解決方案仍然達到了他們的瓶頸;是以為了擁有更好的使用者體驗,緩存必須被擴充。而在實際操作過程中,工程團隊已然發現緩存隻有當使用者sub-graph已經在緩存中時才會起到作用。是以。任何使用這個系統的人都需要被緩存,這就導緻了整個圖的緩存。同時,最常見的查詢“使用者A是否關注了使用者B”的答案經常是否定的,然而這卻被作為了緩存丢失,進而促成一個資料庫查詢,是以他們需要一個新的方法來擴充緩存。最終,他們團隊決定使用Redis來存儲整個圖,用以服務衆多的清單。

使用Redis存儲大量的Pinterest清單

Pinterest使用了Redis作為解決方案,并将性能推至了記憶體資料庫等級,為使用者儲存多種類型清單:

  • 關注者清單
  • 你所關注的board清單
  • 粉絲清單
  • 關注你board的使用者清單
  • 某個使用者中board中你沒有關注的清單
  • 每個board的關注者及非關注者

Redis為其7000萬使用者存儲了以上的所有清單,本質上講可以說是儲存了所有粉絲圖,通過使用者ID分片。鑒于你可以通過類型來檢視以上清單的資料,分析概要資訊被用看起來更像事務的系統儲存及通路。Pinterest當下的使用者like被限制為10萬,初略進行統計:如果每個使用者關注25個board,将會在使用者及board間産生17.5億的關系。同時更加重要的是,這些關系随着系統的使用每天都會增加。

Pinterest的Reids架構及營運

通過Pinterest的一個創始人了解到,Pinterest開始使用Python及訂制的Django編寫應用程式,并一直持續到其擁有1800萬使用者級日410TB使用者資料的時候。雖然使用了多個存儲對資料進行儲存,工程師根據使用者id使用了8192個虛拟分片,每個分片都運作在一個Redis DB之上,同時1個Redis執行個體将運作多個Redis DB。為了對CPU核心的充分使用,同一台主機上同時使用多線程和單線程Redis執行個體。

鑒于整個資料集運作在記憶體當中,Redis在Amazon EBS上對每秒傳輸進來的寫入都會進行持久化。擴充主要通過兩個方面進行:第一,保持50%的使用率,通過主從轉換,機器上運作的Redis執行個體一半會轉譯到一個新機器上;第二,擴充節點和分片。整個Redis叢集都會使用一個主從配置,從部分将被當做一個熱備份。一旦主節點失敗,從部分會立刻完成主的轉換,同時一個新的從部分将會被添加,ZooKeeper将完成整個過程。同時他們每個小時都會在Amazon S3上運作BGsave做更持久的儲存——這項Reids操作會在後端進行,之後Pinterest會使用這些資料做MapReduce和分析作業。(更多内容見原文)

Redis應用場景

三、Viacom:Redis在系統中的用例盤點

Viacom是全球最大的傳媒集體之一,同時也遭遇了當下最大的資料難題之一:如何處理日益劇增的動态視訊内容。

着眼這一挑戰的上升趨勢,我們會發現:2010年世界上所有資料體積達到ZB級,而單單2012這一年,網際網路産生的資料就增加了2.8個ZB,其中大部分的資料都是非結構化的,包括了視訊和圖檔。

覆寫MVN(以前稱為MTV Networks、Paramount及BET),Viacom是個名副其實的傳媒巨頭,支援衆多人氣站點,其中包括The Daily Show、osh.0、South Park Studios、GameTrailers.com等。作為媒體公司,這些網站上的文檔、圖檔、視訊短片都在無時無刻的更新。長話短說,下面就進入Viacom進階架構師Michael Venezia 分享的Redis實踐:

Viacom的網站架構背景

對于Viacom,橫跨多個站點傳播内容讓必須專注于規模的需求,同時為了将内容竟可能快的傳播到相應使用者,他們還必須聚焦内容之間的關系。然而即使The Daily Show、Nickelodeon、Spike或者是VH1 這些單獨的網站上,日平均PV都可以達到千萬,峰值時流量更會達到平均值的20-30倍。同時基于對實時的需求,動态的規模及速度已成為架構的基礎之一。

除去動态規模之外,服務還必須基于使用者正在浏覽的視訊或者是地理位置來推測使用者的喜好。比如說,某個頁面可能會将一個獨立的視訊片段與本地的促銷,視訊系列的額外部分,甚至是相關視訊聯系起來。為了能讓使用者能在網站上停留更長的時間,他們建立了一個能基于詳細中繼資料自動建立頁面的軟體引擎,這個引擎可以根據使用者當下興趣推薦額外的内容。鑒于用于興趣的随時改變,資料的類型非常廣泛——類似graph-like,實際上做的是大量的join。

這樣做有利于減少類似視訊的大體積檔案副本數,比如資料存儲中一個獨立的記錄是Southpark片段“Cartman gets an Anal Probe”,這個片段可能也會出現在德語的網站上。雖然視訊是一樣的,但是英語使用者搜尋的可能就是另一個不同的詞語。中繼資料的副本轉換成搜尋結果,并指向相同的視訊。是以在美國使用者搜尋真實标題的情況下,德國浏覽者可能會使用轉譯的标題——德國網站上的“Cartman und die Analsonde”。

這些中繼資料覆寫了其它記錄或者是對象,同時還可以根據使用環境來改變内容,通過不同的規則集來限制不同地理位置或者是裝置請求的内容。

Viacom的實作方法

盡管許多機構通過使用ORM及傳統關系型資料庫來解決這個問題,Viacom卻使用了一個迥然不同的方法。

本質上,他們完全承擔不了對資料庫的直接通路。首先,他們處理的大部分都是流資料,他們偏向于使用Akamai從地理上來配置設定内容。其次,基于頁面的複雜性可能會取上萬個對象。取如此多的資料顯然會影響到性能,是以JSON在1個資料服務中投入了使用。當然,這些JSON對象的緩存将直接影響到網站性能。同時,當内容或者是内容之間的關系發生改變時,緩存還需要動态的進行更新。

Viacom依靠對象基元和超類解決這個問題,繼續以South Park為例:一個私有的“episode”類包含了所有該片段相關資訊,一個“super object”将有助于發現實際的視訊對象。超類這個思想确實非常有益于建設低延遲頁面的自動建設,這些超類可以幫助到基元對象到緩存的映射及儲存。

Viacom為什麼要使用Redis

每當Viacom上傳一個視訊片段,系統将建立一個私有的對象,并于1個超類關聯。每一次修改,他們都需要重估私有對象的每個改變,并更新所有複合對象。同時,系統還需要無效Akamail中的URL請求。系統現有架構的組合及更靈活的管理方法需求将Viacom推向了Redis。

基于Viacom主要基于PHP,是以這個解決方案必須支援PHP。他們首先選擇了memcached做對象存儲,但是它并不能很好的支援hashmap;同時他們還需要一個更有效的進行無效步驟的重估,即更好的了解内容的依賴性。本質上說,他們需要時刻跟進無效步驟中的依賴性改變。是以他們選擇了Redis及Predis的組合來解決這個問題。

他們團隊使用Redis給southparkstudios.com和thedailyshow.com兩個網站建設依賴性圖,在取得了很大的成功後他們開始着眼Redis其它适合場景。

Redis的其它使用場景

顯而易見,如果有人使用Redis來建設依賴性圖,那麼使用它來做對象處理也是說得通的。同樣,這也成了架構團隊為Redis選擇的第二使用場景。Redis的複制及持久化特性同時也征服了Viacom的營運團隊,是以在幾個開發周期後,Redis成為他們網站的主要資料及依賴性儲存。

後兩個用例則是行為追蹤及浏覽計數的緩沖,改變後的架構是Redis每幾分鐘向MySQL中儲存一次,而浏覽計數則通過Redis進行存儲及計數。同時Redis還被用來做人氣的計算,一個基于通路數及通路時間的得分系統——如果某個視訊最近被通路的次數越多,它的人氣就越高。在如此多内容上每隔10-15分鐘做一次計算絕對不是類似MySQL這樣傳統關系型資料庫的強項,Viacom使用Redis的理由也非常簡單——在1個存儲浏覽資訊的Redis執行個體上運作Lua批處理作業,計算出所有的得分表。資訊被拷貝到另一個Redis執行個體上,用以支援相關的産品查詢。同時還在MySQL上做了另一個備份,用以以後的分析,這種組合會将這個過程耗費的時間降低60倍。

Viacom還使用Redis存儲一步作業資訊,這些資訊被插入一個清單中,從業人員則使用BLPOP指令行在隊列中抓取頂端的任務。同時zsets被用于從衆多社交網絡(比如Twitter及Tumblr)上綜合内容,Viacom通過Brightcove視訊播放器來同步多個内容管理系統。

橫跨這些用例,幾乎所有的Redis指令都被使用——sets、lists、zlists、hashmaps、scripts、counters等。同時,Redis也成為Viacom可擴充架構中不可或缺的一環。

轉載:http://blog.csdn.net/hguisu/article/details/8836819

繼續閱讀