0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

redis應(yīng)用場景及實(shí)例

lhl545545 ? 來源:電子發(fā)燒友網(wǎng) ? 2018-02-09 15:01 ? 次閱讀

前言

Redis是一個開源的使用ANSI C語言編寫、支持網(wǎng)絡(luò)、可基于內(nèi)存亦可持久化的日志型、Key-Value數(shù)據(jù)庫,并提供多種語言的API。在這篇文章中,我們將闡述 Redis 最常用的使用場景,以及那些影響我們選擇的不同特性。

Redis 的 5 個常見使用場景

1、會話緩存(Session Cache)

最常用的一種使用Redis的情景是會話緩存(session cache)。用Redis緩存會話比其他存儲(如Memcached)的優(yōu)勢在于:Redis提供持久化。當(dāng)維護(hù)一個不是嚴(yán)格要求一致性的緩存時,如果用戶的購物車信息全部丟失,大部分人都會不高興的,現(xiàn)在,他們還會這樣嗎?

幸運(yùn)的是,隨著 Redis 這些年的改進(jìn),很容易找到怎么恰當(dāng)?shù)氖褂肦edis來緩存會話的文檔。甚至廣為人知的商業(yè)平臺Magento也提供Redis的插件。

2、全頁緩存(FPC

除基本的會話token之外,Redis還提供很簡便的FPC平臺?;氐揭恢滦詥栴},即使重啟了Redis實(shí)例,因?yàn)橛写疟P的持久化,用戶也不會看到頁面加載速度的下降,這是一個極大改進(jìn),類似PHP本地FPC。

再次以Magento為例,Magento提供一個插件來使用Redis作為全頁緩存后端。

此外,對WordPress的用戶來說,Pantheon有一個非常好的插件 wp-redis,這個插件能幫助你以最快速度加載你曾瀏覽過的頁面。

3、隊(duì)列

Reids在內(nèi)存存儲引擎領(lǐng)域的一大優(yōu)點(diǎn)是提供 list 和 set 操作,這使得Redis能作為一個很好的消息隊(duì)列平臺來使用。Redis作為隊(duì)列使用的操作,就類似于本地程序語言(如Python)對 list 的 push/pop 操作。

如果你快速的在Google中搜索“Redis queues”,你馬上就能找到大量的開源項(xiàng)目,這些項(xiàng)目的目的就是利用Redis創(chuàng)建非常好的后端工具,以滿足各種隊(duì)列需求。例如,Celery有一個后臺就是使用Redis作為broker,你可以從這里去查看。

4、排行榜/計(jì)數(shù)器

Redis在內(nèi)存中對數(shù)字進(jìn)行遞增或遞減的操作實(shí)現(xiàn)的非常好。集合(Set)和有序集合(Sorted Set)也使得我們在執(zhí)行這些操作的時候變的非常簡單,Redis只是正好提供了這兩種數(shù)據(jù)結(jié)構(gòu)。所以,我們要從排序集合中獲取到排名最靠前的10個用戶–我們稱之為“user_scores”,我們只需要像下面一樣執(zhí)行即可:

當(dāng)然,這是假定你是根據(jù)你用戶的分?jǐn)?shù)做遞增的排序。如果你想返回用戶及用戶的分?jǐn)?shù),你需要這樣執(zhí)行:

ZRANGE user_scores 0 10 WITHSCORES

Agora Games就是一個很好的例子,用Ruby實(shí)現(xiàn)的,它的排行榜就是使用Redis來存儲數(shù)據(jù)的,你可以在這里看到。

5、發(fā)布/訂閱

最后(但肯定不是最不重要的)是Redis的發(fā)布/訂閱功能。發(fā)布/訂閱的使用場景確實(shí)非常多。我已看見人們在社交網(wǎng)絡(luò)連接中使用,還可作為基于發(fā)布/訂閱的腳本觸發(fā)器,甚至用Redis的發(fā)布/訂閱功能來建立聊天系統(tǒng)?。ú唬@是真的,你可以去核實(shí))。

Redis提供的所有特性中,我感覺這個是喜歡的人最少的一個,雖然它為用戶提供如果此多功能。

詳解 Redis 應(yīng)用場景及應(yīng)用實(shí)例

1. MySql+Memcached架構(gòu)的問題

實(shí)際MySQL是適合進(jìn)行海量數(shù)據(jù)存儲的,通過Memcached將熱點(diǎn)數(shù)據(jù)加載到cache,加速訪問,很多公司都曾經(jīng)使用過這樣的架構(gòu),但隨著業(yè)務(wù)數(shù)據(jù)量的不斷增加,和訪問量的持續(xù)增長,我們遇到了很多問題:

1.MySQL需要不斷進(jìn)行拆庫拆表,Memcached也需不斷跟著擴(kuò)容,擴(kuò)容和維護(hù)工作占據(jù)大量開發(fā)時間。

2.Memcached與MySQL數(shù)據(jù)庫數(shù)據(jù)一致性問題。

3.Memcached數(shù)據(jù)命中率低或down機(jī),大量訪問直接穿透到DB,MySQL無法支撐。

4.跨機(jī)房cache同步問題。

眾多NoSQL百花齊放,如何選擇

最近幾年,業(yè)界不斷涌現(xiàn)出很多各種各樣的NoSQL產(chǎn)品,那么如何才能正確地使用好這些產(chǎn)品,最大化地發(fā)揮其長處,是我們需要深入研究和思考的問題,實(shí)際歸根結(jié)底最重要的是了解這些產(chǎn)品的定位,并且了解到每款產(chǎn)品的tradeoffs,在實(shí)際應(yīng)用中做到揚(yáng)長避短,總體上這些NoSQL主要用于解決以下幾種問題

1.少量數(shù)據(jù)存儲,高速讀寫訪問。此類產(chǎn)品通過數(shù)據(jù)全部in-momery 的方式來保證高速訪問,同時提供數(shù)據(jù)落地的功能,實(shí)際這正是Redis最主要的適用場景。

2.海量數(shù)據(jù)存儲,分布式系統(tǒng)支持,數(shù)據(jù)一致性保證,方便的集群節(jié)點(diǎn)添加/刪除。

3.這方面最具代表性的是dynamo和bigtable 2篇論文所闡述的思路。前者是一個完全無中心的設(shè)計(jì),節(jié)點(diǎn)之間通過gossip方式傳遞集群信息,數(shù)據(jù)保證最終一致性,后者是一個中心化的方案設(shè)計(jì),通過類似一個分布式鎖服務(wù)來保證強(qiáng)一致性,數(shù)據(jù)寫入先寫內(nèi)存和redo log,然后定期compat歸并到磁盤上,將隨機(jī)寫優(yōu)化為順序?qū)?,提高寫入性能?/p>

4.Schema free,auto-sharding等。比如目前常見的一些文檔數(shù)據(jù)庫都是支持schema-free的,直接存儲json格式數(shù)據(jù),并且支持auto-sharding等功能,比如mongodb。

面對這些不同類型的NoSQL產(chǎn)品,我們需要根據(jù)我們的業(yè)務(wù)場景選擇最合適的產(chǎn)品。

Redis最適合所有數(shù)據(jù)in-momory的場景,雖然Redis也提供持久化功能,但實(shí)際更多的是一個disk-backed的功能,跟傳統(tǒng)意義上的持久化有比較大的差別,那么可能大家就會有疑問,似乎Redis更像一個加強(qiáng)版的Memcached,那么何時使用Memcached,何時使用 Redis呢?

如果簡單地比較Redis與Memcached的區(qū)別,大多數(shù)都會得到以下觀點(diǎn):

1 、Redis不僅僅支持簡單的k/v類型的數(shù)據(jù),同時還提供list,set,zset,hash等數(shù)據(jù)結(jié)構(gòu)的存儲。

2 、Redis支持?jǐn)?shù)據(jù)的備份,即master-slave模式的數(shù)據(jù)備份。

3 、Redis支持?jǐn)?shù)據(jù)的持久化,可以將內(nèi)存中的數(shù)據(jù)保持在磁盤中,重啟的時候可以再次加載進(jìn)行使用。

2. Redis常用數(shù)據(jù)類型

Redis最為常用的數(shù)據(jù)類型主要有以下:

String

Hash

List

Set

Sorted set

pub/sub

Transactions

在具體描述這幾種數(shù)據(jù)類型之前,我們先通過一張圖了解下Redis內(nèi)部內(nèi)存管理中是如何描述這些不同數(shù)據(jù)類型的:

redis應(yīng)用場景及實(shí)例

首先Redis內(nèi)部使用一個redisObject對象來表示所有的key和value,redisObject最主要的信息如上圖所示:

type代表一個value對象具體是何種數(shù)據(jù)類型,

encoding是不同數(shù)據(jù)類型在redis內(nèi)部的存儲方式,

比如:type=string代表value存儲的是一個普通字符串,那么對應(yīng)的encoding可以是raw或者是int,如果是int則代表實(shí)際 redis內(nèi)部是按數(shù)值型類存儲和表示這個字符串的,當(dāng)然前提是這個字符串本身可以用數(shù)值表示,比如:”123″ “456″這樣的字符串。

這里需要特殊說明一下vm字段,只有打開了Redis的虛擬內(nèi)存功能,此字段才會真正的分配內(nèi)存,該功能默認(rèn)是關(guān)閉狀態(tài)的,該功能會在后面具體描述。通過上圖我們可以發(fā)現(xiàn)Redis使用redisObject來表示所有的key/value數(shù)據(jù)是比較浪費(fèi)內(nèi)存的,當(dāng)然這些內(nèi)存管理成本的付出主要也是為了給 Redis不同數(shù)據(jù)類型提供一個統(tǒng)一的管理接口,實(shí)際作者也提供了多種方法幫助我們盡量節(jié)省內(nèi)存使用,我們隨后會具體討論。

3. 各種數(shù)據(jù)類型應(yīng)用和實(shí)現(xiàn)方式

下面我們先來逐一的分析下這7種數(shù)據(jù)類型的使用和內(nèi)部實(shí)現(xiàn)方式:

String:

Strings 數(shù)據(jù)結(jié)構(gòu)是簡單的key-value類型,value其實(shí)不僅是String,也可以是數(shù)字。

常用命令: set,get,decr,incr,mget 等。

應(yīng)用場景:String是最常用的一種數(shù)據(jù)類型,普通的key/ value 存儲都可以歸為此類。即可以完全實(shí)現(xiàn)目前 Memcached 的功能,并且效率更高。還可以享受Redis的定時持久化,操作日志及 Replication等功能。除了提供與 Memcached 一樣的get、set、incr、decr 等操作外,Redis還提供了下面一些操作:

獲取字符串長度

往字符串a(chǎn)ppend內(nèi)容

設(shè)置和獲取字符串的某一段內(nèi)容

設(shè)置及獲取字符串的某一位(bit)

批量設(shè)置一系列字符串的內(nèi)容

實(shí)現(xiàn)方式:String在redis內(nèi)部存儲默認(rèn)就是一個字符串,被redisObject所引用,當(dāng)遇到incr,decr等操作時會轉(zhuǎn)成數(shù)值型進(jìn)行計(jì)算,此時redisObject的encoding字段為int。

Hash

常用命令:hget,hset,hgetall 等。

應(yīng)用場景:在Memcached中,我們經(jīng)常將一些結(jié)構(gòu)化的信息打包成HashMap,在客戶端序列化后存儲為一個字符串的值,比如用戶的昵稱、年齡、性別、積分等,這時候在需要修改其中某一項(xiàng)時,通常需要將所有值取出反序列化后,修改某一項(xiàng)的值,再序列化存儲回去。這樣不僅增大了開銷,也不適用于一些可能并發(fā)操作的場合(比如兩個并發(fā)的操作都需要修改積分)。而Redis的Hash結(jié)構(gòu)可以使你像在數(shù)據(jù)庫中Update一個屬性一樣只修改某一項(xiàng)屬性值。

我們簡單舉個實(shí)例來描述下Hash的應(yīng)用場景,比如我們要存儲一個用戶信息對象數(shù)據(jù),包含以下信息:

用戶ID為查找的key,存儲的value用戶對象包含姓名,年齡,生日等信息,如果用普通的key/value結(jié)構(gòu)來存儲,主要有 2種存儲方式。

第一種方式將用戶ID作為查找key,把其他信息封裝成一個對象以序列化的方式存儲,這種方式的缺點(diǎn)是,增加了序列化/反序列化的開銷,并且在需要修改其中一項(xiàng)信息時,需要把整個對象取回,并且修改操作需要對并發(fā)進(jìn)行保護(hù),引入CAS等復(fù)雜問題。

第二種方法是這個用戶信息對象有多少成員就存成多少個key-value對兒,用用戶ID+對應(yīng)屬性的名稱作為唯一標(biāo)識來取得對應(yīng)屬性的值,雖然省去了序列化開銷和并發(fā)問題,但是用戶ID為重復(fù)存儲,如果存在大量這樣的數(shù)據(jù),內(nèi)存浪費(fèi)還是非??捎^的。

那么Redis提供的Hash很好的解決了這個問題,Redis的Hash實(shí)際是內(nèi)部存儲的Value為一個HashMap,并提供了直接存取這個Map成員的接口。

也就是說,Key仍然是用戶ID, value是一個Map,這個Map的key是成員的屬性名,value是屬性值,這樣對數(shù)據(jù)的修改和存取都可以直接通過其內(nèi)部Map的 Key(Redis里稱內(nèi)部Map的key為field), 也就是通過 key(用戶ID) + field(屬性標(biāo)簽) 就可以操作對應(yīng)屬性數(shù)據(jù)了,既不需要重復(fù)存儲數(shù)據(jù),也不會帶來序列化和并發(fā)修改控制的問題。很好的解決了問題。

這里同時需要注意,Redis提供了接口(hgetall)可以直接取到全部的屬性數(shù)據(jù),但是如果內(nèi)部Map的成員很多,那么涉及到遍歷整個內(nèi)部 Map的操作,由于Redis單線程模型的緣故,這個遍歷操作可能會比較耗時,而另其它客戶端的請求完全不響應(yīng),這點(diǎn)需要格外注意。

實(shí)現(xiàn)方式:

上面已經(jīng)說到Redis Hash對應(yīng)Value內(nèi)部實(shí)際就是一個HashMap,實(shí)際這里會有2種不同實(shí)現(xiàn),這個Hash的成員比較少時Redis為了節(jié)省內(nèi)存會采用類似一維數(shù)組的方式來緊湊存儲,而不會采用真正的HashMap結(jié)構(gòu),對應(yīng)的value redisObject的encoding為zipmap,當(dāng)成員數(shù)量增大時會自動轉(zhuǎn)成真正的HashMap,此時encoding為ht。

List

常用命令:lpush,rpush,lpop,rpop,lrange等。

應(yīng)用場景:

Redis list的應(yīng)用場景非常多,也是Redis最重要的數(shù)據(jù)結(jié)構(gòu)之一,比如twitter的關(guān)注列表,粉絲列表等都可以用Redis的list結(jié)構(gòu)來實(shí)現(xiàn)。

Lists 就是鏈表,相信略有數(shù)據(jù)結(jié)構(gòu)知識的人都應(yīng)該能理解其結(jié)構(gòu)。使用Lists結(jié)構(gòu),我們可以輕松地實(shí)現(xiàn)最新消息排行等功能。Lists的另一個應(yīng)用就是消息隊(duì)列,

可以利用Lists的PUSH操作,將任務(wù)存在Lists中,然后工作線程再用POP操作將任務(wù)取出進(jìn)行執(zhí)行。Redis還提供了操作Lists中某一段的api,你可以直接查詢,刪除Lists中某一段的元素。

實(shí)現(xiàn)方式:

Redis list的實(shí)現(xiàn)為一個雙向鏈表,即可以支持反向查找和遍歷,更方便操作,不過帶來了部分額外的內(nèi)存開銷,Redis內(nèi)部的很多實(shí)現(xiàn),包括發(fā)送緩沖隊(duì)列等也都是用的這個數(shù)據(jù)結(jié)構(gòu)。

Set

常用命令:

sadd,spop,smembers,sunion 等。

應(yīng)用場景:

Redis set對外提供的功能與list類似是一個列表的功能,特殊之處在于set是可以自動排重的,當(dāng)你需要存儲一個列表數(shù)據(jù),又不希望出現(xiàn)重復(fù)數(shù)據(jù)時,set 是一個很好的選擇,并且set提供了判斷某個成員是否在一個set集合內(nèi)的重要接口,這個也是list所不能提供的。

Sets 集合的概念就是一堆不重復(fù)值的組合。利用Redis提供的Sets數(shù)據(jù)結(jié)構(gòu),可以存儲一些集合性的數(shù)據(jù),比如在微博應(yīng)用中,可以將一個用戶所有的關(guān)注人存在一個集合中,將其所有粉絲存在一個集合。Redis還為集合提供了求交集、并集、差集等操作,可以非常方便的實(shí)現(xiàn)如共同關(guān)注、共同喜好、二度好友等功能,對上面的所有集合操作,你還可以使用不同的命令選擇將結(jié)果返回給客戶端還是存集到一個新的集合中。

實(shí)現(xiàn)方式:

set 的內(nèi)部實(shí)現(xiàn)是一個 value永遠(yuǎn)為null的HashMap,實(shí)際就是通過計(jì)算hash的方式來快速排重的,這也是set能提供判斷一個成員是否在集合內(nèi)的原因。

Sorted Set

常用命令:

zadd,zrange,zrem,zcard等

使用場景:

Redis sorted set的使用場景與set類似,區(qū)別是set不是自動有序的,而sorted set可以通過用戶額外提供一個優(yōu)先級(score)的參數(shù)來為成員排序,并且是插入有序的,即自動排序。當(dāng)你需要一個有序的并且不重復(fù)的集合列表,那么可以選擇sorted set數(shù)據(jù)結(jié)構(gòu),比如twitter 的public timeline可以以發(fā)表時間作為score來存儲,這樣獲取時就是自動按時間排好序的。

另外還可以用Sorted Sets來做帶權(quán)重的隊(duì)列,比如普通消息的score為1,重要消息的score為2,然后工作線程可以選擇按score的倒序來獲取工作任務(wù)。讓重要的任務(wù)優(yōu)先執(zhí)行。

實(shí)現(xiàn)方式:

Redis sorted set的內(nèi)部使用HashMap和跳躍表(SkipList)來保證數(shù)據(jù)的存儲和有序,HashMap里放的是成員到score的映射,而跳躍表里存放的是所有的成員,排序依據(jù)是HashMap里存的score,使用跳躍表的結(jié)構(gòu)可以獲得比較高的查找效率,并且在實(shí)現(xiàn)上比較簡單。

Pub/Sub

Pub/Sub 從字面上理解就是發(fā)布(Publish)與訂閱(Subscribe),在Redis中,你可以設(shè)定對某一個key值進(jìn)行消息發(fā)布及消息訂閱,當(dāng)一個 key值上進(jìn)行了消息發(fā)布后,所有訂閱它的客戶端都會收到相應(yīng)的消息。這一功能最明顯的用法就是用作實(shí)時消息系統(tǒng),比如普通的即時聊天,群聊等功能。

Transactions

誰說NoSQL都不支持事務(wù),雖然Redis的Transactions提供的并不是嚴(yán)格的ACID的事務(wù)(比如一串用EXEC提交執(zhí)行的命令,在執(zhí)行中服務(wù)器宕機(jī),那么會有一部分命令執(zhí)行了,剩下的沒執(zhí)行),但是這個Transactions還是提供了基本的命令打包執(zhí)行的功能(在服務(wù)器不出問題的情況下,可以保證一連串的命令是順序在一起執(zhí)行的,中間有會有其它客戶端命令插進(jìn)來執(zhí)行)。Redis還提供了一個Watch功能,你可以對一個key進(jìn)行 Watch,然后再執(zhí)行Transactions,在這過程中,如果這個Watched的值進(jìn)行了修改,那么這個Transactions會發(fā)現(xiàn)并拒絕執(zhí)行。

4. Redis實(shí)際應(yīng)用場景

Redis在很多方面與其他數(shù)據(jù)庫解決方案不同:它使用內(nèi)存提供主存儲支持,而僅使用硬盤做持久性的存儲;它的數(shù)據(jù)模型非常獨(dú)特,用的是單線程。另一個大區(qū)別在于,你可以在開發(fā)環(huán)境中使用Redis的功能,但卻不需要轉(zhuǎn)到Redis。

轉(zhuǎn)向Redis當(dāng)然也是可取的,許多開發(fā)者從一開始就把Redis作為首選數(shù)據(jù)庫;但設(shè)想如果你的開發(fā)環(huán)境已經(jīng)搭建好,應(yīng)用已經(jīng)在上面運(yùn)行了,那么更換數(shù)據(jù)庫框架顯然不那么容易。另外在一些需要大容量數(shù)據(jù)集的應(yīng)用,Redis也并不適合,因?yàn)樗臄?shù)據(jù)集不會超過系統(tǒng)可用的內(nèi)存。所以如果你有大數(shù)據(jù)應(yīng)用,而且主要是讀取訪問模式,那么Redis并不是正確的選擇。

然而我喜歡Redis的一點(diǎn)就是你可以把它融入到你的系統(tǒng)中來,這就能夠解決很多問題,比如那些你現(xiàn)有的數(shù)據(jù)庫處理起來感到緩慢的任務(wù)。這些你就可以通過 Redis來進(jìn)行優(yōu)化,或者為應(yīng)用創(chuàng)建些新的功能。在本文中,我就想探討一些怎樣將Redis加入到現(xiàn)有的環(huán)境中,并利用它的原語命令等功能來解決 傳統(tǒng)環(huán)境中碰到的一些常見問題。在這些例子中,Redis都不是作為首選數(shù)據(jù)庫。

1、顯示最新的項(xiàng)目列表

下面這個語句常用來顯示最新項(xiàng)目,隨著數(shù)據(jù)多了,查詢毫無疑問會越來越慢。

SELECT * FROM foo WHERE … ORDER BY time DESC LIMIT 10

在Web應(yīng)用中,“列出最新的回復(fù)”之類的查詢非常普遍,這通常會帶來可擴(kuò)展性問題。這令人沮喪,因?yàn)轫?xiàng)目本來就是按這個順序被創(chuàng)建的,但要輸出這個順序卻不得不進(jìn)行排序操作。

類似的問題就可以用Redis來解決。比如說,我們的一個Web應(yīng)用想要列出用戶貼出的最新20條評論。在最新的評論邊上我們有一個“顯示全部”的鏈接,點(diǎn)擊后就可以獲得更多的評論。

我們假設(shè)數(shù)據(jù)庫中的每條評論都有一個唯一的遞增的ID字段。

我們可以使用分頁來制作主頁和評論頁,使用Redis的模板,每次新評論發(fā)表時,我們會將它的ID添加到一個Redis列表:

LPUSH latest.comments

我們將列表裁剪為指定長度,因此Redis只需要保存最新的5000條評論:

LTRIM latest.comments 0 5000

每次我們需要獲取最新評論的項(xiàng)目范圍時,我們調(diào)用一個函數(shù)來完成(使用偽代碼):

FUNCTION get_latest_comments(start, num_items):

id_list = redis.lrange(“l(fā)atest.comments”,start,start+num_items – 1)

IF id_list.length < num_items?

id_list = SQL_DB(“SELECT … ORDER BY time LIMIT …”)

END

RETURN id_list

END

這里我們做的很簡單。在Redis中我們的最新ID使用了常駐緩存,這是一直更新的。但是我們做了限制不能超過5000個ID,因此我們的獲取ID函數(shù)會一直詢問Redis。只有在start/count參數(shù)超出了這個范圍的時候,才需要去訪問數(shù)據(jù)庫。

我們的系統(tǒng)不會像傳統(tǒng)方式那樣“刷新”緩存,Redis實(shí)例中的信息永遠(yuǎn)是一致的。SQL數(shù)據(jù)庫(或是硬盤上的其他類型數(shù)據(jù)庫)只是在用戶需要獲取“很遠(yuǎn)”的數(shù)據(jù)時才會被觸發(fā),而主頁或第一個評論頁是不會麻煩到硬盤上的數(shù)據(jù)庫了。

2、刪除與過濾

我們可以使用LREM來刪除評論。如果刪除操作非常少,另一個選擇是直接跳過評論條目的入口,報告說該評論已經(jīng)不存在。

有些時候你想要給不同的列表附加上不同的過濾器。如果過濾器的數(shù)量受到限制,你可以簡單的為每個不同的過濾器使用不同的Redis列表。畢竟每個列表只有5000條項(xiàng)目,但Redis卻能夠使用非常少的內(nèi)存來處理幾百萬條項(xiàng)目。

3、排行榜相關(guān)

另一個很普遍的需求是各種數(shù)據(jù)庫的數(shù)據(jù)并非存儲在內(nèi)存中,因此在按得分排序以及實(shí)時更新這些幾乎每秒鐘都需要更新的功能上數(shù)據(jù)庫的性能不夠理想。

典型的比如那些在線游戲的排行榜,比如一個Facebook的游戲,根據(jù)得分你通常想要:

– 列出前100名高分選手

– 列出某用戶當(dāng)前的全球排名

這些操作對于Redis來說小菜一碟,即使你有幾百萬個用戶,每分鐘都會有幾百萬個新的得分。

模式是這樣的,每次獲得新得分時,我們用這樣的代碼:

ZADD leaderboard

你可能用userID來取代username,這取決于你是怎么設(shè)計(jì)的。

得到前100名高分用戶很簡單:ZREVRANGE leaderboard 0 99。

用戶的全球排名也相似,只需要:ZRANK leaderboard 。

4、按照用戶投票和時間排序

排行榜的一種常見變體模式就像Reddit或Hacker News用的那樣,新聞按照類似下面的公式根據(jù)得分來排序:

score = points / time^alpha

因此用戶的投票會相應(yīng)的把新聞挖出來,但時間會按照一定的指數(shù)將新聞埋下去。下面是我們的模式,當(dāng)然算法由你決定。

模式是這樣的,開始時先觀察那些可能是最新的項(xiàng)目,例如首頁上的1000條新聞都是候選者,因此我們先忽視掉其他的,這實(shí)現(xiàn)起來很簡單。

每次新的新聞貼上來后,我們將ID添加到列表中,使用LPUSH + LTRIM,確保只取出最新的1000條項(xiàng)目。

有一項(xiàng)后臺任務(wù)獲取這個列表,并且持續(xù)的計(jì)算這1000條新聞中每條新聞的最終得分。計(jì)算結(jié)果由ZADD命令按照新的順序填充生成列表,老新聞則被清除。這里的關(guān)鍵思路是排序工作是由后臺任務(wù)來完成的。

5、處理過期項(xiàng)目

另一種常用的項(xiàng)目排序是按照時間排序。我們使用unix時間作為得分即可。

模式如下:

– 每次有新項(xiàng)目添加到我們的非Redis數(shù)據(jù)庫時,我們把它加入到排序集合中。這時我們用的是時間屬性,current_time和time_to_live。

– 另一項(xiàng)后臺任務(wù)使用ZRANGE…SCORES查詢排序集合,取出最新的10個項(xiàng)目。如果發(fā)現(xiàn)unix時間已經(jīng)過期,則在數(shù)據(jù)庫中刪除條目。

6、計(jì)數(shù)

Redis是一個很好的計(jì)數(shù)器,這要感謝INCRBY和其他相似命令。

我相信你曾許多次想要給數(shù)據(jù)庫加上新的計(jì)數(shù)器,用來獲取統(tǒng)計(jì)或顯示新信息,但是最后卻由于寫入敏感而不得不放棄它們。

好了,現(xiàn)在使用Redis就不需要再擔(dān)心了。有了原子遞增(atomic increment),你可以放心的加上各種計(jì)數(shù),用GETSET重置,或者是讓它們過期。

例如這樣操作:

INCR user: EXPIRE

user: 60

你可以計(jì)算出最近用戶在頁面間停頓不超過60秒的頁面瀏覽量,當(dāng)計(jì)數(shù)達(dá)到比如20時,就可以顯示出某些條幅提示,或是其它你想顯示的東西。

7、特定時間內(nèi)的特定項(xiàng)目

另一項(xiàng)對于其他數(shù)據(jù)庫很難,但Redis做起來卻輕而易舉的事就是統(tǒng)計(jì)在某段特點(diǎn)時間里有多少特定用戶訪問了某個特定資源。比如我想要知道某些特定的注冊用戶或IP地址,他們到底有多少訪問了某篇文章。

每次我獲得一次新的頁面瀏覽時我只需要這樣做:

SADD page:day1:

當(dāng)然你可能想用unix時間替換day1,比如time()-(time()%3600*24)等等。

想知道特定用戶的數(shù)量嗎?只需要使用SCARD page:day1: 。

需要測試某個特定用戶是否訪問了這個頁面?SISMEMBER page:day1: 。

8、實(shí)時分析正在發(fā)生的情況,用于數(shù)據(jù)統(tǒng)計(jì)與防止垃圾郵件等

我們只做了幾個例子,但如果你研究Redis的命令集,并且組合一下,就能獲得大量的實(shí)時分析方法,有效而且非常省力。使用Redis原語命令,更容易實(shí)施垃圾郵件過濾系統(tǒng)或其他實(shí)時跟蹤系統(tǒng)。

9、Pub/Sub

Redis的Pub/Sub非常非常簡單,運(yùn)行穩(wěn)定并且快速。支持模式匹配,能夠?qū)崟r訂閱與取消頻道。

10、隊(duì)列

你應(yīng)該已經(jīng)注意到像list push和list pop這樣的Redis命令能夠很方便的執(zhí)行隊(duì)列操作了,但能做的可不止這些:比如Redis還有l(wèi)ist pop的變體命令,能夠在列表為空時阻塞隊(duì)列。

現(xiàn)代的互聯(lián)網(wǎng)應(yīng)用大量地使用了消息隊(duì)列(Messaging)。消息隊(duì)列不僅被用于系統(tǒng)內(nèi)部組件之間的通信,同時也被用于系統(tǒng)跟其它服務(wù)之間的交互。消息隊(duì)列的使用可以增加系統(tǒng)的可擴(kuò)展性、靈活性和用戶體驗(yàn)。非基于消息隊(duì)列的系統(tǒng),其運(yùn)行速度取決于系統(tǒng)中最慢的組件的速度(注:短板效應(yīng))。而基于消息隊(duì)列可以將系統(tǒng)中各組件解除耦合,這樣系統(tǒng)就不再受最慢組件的束縛,各組件可以異步運(yùn)行從而得以更快的速度完成各自的工作。

此外,當(dāng)服務(wù)器處在高并發(fā)操作的時候,比如頻繁地寫入日志文件??梢岳孟㈥?duì)列實(shí)現(xiàn)異步處理。從而實(shí)現(xiàn)高性能的并發(fā)操作。

11、緩存

Redis的緩存部分值得寫一篇新文章,我這里只是簡單的說一下。Redis能夠替代memcached,讓你的緩存從只能存儲數(shù)據(jù)變得能夠更新數(shù)據(jù),因此你不再需要每次都重新生成數(shù)據(jù)了。

此部分內(nèi)容的原文地址:http://antirez.com/post/take-advantage-of-redis-adding-it-to-your-stack.html

5. 國內(nèi)外三個不同領(lǐng)域巨頭分享的Redis實(shí)戰(zhàn)經(jīng)驗(yàn)及使用場景

隨著應(yīng)用對高性能需求的增加,NoSQL逐漸在各大名企的系統(tǒng)架構(gòu)中生根發(fā)芽。這里我們將為大家分享社交巨頭新浪微博、傳媒巨頭Viacom及圖片分享領(lǐng)域佼佼者Pinterest帶來的Redis實(shí)踐,首先我們看新浪微博 @啟盼cobain的Redis實(shí)戰(zhàn)經(jīng)驗(yàn)分享:

一、新浪微博:史上最大的Redis集群

Tape is Dead,Disk is Tape,F(xiàn)lash is Disk,RAM Locality is King. — Jim Gray

Redis不是比較成熟的memcache或者M(jìn)ysql的替代品,是對于大型互聯(lián)網(wǎng)類應(yīng)用在架構(gòu)上很好的補(bǔ)充?,F(xiàn)在有越來越多的應(yīng)用也在紛紛基于Redis做架構(gòu)的改造。首先簡單公布一下Redis平臺實(shí)際情況:

2200+億 commands/day 5000億Read/day 500億Write/day

18TB+ Memory

500+ Servers in 6 IDC 2000+instances

應(yīng)該是國內(nèi)外比較大的Redis使用平臺,今天主要從應(yīng)用角度談?wù)凴edis服務(wù)平臺。

Redis使用場景

1.Counting(計(jì)數(shù))

計(jì)數(shù)的應(yīng)用在另外一篇文章里較詳細(xì)的描述,計(jì)數(shù)場景的優(yōu)化 http://www.xdata.me/?p=262這里就不多加描述了。

可以預(yù)見的是,有很多同學(xué)認(rèn)為把計(jì)數(shù)全部存在內(nèi)存中成本非常高,我在這里用個圖表來表達(dá)下我的觀點(diǎn):

redis應(yīng)用場景及實(shí)例

很多情況大家都會設(shè)想純使用內(nèi)存的方案會很有很高成本,但實(shí)際情況往往會有一些不一樣:

COST,對于有一定吞吐需求的應(yīng)用來說,肯定會單獨(dú)申請DB、Cache資源,很多擔(dān)心DB寫入性能的同學(xué)還會主動將DB更新記入異步隊(duì)列,而這三塊的資源的利用率一般都不會太高。資源算下來,你驚異的發(fā)現(xiàn):反而純內(nèi)存的方案會更精簡!

KISS原則,這對于開發(fā)是非常友好的,我只需要建立一套連接池,不用擔(dān)心數(shù)據(jù)一致性的維護(hù),不用維護(hù)異步隊(duì)列。

Cache穿透風(fēng)險,如果后端使用DB,肯定不會提供很高的吞吐能力,cache宕機(jī)如果沒有妥善處理,那就悲劇了。

大多數(shù)的起始存儲需求,容量較小。

2.Reverse cache(反向cache)

面對微博常常出現(xiàn)的熱點(diǎn),如最近出現(xiàn)了較為火爆的短鏈,短時間有數(shù)以萬計(jì)的人點(diǎn)擊、跳轉(zhuǎn),而這里會常常涌現(xiàn)一些需求,比如我們向快速在跳轉(zhuǎn)時判定用戶等級,是否有一些賬號綁定,性別愛好什么的,已給其展示不同的內(nèi)容或者信息。

普通采用memcache+Mysql的解決方案,當(dāng)調(diào)用id合法的情況下,可支撐較大的吞吐。但當(dāng)調(diào)用id不可控,有較多垃圾用戶調(diào)用時,由于memcache未有命中,會大量的穿透至Mysql服務(wù)器,瞬間造成連接數(shù)瘋長,整體吞吐量降低,響應(yīng)時間變慢。

這里我們可以用redis記錄全量的用戶判定信息,如string key:uid int:type,做一次反向的cache,當(dāng)用戶在redis快速獲取自己等級等信息后,再去Mc+Mysql層去獲取全量信息。如圖:

redis應(yīng)用場景及實(shí)例

當(dāng)然這也不是最優(yōu)化的場景,如用Redis做bloomfilter,可能更加省用內(nèi)存。

3.Top 10 list

產(chǎn)品運(yùn)營總會讓你展示最近、最熱、點(diǎn)擊率最高、活躍度最高等等條件的top list。很多更新較頻繁的列表如果使用MC+MySQL維護(hù)的話緩存失效的可能性會比較大,鑒于占用內(nèi)存較小的情況,使用Redis做存儲也是相當(dāng)不錯的。

4.Last Index

用戶最近訪問記錄也是redis list的很好應(yīng)用場景,lpush lpop自動過期老的登陸記錄,對于開發(fā)來說還是非常友好的。

5.Relation List/Message Queue

這里把兩個功能放在最后,因?yàn)檫@兩個功能在現(xiàn)實(shí)問題當(dāng)中遇到了一些困難,但在一定階段也確實(shí)解決了我們很多的問題,故在這里只做說明。

Message Queue就是通過list的lpop及l(fā)push接口進(jìn)行隊(duì)列的寫入和消費(fèi),由于本身性能較好也能解決大部分問題。

6.Fast transaction with Lua

Redis 的Lua的功能擴(kuò)展實(shí)際給Redis帶來了更多的應(yīng)用場景,你可以編寫若干command組合作為一個小型的非阻塞事務(wù)或者更新邏輯,如:在收到 message推送時,同時1.給自己的增加一個未讀的對話 2.給自己的私信增加一個未讀消息 3.最后給發(fā)送人回執(zhí)一個完成推送消息,這一層邏輯完全可以在Redis Server端實(shí)現(xiàn)。

但是,需要注意的是Redis會將lua script的全部內(nèi)容記錄在aof和傳送給slave,這也將是對磁盤,網(wǎng)卡一個不小的開銷。

7.Instead of Memcache

很多測試和應(yīng)用均已證明,

在性能方面Redis并沒有落后memcache多少,而單線程的模型給Redis反而帶來了很強(qiáng)的擴(kuò)展性。

在很多場景下,Redis對同一份數(shù)據(jù)的內(nèi)存開銷是小于memcache的slab分配的。

Redis提供的數(shù)據(jù)同步功能,其實(shí)是對cache的一個強(qiáng)有力功能擴(kuò)展。

Redis使用的重要點(diǎn)

1.rdb/aof Backup!

我們線上的Redis 95%以上是承擔(dān)后端存儲功能的,我們不僅用作cache,而更為一種k-v存儲,他完全替代了后端的存儲服務(wù)(MySQL),故其數(shù)據(jù)是非常重要的,如果出現(xiàn)數(shù)據(jù)污染和丟失,誤操作等情況,將是難以恢復(fù)的。所以備份是非常必要的!為此,我們有共享的hdfs資源作為我們的備份池,希望能隨時可以還原業(yè)務(wù)所需數(shù)據(jù)。

2.Small item & Small instance!

由于Redis單線程(嚴(yán)格意義上不是單線程,但認(rèn)為對request的處理是單線程的)的模型,大的數(shù)據(jù)結(jié)構(gòu)list,sorted set,hash set的批量處理就意味著其他請求的等待,故使用Redis的復(fù)雜數(shù)據(jù)結(jié)構(gòu)一定要控制其單key-struct的大小。

另外,Redis單實(shí)例的內(nèi)存容量也應(yīng)該有嚴(yán)格的限制。單實(shí)例內(nèi)存容量較大后,直接帶來的問題就是故障恢復(fù)或者Rebuild從庫的時候時間較長,而更糟糕的是,Redis rewrite aof和save rdb時,將會帶來非常大且長的系統(tǒng)壓力,并占用額外內(nèi)存,很可能導(dǎo)致系統(tǒng)內(nèi)存不足等嚴(yán)重影響性能的線上故障。我們線上96G/128G內(nèi)存服務(wù)器不建議單實(shí)例容量大于20/30G。

3.Been Available!

業(yè)界資料和使用比較多的是Redis sentinel(哨兵)

http://www.huangz.me/en/latest/storage/redis_code_analysis/sentinel.html

http://qiita.com/wellflat/items/8935016fdee25d4866d9

2000行C實(shí)現(xiàn)了服務(wù)器狀態(tài)檢測,自動故障轉(zhuǎn)移等功能。

但由于自身實(shí)際架構(gòu)往往會復(fù)雜,或者考慮的角度比較多,為此 @許琦eryk和我一同做了hypnos項(xiàng)目。

hypnos是神話中的睡神,字面意思也是希望我們工程師無需在休息時間處理任何故障。:-)

工作原理示意如下:

redis應(yīng)用場景及實(shí)例

Talk is cheap, show me your code! 稍后將單獨(dú)寫篇博客細(xì)致講下Hypnos的實(shí)現(xiàn)。

4.In Memory or not?

發(fā)現(xiàn)一種情況,開發(fā)在溝通后端資源設(shè)計(jì)的時候,常常因?yàn)榱?xí)慣使用和錯誤了解產(chǎn)品定位等原因,而忽視了對真實(shí)使用用戶的評估。也許這是一份歷史數(shù)據(jù),只有最近一天的數(shù)據(jù)才有人進(jìn)行訪問,而把歷史數(shù)據(jù)的容量和最近一天請求量都拋給內(nèi)存類的存儲現(xiàn)實(shí)是非常不合理的。

所以當(dāng)你在究竟使用什么樣的數(shù)據(jù)結(jié)構(gòu)存儲的時候,請務(wù)必先進(jìn)行成本衡量,有多少數(shù)據(jù)是需要存儲在內(nèi)存中的?有多少數(shù)據(jù)是對用戶真正有意義的。因?yàn)檫@其實(shí)對后端資源的設(shè)計(jì)是至關(guān)重要的,1G的數(shù)據(jù)容量和1T的數(shù)據(jù)容量對于設(shè)計(jì)思路是完全不一樣的

Plans in future?

1.slave sync改造

全部改造線上master-slave數(shù)據(jù)同步機(jī)制,這一點(diǎn)我們借鑒了MySQL Replication的思路,使用rdb+aof+pos作為數(shù)據(jù)同步的依據(jù),這里簡要說明為什么官方提供的psync沒有很好的滿足我們的需求:

假設(shè)A有兩個從庫B及C,及 A `— B&C,這時我們發(fā)現(xiàn)master A服務(wù)器有宕機(jī)隱患需要重啟或者A節(jié)點(diǎn)直接宕機(jī),需要切換B為新的主庫,如果A、B、C不共享rdb及aof信息,C在作為B的從庫時,仍會清除自身數(shù)據(jù),因?yàn)镃節(jié)點(diǎn)只記錄了和A節(jié)點(diǎn)的同步狀況。

故我們需要有一種將A`–B&C 結(jié)構(gòu)切換切換為A`–B`–C結(jié)構(gòu)的同步機(jī)制,psync雖然支持?jǐn)帱c(diǎn)續(xù)傳,但仍無法支持master故障的平滑切換。

實(shí)際上我們已經(jīng)在我們定制的Redis計(jì)數(shù)服務(wù)上使用了如上功能的同步,效果非常好,解決了運(yùn)維負(fù)擔(dān),但仍需向所有Redis服務(wù)推廣,如果可能我們也會向官方Redis提出相關(guān)sync slave的改進(jìn)。

2.更適合redis的name-system Or proxy

細(xì)心的同學(xué)發(fā)現(xiàn)我們除了使用DNS作為命名系統(tǒng),也在zookeeper中有一份記錄,為什么不讓用戶直接訪問一個系統(tǒng),zk或者DNS選擇其一呢?

其實(shí)還是很簡單,命名系統(tǒng)是個非常重要的組件,而dns是一套比較完善的命名系統(tǒng),我們?yōu)榇俗隽撕芏喔倪M(jìn)和試錯,zk的實(shí)現(xiàn)還是相對復(fù)雜,我們還沒有較強(qiáng)的把控粒度。我們也在思考用什么做命名系統(tǒng)更符合我們需求。

3.后端數(shù)據(jù)存儲

大內(nèi)存的使用肯定是一個重要的成本優(yōu)化方向,flash盤及分布式的存儲也在我們未來計(jì)劃之中。(原文鏈接: Largest Redis Clusters Ever)

二、Pinterest:Reids維護(hù)上百億的相關(guān)性

Pinterest已經(jīng)成為硅谷最瘋故事之一,在2012年,他們基于PC的業(yè)務(wù)增加1047%,移動端采用增加1698%, 該年3月其獨(dú)立訪問數(shù)量更飆升至533億。在Pinterest,人們關(guān)注的事物以百億記——每個用戶界面都會查詢某個board或者是用戶是否關(guān)注的行為促成了異常復(fù)雜的工程問題。這也讓Redis獲得了用武之地。經(jīng)過數(shù)年的發(fā)展,Pinterest已經(jīng)成為媒體、社交等多個領(lǐng)域的佼佼者,其輝煌戰(zhàn)績?nèi)缦拢?/p>

獲得的推薦流量高于Google+、YouTube及LinkedIn三者的總和

與Facebook及Twitter一起成為最流行的三大社交網(wǎng)絡(luò)

參考Pinterest進(jìn)行購買的用戶比其它網(wǎng)站更高( 更多詳情)

如您所想,基于其獨(dú)立訪問數(shù),Pinterest的高規(guī)模促成了一個非常高的IT基礎(chǔ)設(shè)施需求。

通過緩存來優(yōu)化用戶體驗(yàn)

近日,Pinterest工程經(jīng)理Abhi Khune對其公司的用戶體驗(yàn)需求及Redis的使用經(jīng)驗(yàn) 進(jìn)行了分享。即使是滋生的應(yīng)用程序打造者,在分析網(wǎng)站的細(xì)節(jié)之前也不會理解這些特性,因此先大致的理解一下使用場景:首先,為每個粉絲進(jìn)行提及到的預(yù)檢查;其次,UI將準(zhǔn)確的顯示用戶的粉絲及關(guān)注列表分頁。高效的執(zhí)行這些操作,每次點(diǎn)擊都需要非常高的性能架構(gòu)。

不能免俗,Pinterest的軟件工程師及架構(gòu)師已經(jīng)使用了MySQL及memcache,但是緩存解決方案仍然達(dá)到了他們的瓶頸;因此為了擁有更好的用戶體驗(yàn),緩存必須被擴(kuò)充。而在實(shí)際操作過程中,工程團(tuán)隊(duì)已然發(fā)現(xiàn)緩存只有當(dāng)用戶sub-graph已經(jīng)在緩存中時才會起到作用。因此。任何使用這個系統(tǒng)的人都需要被緩存,這就導(dǎo)致了整個圖的緩存。同時,最常見的查詢“用戶A是否關(guān)注了用戶B”的答案經(jīng)常是否定的,然而這卻被作為了緩存丟失,從而促成一個數(shù)據(jù)庫查詢,因此他們需要一個新的方法來擴(kuò)展緩存。最終,他們團(tuán)隊(duì)決定使用Redis來存儲整個圖,用以服務(wù)眾多的列表。

使用Redis存儲大量的Pinterest列表

Pinterest使用了Redis作為解決方案,并將性能推至了內(nèi)存數(shù)據(jù)庫等級,為用戶保存多種類型列表:

關(guān)注者列表

你所關(guān)注的board列表

粉絲列表

關(guān)注你board的用戶列表

某個用戶中board中你沒有關(guān)注的列表

每個board的關(guān)注者及非關(guān)注者

Redis 為其7000萬用戶存儲了以上的所有列表,本質(zhì)上講可以說是儲存了所有粉絲圖,通過用戶ID分片。鑒于你可以通過類型來查看以上列表的數(shù)據(jù),分析概要信息被用看起來更像事務(wù)的系統(tǒng)儲存及訪問。Pinterest當(dāng)下的用戶like被限制為10萬,初略進(jìn)行統(tǒng)計(jì):如果每個用戶關(guān)注25個board,將會在用戶及board間產(chǎn)生17.5億的關(guān)系。同時更加重要的是,這些關(guān)系隨著系統(tǒng)的使用每天都會增加。

Pinterest的Reids架構(gòu)及運(yùn)營

通過Pinterest的一個創(chuàng)始人了解到,Pinterest開始使用Python及訂制的Django編寫應(yīng)用程序,并一直持續(xù)到其擁有1800萬用戶級日410TB用戶數(shù)據(jù)的時候。雖然使用了多個存儲對數(shù)據(jù)進(jìn)行儲存,工程師根據(jù)用戶id使用了8192個虛擬分片,每個分片都運(yùn)行在一個Redis DB之上,同時1個Redis實(shí)例將運(yùn)行多個Redis DB。為了對CPU核心的充分使用,同一臺主機(jī)上同時使用多線程和單線程Redis實(shí)例。

鑒于整個數(shù)據(jù)集運(yùn)行在內(nèi)存當(dāng)中,Redis在Amazon EBS上對每秒傳輸進(jìn)來的寫入都會進(jìn)行持久化。擴(kuò)展主要通過兩個方面進(jìn)行:第一,保持50%的利用率,通過主從轉(zhuǎn)換,機(jī)器上運(yùn)行的Redis實(shí)例一半會轉(zhuǎn)譯到一個新機(jī)器上;第二,擴(kuò)展節(jié)點(diǎn)和分片。整個Redis集群都會使用一個主從配置,從部分將被當(dāng)做一個熱備份。一旦主節(jié)點(diǎn)失敗,從部分會立刻完成主的轉(zhuǎn)換,同時一個新的從部分將會被添加,ZooKeeper將完成整個過程。同時他們每個小時都會在Amazon S3上運(yùn)行BGsave做更持久的儲存——這項(xiàng)Reids操作會在后端進(jìn)行,之后Pinterest會使用這些數(shù)據(jù)做MapReduce和分析作業(yè) 。

三、Viacom:Redis在系統(tǒng)中的用例盤點(diǎn)

Viacom是全球最大的傳媒集體之一,同時也遭遇了當(dāng)下最大的數(shù)據(jù)難題之一:如何處理日益劇增的動態(tài)視頻內(nèi)容。

著眼這一挑戰(zhàn)的上升趨勢,我們會發(fā)現(xiàn):2010年世界上所有數(shù)據(jù)體積達(dá)到ZB級,而單單2012這一年,互聯(lián)網(wǎng)產(chǎn)生的數(shù)據(jù)就增加了2.8個ZB,其中大部分的數(shù)據(jù)都是非結(jié)構(gòu)化的,包括了視頻和圖片。

覆蓋MVN(以前稱為MTV Networks、Paramount及BET),Viacom是個名副其實(shí)的傳媒巨頭,支持眾多人氣站點(diǎn),其中包括The Daily Show、osh.0、South Park Studios、GameTrailers.com等。作為媒體公司,這些網(wǎng)站上的文檔、圖片、視頻短片都在無時無刻的更新。長話短說,下面就進(jìn)入 Viacom高級架構(gòu)師Michael Venezia 分享的Redis實(shí)踐:

Viacom的網(wǎng)站架構(gòu)背景

對于Viacom,橫跨多個站點(diǎn)傳播內(nèi)容讓必須專注于規(guī)模的需求,同時為了將內(nèi)容竟可能快的傳播到相應(yīng)用戶,他們還必須聚焦內(nèi)容之間的關(guān)系。然而即使The Daily Show、Nickelodeon、Spike或者是VH1 這些單獨(dú)的網(wǎng)站上,日平均PV都可以達(dá)到千萬,峰值時流量更會達(dá)到平均值的20-30倍。同時基于對實(shí)時的需求,動態(tài)的規(guī)模及速度已成為架構(gòu)的基礎(chǔ)之一。

除去動態(tài)規(guī)模之外,服務(wù)還必須基于用戶正在瀏覽的視頻或者是地理位置來推測用戶的喜好。比如說,某個頁面可能會將一個獨(dú)立的視頻片段與本地的促銷,視頻系列的額外部分,甚至是相關(guān)視頻聯(lián)系起來。為了能讓用戶能在網(wǎng)站上停留更長的時間,他們建立了一個能基于詳細(xì)元數(shù)據(jù)自動建立頁面的軟件引擎,這個引擎可以根據(jù)用戶當(dāng)下興趣推薦額外的內(nèi)容。鑒于用于興趣的隨時改變,數(shù)據(jù)的類型非常廣泛——類似graph-like,實(shí)際上做的是大量的join。

這樣做有利于減少類似視頻的大體積文件副本數(shù),比如數(shù)據(jù)存儲中一個獨(dú)立的記錄是Southpark片段“Cartman gets an Anal Probe”,這個片段可能也會出現(xiàn)在德語的網(wǎng)站上。雖然視頻是一樣的,但是英語用戶搜索的可能就是另一個不同的詞語。元數(shù)據(jù)的副本轉(zhuǎn)換成搜索結(jié)果,并指向相同的視頻。因此在美國用戶搜索真實(shí)標(biāo)題的情況下,德國瀏覽者可能會使用轉(zhuǎn)譯的標(biāo)題——德國網(wǎng)站上的“Cartman und die Analsonde”。

這些元數(shù)據(jù)覆蓋了其它記錄或者是對象,同時還可以根據(jù)使用環(huán)境來改變內(nèi)容,通過不同的規(guī)則集來限制不同地理位置或者是設(shè)備請求的內(nèi)容。

Viacom的實(shí)現(xiàn)方法

盡管許多機(jī)構(gòu)通過使用ORM及傳統(tǒng)關(guān)系型數(shù)據(jù)庫來解決這個問題,Viacom卻使用了一個迥然不同的方法。

本質(zhì)上,他們完全承擔(dān)不了對數(shù)據(jù)庫的直接訪問。首先,他們處理的大部分都是流數(shù)據(jù),他們偏向于使用Akamai從地理上來分配內(nèi)容。其次,基于頁面的復(fù)雜性可能會取上萬個對象。取如此多的數(shù)據(jù)顯然會影響到性能,因此JSON在1個數(shù)據(jù)服務(wù)中投入了使用。當(dāng)然,這些JSON對象的緩存將直接影響到網(wǎng)站性能。同時,當(dāng)內(nèi)容或者是內(nèi)容之間的關(guān)系發(fā)生改變時,緩存還需要動態(tài)的進(jìn)行更新。

Viacom 依靠對象基元和超類解決這個問題,繼續(xù)以South Park為例:一個私有的“episode”類包含了所有該片段相關(guān)信息,一個“super object”將有助于發(fā)現(xiàn)實(shí)際的視頻對象。超類這個思想確實(shí)非常有益于建設(shè)低延遲頁面的自動建設(shè),這些超類可以幫助到基元對象到緩存的映射及保存。

Viacom為什么要使用Redis

每當(dāng)Viacom上傳一個視頻片段,系統(tǒng)將建立一個私有的對象,并于1個超類關(guān)聯(lián)。每一次修改,他們都需要重估私有對象的每個改變,并更新所有復(fù)合對象。同時,系統(tǒng)還需要無效Akamail中的URL請求。系統(tǒng)現(xiàn)有架構(gòu)的組合及更敏捷的管理方法需求將Viacom推向了Redis。

基于Viacom主要基于PHP,所以這個解決方案必須支持PHP。他們首先選擇了memcached做對象存儲,但是它并不能很好的支持hashmap;同時他們還需要一個更有效的進(jìn)行無效步驟的重估,即更好的理解內(nèi)容的依賴性。本質(zhì)上說,他們需要時刻跟進(jìn)無效步驟中的依賴性改變。因此他們選擇了 Redis及Predis的組合來解決這個問題。

他們團(tuán)隊(duì)使用Redis給southparkstudios.com和thedailyshow.com兩個網(wǎng)站建設(shè)依賴性圖,在取得了很大的成功后他們開始著眼Redis其它適合場景。

Redis的其它使用場景

顯而易見,如果有人使用Redis來建設(shè)依賴性圖,那么使用它來做對象處理也是說得通的。同樣,這也成了架構(gòu)團(tuán)隊(duì)為Redis選擇的第二使用場景。 Redis的復(fù)制及持久化特性同時也征服了Viacom的運(yùn)營團(tuán)隊(duì),因此在幾個開發(fā)周期后,Redis成為他們網(wǎng)站的主要數(shù)據(jù)及依賴性儲存。

后兩個用例則是行為追蹤及瀏覽計(jì)數(shù)的緩沖,改變后的架構(gòu)是Redis每幾分鐘向MySQL中儲存一次,而瀏覽計(jì)數(shù)則通過Redis進(jìn)行存儲及計(jì)數(shù)。同時 Redis還被用來做人氣的計(jì)算,一個基于訪問數(shù)及訪問時間的得分系統(tǒng)——如果某個視頻最近被訪問的次數(shù)越多,它的人氣就越高。在如此多內(nèi)容上每隔 10-15分鐘做一次計(jì)算絕對不是類似MySQL這樣傳統(tǒng)關(guān)系型數(shù)據(jù)庫的強(qiáng)項(xiàng),Viacom使用Redis的理由也非常簡單——在1個存儲瀏覽信息的 Redis實(shí)例上運(yùn)行Lua批處理作業(yè),計(jì)算出所有的得分表。信息被拷貝到另一個Redis實(shí)例上,用以支持相關(guān)的產(chǎn)品查詢。同時還在MySQL上做了另一個備份,用以以后的分析,這種組合會將這個過程耗費(fèi)的時間降低60倍。

Viacom還使用Redis存儲一步作業(yè)信息,這些信息被插入一個列表中,工作人員則使用BLPOP命令行在隊(duì)列中抓取頂端的任務(wù)。同時zsets被用于從眾多社交網(wǎng)絡(luò)(比如Twitter及Tumblr)上綜合內(nèi)容,Viacom通過Brightcove視頻播放器來同步多個內(nèi)容管理系統(tǒng)。

橫跨這些用例,幾乎所有的Redis命令都被使用——sets、lists、zlists、hashmaps、scripts、counters等。同時,Redis也成為Viacom可擴(kuò)展架構(gòu)中不可或缺的一環(huán)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • Redis
    +關(guān)注

    關(guān)注

    0

    文章

    375

    瀏覽量

    10875
收藏 人收藏

    評論

    相關(guān)推薦

    低電平靈敏專用儀器的技術(shù)原理和應(yīng)用場景

    空氣中的污染物濃度、水質(zhì)中的微量元素含量等。這些測量數(shù)據(jù)對于評估環(huán)境質(zhì)量、制定環(huán)保政策和監(jiān)測污染源具有重要意義。 三、實(shí)例說明以Keithley品牌的低電平高靈敏度專用儀器為例,其應(yīng)用場景包括表征高兆歐
    發(fā)表于 12-06 14:45

    倍頻器的技術(shù)原理和應(yīng)用場景

    倍頻器是一種用于將輸入信號的頻率倍增的電子設(shè)備,以下是關(guān)于倍頻器的技術(shù)原理和應(yīng)用場景的詳細(xì)解釋:技術(shù)原理倍頻器的技術(shù)原理主要基于非線性元件(如二極管、晶體管等)的特性和頻率變換技術(shù)。 非線性元件
    發(fā)表于 11-29 14:49

    系統(tǒng)放大器的技術(shù)原理和應(yīng)用場景

    系統(tǒng)放大器是一種重要的電子設(shè)備,其技術(shù)原理和應(yīng)用場景都具有一定的專業(yè)性和廣泛性。以下是對系統(tǒng)放大器的技術(shù)原理和應(yīng)用場景的詳細(xì)介紹:一、技術(shù)原理系統(tǒng)放大器的工作原理基于電子器件的非線性特性,通過控制
    發(fā)表于 11-18 14:46

    OTA測試暗箱的技術(shù)原理和應(yīng)用場景

    OTA測試暗箱在無線通信設(shè)備的研發(fā)與測試中扮演著至關(guān)重要的角色。以下是對OTA測試暗箱技術(shù)原理和應(yīng)用場景的詳細(xì)闡述:一、OTA測試暗箱的技術(shù)原理OTA測試暗箱的技術(shù)原理主要基于電磁波在封閉空間
    發(fā)表于 11-14 14:36

    實(shí)時示波器的技術(shù)原理和應(yīng)用場景

    實(shí)時示波器是一種高性能的電子測量儀器,其技術(shù)原理和應(yīng)用場景對于電子工程和通信技術(shù)領(lǐng)域具有重要意義。以下是對實(shí)時示波器的技術(shù)原理和應(yīng)用場景的詳細(xì)解釋:一、技術(shù)原理實(shí)時示波器的工作原理基于電子束在熒光屏
    發(fā)表于 10-23 14:22

    源測量單元設(shè)備的技術(shù)原理和應(yīng)用場景

    源測量單元(SMU)設(shè)備是一種集成了精密電源(PPS)和高性能數(shù)字萬用表(DMM)功能的測試設(shè)備。以下是對其技術(shù)原理和應(yīng)用場景的詳細(xì)解析:一、技術(shù)原理 集成功能: SMU在單個儀器中集成了電源
    發(fā)表于 10-22 11:10

    太陽膜測試儀的技術(shù)原理和應(yīng)用場景

    太陽膜測試儀的技術(shù)原理和應(yīng)用場景可以詳細(xì)闡述如下:技術(shù)原理太陽膜測試儀的技術(shù)原理主要基于光學(xué)測量和物理定律。具體來說,它通過模擬太陽光中的各種波長(主要是紫外線、可見光和紅外線)的輻射,來檢測太陽膜
    發(fā)表于 09-29 14:18

    超聲波測厚儀的技術(shù)原理和應(yīng)用場景

    超聲波測厚儀的技術(shù)原理和應(yīng)用場景詳細(xì)如下:技術(shù)原理超聲波測厚儀利用超聲波脈沖反射原理來測量材料的厚度。具體工作原理如下: 發(fā)射超聲波脈沖:測厚儀的探頭(也稱為換能器)向被測物體發(fā)射一束高頻超聲波脈沖
    發(fā)表于 09-27 15:06

    智能IC卡測試設(shè)備的技術(shù)原理和應(yīng)用場景

    智能IC卡測試設(shè)備的技術(shù)原理和應(yīng)用場景,可以從以下幾個方面進(jìn)行闡述:技術(shù)原理智能IC卡測試設(shè)備的技術(shù)原理主要圍繞IC卡的通信和數(shù)據(jù)處理機(jī)制展開。IC卡(包括智能IC卡)通常內(nèi)置有微電子芯片,該芯片
    發(fā)表于 09-26 14:27

    GaN晶體管的應(yīng)用場景有哪些

    GaN(氮化鎵)晶體管,特別是GaN HEMT(高電子遷移率晶體管),近年來在多個領(lǐng)域展現(xiàn)出廣泛的應(yīng)用場景。其出色的高頻性能、高功率密度、高溫穩(wěn)定性以及低導(dǎo)通電阻等特性,使得GaN晶體管成為電力電子和高頻通信等領(lǐng)域的優(yōu)選器件。以下將詳細(xì)闡述GaN晶體管的主要應(yīng)用場景,并結(jié)
    的頭像 發(fā)表于 08-15 11:27 ?919次閱讀

    請問risc-v芯片的主要應(yīng)用場景是哪里?

    如題,我想請教一下risc-v芯片與其他的芯片在應(yīng)用場景上有哪些不一樣?
    發(fā)表于 07-30 21:23

    FPGA與MCU的應(yīng)用場景

    FPGA的應(yīng)用場景有這些: 快速原型設(shè)計(jì) FPGA可以快速配置成多種定制數(shù)字電路,允許在不需要昂貴且耗時的制造過程的情況下進(jìn)行快速部署和修改。 硬件加速 在需要高性能和低延遲的應(yīng)用中,F(xiàn)PGA的并行
    發(fā)表于 07-29 15:45

    STM32待機(jī)模式適合用于那些應(yīng)用場景?

    對于查看STM32低功耗模式,共有三種,其中最省電的為待機(jī)模式,但是待機(jī)模式喚醒后相當(dāng)于軟件復(fù)位了,ram及寄存器中的值都復(fù)位了,僅僅是備份域的寄存器除外,因此有個疑問,待機(jī)模式適合用于那些應(yīng)用場景
    發(fā)表于 05-07 07:46

    NanoEdge AI的技術(shù)原理、應(yīng)用場景及優(yōu)勢

    能耗并提高數(shù)據(jù)安全性。本文將對 NanoEdge AI 的技術(shù)原理、應(yīng)用場景以及優(yōu)勢進(jìn)行綜述。 1、技術(shù)原理 NanoEdge AI 的核心技術(shù)包括邊緣計(jì)算、神經(jīng)網(wǎng)絡(luò)壓縮和低功耗硬件設(shè)計(jì)。邊緣計(jì)算
    發(fā)表于 03-12 08:09

    AG32VF-MIPI應(yīng)用場景

    MIPI接口技術(shù)在圖像和視頻傳輸中的應(yīng)用越來越廣泛,應(yīng)用場景也在不斷拓展,而不僅限于移動設(shè)備。MIPI接口在物聯(lián)網(wǎng)、智能家居、智能監(jiān)控、智能電視、智能汽車等領(lǐng)域也得到廣泛應(yīng)用。 MIPI還可
    發(fā)表于 01-22 08:56