引言
面完了負(fù)載均衡,正向代理,反向代理,終于松了一口氣,然后話題轉(zhuǎn)向了緩存Redis,為什么是這個順序呢?
回想了一下系統(tǒng)架構(gòu),我大概知道原因了。
Redis 處于服務(wù)最上層。面試官是按照這個順序從上到下考察我對整個系統(tǒng)設(shè)計能力,圍著整個系統(tǒng)自頂向下的結(jié)構(gòu)考察基礎(chǔ)。不糾結(jié)這么多,反正先問后問,Redis一定是你必須掌握的。
1、面試官:我看你提到,項目中使用了Reids作為緩存,為什么是Reids而不是其他,Redis有什么優(yōu)勢嗎?
問題分析: Redis的設(shè)計理念已經(jīng)成了很多一線互聯(lián)網(wǎng)公司自主研發(fā)分布式緩存框架的標(biāo)桿,因為相比傳統(tǒng)的 Memcache ,Redis 豐富的數(shù)據(jù)結(jié)構(gòu)實在太香。
答:
- 首先 Redis 支持豐富的數(shù)據(jù)結(jié)構(gòu),新版本數(shù)據(jù)結(jié)構(gòu)從最初的5種變成9種。
- 其次 Redis 是讀寫單進程單線程,不用考慮并發(fā)讀寫的復(fù)雜場景,速度也快。
- Reids 功能完備,支持?jǐn)?shù)據(jù)持久化,支持主從復(fù)制和集群。
- 還有Lua腳本,事務(wù),發(fā)布訂閱模型,Reids 都支持。
在高并發(fā)請求時,為何我們頻繁提到緩存技術(shù)?最直接的原因是,磁盤IO及網(wǎng)絡(luò)開銷是直接請求內(nèi)存IO千百上千倍,做個簡單計算,如果我們需要某個數(shù)據(jù),該數(shù)據(jù)從數(shù)據(jù)庫磁盤讀出來需要0.0045S,經(jīng)過網(wǎng)絡(luò)請求傳輸需要0.0005S,那么每個請求完成最少需要0.005S,該數(shù)據(jù)服務(wù)器每秒最多只能響應(yīng)200個請求,而如果該數(shù)據(jù)存于本機內(nèi)存里,讀出來只需要100us,那么每秒能夠響應(yīng)10000個請求。通過將數(shù)據(jù)存儲到離CPU更近的未位置,減少數(shù)據(jù)傳輸時間,提高處理效率,這就是緩存的意義。
給您列舉一個我利用Reids把項目QPS提到幾十萬級別的案例:
一個風(fēng)控系統(tǒng)在日常24H中 Redis集群 QPS 曲線圖,從業(yè)務(wù)低峰期幾千或晚高峰最高30W,一個 Redis 集群都可輕松應(yīng)對,30WQPS 在大型系統(tǒng)中流量并不算高,且不是核心系統(tǒng),如果在多幾倍幾十倍多流量,一個結(jié)構(gòu)優(yōu)良的Redis 集群都可輕松應(yīng)對,這充分說明了我們?yōu)槭裁匆褂镁彺妫彺婵梢园严到y(tǒng)響應(yīng)能力提高N個數(shù)量級,遠高于傳統(tǒng)基于硬盤的關(guān)系型數(shù)據(jù)庫
面試官心想:看來是做足了功課。
2、面試官:剛剛你提到Redis是單線程,為什么單線程模型的 Redis 性能不減。
問題分析:成功挖坑,提到單線程肯定會問我為什么要這樣設(shè)計。
答:
單線程不代表一定就慢,單線程有一個最大好處就是節(jié)省線程切換的開銷,更不用考慮并發(fā)讀寫帶來的復(fù)雜操作場景,這就大大節(jié)省了線程間切換的時間了。
單線程模型避免了多線程的頻繁上下文切換,這也避免了多線程可能產(chǎn)生的競爭問題。
Reids 是基于內(nèi)存的讀寫操作,內(nèi)存肯定比傳統(tǒng)磁盤IO數(shù)據(jù)庫快。
Reids 核心是基于非阻塞的IO多路復(fù)用機制。
3、面試官:那你剛剛說的Redis數(shù)據(jù)結(jié)構(gòu)都有哪幾種,如何選擇使用哪種?
問題分析: 常用的5種,重點學(xué)會這5種數(shù)據(jù)結(jié)構(gòu)的使用足夠了。
答:比較常用的有5種
字符串 String: 字符串是 Redis 中最為基礎(chǔ)的數(shù)據(jù)存儲類型,數(shù)據(jù)結(jié)構(gòu)簡單,可存儲文本,Json,圖片數(shù)據(jù)等任何二進制文件。如姓名,訂單號等,對于一些特殊的數(shù)據(jù)結(jié)構(gòu),比如List、Set等,建議采用相應(yīng)的下面介紹的List和Set數(shù)據(jù)結(jié)構(gòu)進行存儲,這樣不僅可以節(jié)省存儲空間還可以提高操作效率。
列表 List: 類似 Java 中的 List ,按照插入順序排序的字符串鏈表,在插入時,如果該鍵并不存在,Redis將為該鍵創(chuàng)建一個新的鏈表。與此相反,如果鏈表中所有的元素均被移除,那么該鍵也將會被從數(shù)據(jù)庫中刪除。
集合 Set: 類似 Java 中的set,但它是一個無序集合,用于存儲無序(存入和取出的順序不一定相同)元素,值不能重復(fù)。可以使用Redis的Set數(shù)據(jù)類型跟蹤一些唯一性數(shù)據(jù),比如訪問系統(tǒng)的唯一IP地址,唯一用戶ID等信息,再比如在微博應(yīng)用中,每個人的好友存在一個集合(set)中,這樣求兩個人的共同好友的操作,可能就只需要用求交集命令即可。
有序集合 Sorted Set: 類似 Java 中的 TreeSet,支持從小到大排序的 set,適用于排行榜結(jié)構(gòu)的數(shù)據(jù)存儲。
Hash: 類型相當(dāng)于Java中的HashMap,所以該類型非常適合于存儲值對象的信息,比如用戶基本信息對象含有昵稱、性別和Age等屬性,可以使用Hash來存儲User對象,Key可以為用戶的唯一ID屬性。
除此之外,新版本的Redis還提供了位圖,地理坐標(biāo),流幾種結(jié)構(gòu)。
深入分析
曾經(jīng)有面試官問我,你看過Reids源碼嗎,我說沒有看過,他說有精力可以研究一下,Redis那幾種常用的數(shù)據(jù)結(jié)構(gòu)底層實現(xiàn)原理還是值得學(xué)習(xí)的。
1、簡單動態(tài)字符串結(jié)構(gòu),Redis字符串的實現(xiàn)方式
簡單動態(tài)字符串(simple dynamic string)簡稱SDS。Redis使用C語言編寫,但是傳統(tǒng)的C字符串使用長度為 N+1 的字符串?dāng)?shù)組來表示長度為N的字符串,所以為了獲取一個長度為C字符串的長度,必須遍歷整個字符串。和C字符串不同,動態(tài)字符串的數(shù)據(jù)結(jié)構(gòu)中,有專門用于保存字符串長度的變量,我們可以通過獲取len屬性的值,直接知道字符串長度,從一定程度上提高了讀取效率。
Redis源碼中,動態(tài)字符串的定義:
1
2
3
4
5
6
7
8
9
10
11
|
/* * 保存字符串對象的結(jié)構(gòu) */ struct sdshdr { // buf 中已占用空間的長度 int len; // buf 中剩余可用空間的長度 int free; // 數(shù)據(jù)空間 char buf[]; }; |
len
變量,用于記錄buf 中已經(jīng)使用的空間長度。
free
變量,用于記錄buf 中還空余的空間,初次分配空間,一般沒有空余,在對字符串修改的時候,會有剩余空間出現(xiàn),這樣做是為了杜絕C語言中緩沖區(qū)溢出的可能性,當(dāng)我們需要對一個SDS進行修改的時候,Redis 會在執(zhí)行拼接操作之前,預(yù)先檢查給定SDS空間是否足夠,如果不夠,會先拓展SDS的空間,然后再執(zhí)行拼接操作。
buf
字符數(shù)組,用于記錄我們的字符串(記錄Redis)。
2、鏈表數(shù)據(jù)結(jié)構(gòu),List 底層結(jié)構(gòu)
鏈表還是常規(guī)的普通雙端鏈表,可以支持反向查找和遍歷,更方便操作,通過增刪節(jié)點來靈活地調(diào)整鏈表的長度,雙端鏈表在Redis內(nèi)部也是被多次使用:
- 事務(wù)模塊使用雙端鏈表依序保存輸入的命令。
- 服務(wù)器模塊使用雙端鏈表來保存多個客戶端。
- 訂閱/發(fā)送模塊使用雙端鏈表來保存訂閱模式的多個客戶端。
- 事件模塊使用雙端鏈表來保存時間事件(time event)。
3、跳躍表,sorted set底層結(jié)構(gòu)
Redis sorted set的內(nèi)部使用HashMap和跳躍表(SkipList)來保證數(shù)據(jù)的存儲和有序,(如果你還不了解紅黑樹,需要先額外補補功課),HashMap里放的是成員到score的映射,而跳躍表里存放的是所有的成員,排序依據(jù)是HashMap里存的score,使用跳躍表的結(jié)構(gòu)可以獲得比較高的查找效率,并且在實現(xiàn)上比較簡單。
那為什么Redis的作者使用 SkipList 結(jié)構(gòu)而不是紅黑樹?
紅黑樹:紅黑樹的查找效率很高,但是在進行重新平衡時,會涉及到大量節(jié)點的變化,因此實現(xiàn)和操作起來都比較復(fù)雜。
跳躍表:通過簡單的多層索引結(jié)構(gòu),實現(xiàn)簡單,且能達到近似于紅黑樹的查找效率,插入節(jié)點(多層插入)不需要像紅黑樹那樣有額外操作。而且跳躍表還能實現(xiàn)范圍查找及輸出,而紅黑樹只支持單個元素查找,對于范圍查找效率低。
關(guān)于緩存的一些算法
(偷偷告訴你,這幾個關(guān)于Reids的算法很大概率也會被問到,需要多少知道幾種)
常用緩存數(shù)據(jù)淘汰策略
緩存是非常寶貴的資源,不能把所有數(shù)據(jù)都放入緩存,只能把最重要的或者要求查詢速度最快的數(shù)據(jù)緩存起來,比如微博熱門話題排行榜功能,通常使用緩存查詢,而不是數(shù)據(jù)庫。
FIFO(First In First Out): 先進先出算法,即先放入緩存的先被移除。
LRU(Least Recently Used): 最近最少使用算法,使用時間距離現(xiàn)在最久的那個被移除。
LFU(Least Frequently Used): 最不常用算法,一定時間段內(nèi)使用次數(shù)(頻率)最少的那個被移除。
緩存數(shù)據(jù)更新策略
- 定時任務(wù)從數(shù)據(jù)庫直接更新緩存:適用于對時間不敏感的數(shù)據(jù)。
- 查詢時寫緩存,即查詢優(yōu)先查詢緩存,若緩存未命中,查詢數(shù)據(jù)庫,將返回結(jié)果寫入緩存,數(shù)據(jù)更新時先 delete緩存,再更新緩存。
- MQ 消息異步更新緩存,后文中會針對MQ的應(yīng)用做單獨講解。
總結(jié)
這一節(jié)重點講解分布式緩存 Redis ,本地緩存不一定每個項目都會使用,但是 Redis 數(shù)據(jù)設(shè)計合理,保證超高命中率,集群足夠穩(wěn)定,那完全可以替代一級本地緩存。所以 Redis 非常值得你花更多時間學(xué)習(xí)。分布式緩存是面試必問。
Redis 是建設(shè)高性能網(wǎng)站后臺不可缺少的工具,無論你是面試業(yè)務(wù)開發(fā)工程師還是架構(gòu)師,都需要熟練掌握。
關(guān)于Redis,推薦閱讀黃建宏的《Redis 設(shè)計與實現(xiàn)》,能夠掌握Redis的5種數(shù)據(jù)結(jié)構(gòu),Redis 的持久化方式 RDB 和 AOF,兩者有什么優(yōu)點和缺點,如何選型,以及了解高可用 Redis 集群的建設(shè)方案。
以上就是分布式架構(gòu)Redis中有哪些數(shù)據(jù)結(jié)構(gòu)及底層實現(xiàn)原理的詳細(xì)內(nèi)容,更多關(guān)于分布式架構(gòu)Redis底層數(shù)據(jù)結(jié)構(gòu)及原理的資料請關(guān)注服務(wù)器之家其它相關(guān)文章!
原文鏈接:https://blog.csdn.net/qq_34272760/article/details/120734895