激情久久久_欧美视频区_成人av免费_不卡视频一二三区_欧美精品在欧美一区二区少妇_欧美一区二区三区的

服務器之家:專注于服務器技術及軟件下載分享
分類導航

Mysql|Sql Server|Oracle|Redis|MongoDB|PostgreSQL|Sqlite|DB2|mariadb|Access|數據庫技術|

服務器之家 - 數據庫 - Redis - 使用Redis有序集合實現IP歸屬地查詢詳解

使用Redis有序集合實現IP歸屬地查詢詳解

2019-11-23 20:40yongxinz Redis

這篇文章主要介紹了使用Redis有序集合實現IP歸屬地查詢,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧

工作中經常遇到一類需求,根據 IP 地址段來查找 IP 對應的歸屬地信息。如果把查詢過程放到關系型數據庫中,會帶來很大的 IO 消耗,速度也不能滿足,顯然是不合適的。

那有哪些更好的辦法呢?為此做了一些嘗試,下面來詳細說明。

構建索引文件

在 GitHub 上看到一個ip2region 項目,作者通過生成一個包含有二級索引的文件來實現快速查詢,查詢速度足夠快,毫秒級別。但如果想更新地址段或歸屬地信息,每次都要重新生成文件,并不是很方便。
不過還是推薦大家看看這個項目,其中建索引的思想還是很值得學習的。作者的開源項目中只有查詢的相關代碼,并沒有生成索引文件的代碼,我依照原理圖寫了一段生成索引文件的代碼,如下:

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
# -*- coding:utf-8 -*-
 
 
import time
import socket
import struct
 
IP_REGION_FILE = './data/ip_to_region.db'
 
SUPER_BLOCK_LENGTH = 8
INDEX_BLOCK_LENGTH = 12
HEADER_INDEX_LENGTH = 8192
 
 
def generate_db_file():
  pointer = SUPER_BLOCK_LENGTH + HEADER_INDEX_LENGTH
 
  region, index = '', ''
 
  # 文件格式
  # 1.0.0.0|1.0.0.255|澳大利亞|0|0|0|0
  # 1.0.1.0|1.0.3.255|中國|0|福建省|福州市|電信
  with open('./ip.merge.txt', 'r') as f:
    for line in f.readlines():
      item = line.strip().split('|')
      print item[0], item[1], item[2], item[3], item[4], item[5], item[6]
      start_ip = struct.pack('I', struct.unpack('!L', socket.inet_aton(item[0]))[0])
      end_ip = struct.pack('I', struct.unpack('!L', socket.inet_aton(item[1]))[0])
      region_item = '|'.join([item[2], item[3], item[4], item[5], item[6]])
      region += region_item
 
      ptr = struct.pack('I', int(bin(len(region_item))[2:].zfill(8) + bin(pointer)[2:].zfill(24), 2))
      index += start_ip + end_ip + ptr
      pointer += len(region_item)
 
  index_start_ptr = pointer
  index_end_ptr = pointer + len(index) - 12
  super_block = struct.pack('I', index_start_ptr) + struct.pack('I', index_end_ptr)
 
  n = 0
  header_index = ''
  for index_block in range(pointer, index_end_ptr, 8184):
    header_index_block_ip = index[n * 8184:n * 8184 + 4]
    header_index_block_ptr = index_block
    header_index += header_index_block_ip + struct.pack('I', header_index_block_ptr)
 
    n += 1
 
  header_index += index[len(index) - 12: len(index) - 8] + struct.pack('I', index_end_ptr)
 
  with open(IP_REGION_FILE, 'wb') as f:
    f.write(super_block)
    f.write(header_index)
    f.seek(SUPER_BLOCK_LENGTH + HEADER_INDEX_LENGTH, 0)
    f.write(region)
    f.write(index)
 
 
if __name__ == '__main__':
  start_time = time.time()
  generate_db_file()
 
  print 'cost time: ', time.time() - start_time

使用 Redis 緩存

目前有兩種方式對 IP 以及歸屬地信息進行緩存:

第一種是將起始 IP,結束 IP 以及中間所有 IP 轉換成整型,然后以字符串方式,用轉換后的 IP 作為 key,歸屬地信息作為 value 存入 Redis;

第二種是采用有序集合和散列方式,首先將起始 IP 和結束 IP 添加到有序集合 ip2cityid,城市 ID 作為成員,轉換后的 IP 作為分值,然后再將城市 ID 和歸屬地信息添加到散列 cityid2city,城市 ID 作為 key,歸屬地信息作為 value。

第一種方式就不多做介紹了,簡單粗暴,非常不推薦。查詢速度當然很快,毫秒級別,但缺點也十分明顯,我用 1000 條數據做了測試,緩存時間長,大概 20 分鐘,占用空間大,將近 1G。

下面介紹第二種方式,直接看代碼:

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
# generate_to_redis.py
# -*- coding:utf-8 -*-
 
import time
import json
from redis import Redis
 
 
def ip_to_num(x):
  return sum([256 ** j * int(i) for j, i in enumerate(x.split('.')[::-1])])
 
 
# 連接 Redis
conn = Redis(host='127.0.0.1', port=6379, db=10)
 
start_time = time.time()
 
# 文件格式
# 1.0.0.0|1.0.0.255|澳大利亞|0|0|0|0
# 1.0.1.0|1.0.3.255|中國|0|福建省|福州市|電信
with open('./ip.merge.txt', 'r') as f:
  i = 1
  for line in f.readlines():
    item = line.strip().split('|')
    # 將起始 IP 和結束 IP 添加到有序集合 ip2cityid
    # 成員分別是城市 ID 和 ID + #, 分值是根據 IP 計算的整數值
    conn.zadd('ip2cityid', str(i), ip_to_num(item[0]), str(i) + '#', ip_to_num(item[1]) + 1)
    # 將城市信息添加到散列 cityid2city,key 是城市 ID,值是城市信息的 json 序列
    conn.hset('cityid2city', str(i), json.dumps([item[2], item[3], item[4], item[5]]))
 
    i += 1
 
end_time = time.time()
 
print 'start_time: ' + str(start_time) + ', end_time: ' + str(end_time) + ', cost time: ' + str(end_time - start_time)
?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
# test.py
# -*- coding:utf-8 -*-
 
import sys
import time
import json
import socket
import struct
from redis import Redis
 
# 連接 Redis
conn = Redis(host='127.0.0.1', port=6379, db=10)
 
# 將 IP 轉換成整數
ip = struct.unpack("!L", socket.inet_aton(sys.argv[1]))[0]
 
start_time = time.time()
# 將有序集合從大到小排序,取小于輸入 IP 值的第一條數據
cityid = conn.zrevrangebyscore('ip2cityid', ip, 0, start=0, num=1)
# 如果返回 cityid 是空,或者匹配到了 # 號,說明沒有找到對應地址段
if not cityid or cityid[0].endswith('#'):
  print 'no city info...'
else:
  # 根據城市 ID 到散列表取出城市信息
  ret = json.loads(conn.hget('cityid2city', cityid[0]))
  print ret[0], ret[1], ret[2]
 
end_time = time.time()
print 'start_time: ' + str(start_time) + ', end_time: ' + str(end_time) + ', cost time: ' + str(end_time - start_time)
?
1
2
# python generate_to_redis.py
start_time: 1554300310.31, end_time: 1554300425.65, cost time: 115.333260059
?
1
2
3
# python test_2.py 1.0.16.0
日本 0 0
start_time: 1555081532.44, end_time: 1555081532.45, cost time: 0.000912189483643

測試數據大概 50 萬條,緩存所用時間不到 2 分鐘,占用內存 182M,查詢速度毫秒級別。顯而易見,這種方式更值得嘗試。

zrevrangebyscore 方法的時間復雜度是 O(log(N)+M), N 為有序集的基數, M 為結果集的基數。可見當 N 的值越大,查詢效率越慢,具體在多大的數據量還可以高效查詢,這個有待驗證。不過這個問題我覺得并不用擔心,遇到了再說吧。

以上所述是小編給大家介紹的使用Redis有序集合實現IP歸屬地查詢詳解整合,希望對大家有所幫助,如果大家有任何疑問請給我留言,小編會及時回復大家的。在此也非常感謝大家對服務器之家網站的支持!

原文鏈接:https://juejin.im/post/5cb4971fe51d456e660d4492

延伸 · 閱讀

精彩推薦
  • RedisRedis如何實現數據庫讀寫分離詳解

    Redis如何實現數據庫讀寫分離詳解

    Redis的主從架構,能幫助我們實現讀多,寫少的情況,下面這篇文章主要給大家介紹了關于Redis如何實現數據庫讀寫分離的相關資料,文中通過示例代碼介紹...

    羅兵漂流記6092019-11-11
  • RedisRedis全量復制與部分復制示例詳解

    Redis全量復制與部分復制示例詳解

    這篇文章主要給大家介紹了關于Redis全量復制與部分復制的相關資料,文中通過示例代碼介紹的非常詳細,對大家學習或者使用Redis爬蟲具有一定的參考學習...

    豆子先生5052019-11-27
  • Redisredis實現排行榜功能

    redis實現排行榜功能

    排行榜在很多地方都能使用到,redis的zset可以很方便地用來實現排行榜功能,本文就來簡單的介紹一下如何使用,具有一定的參考價值,感興趣的小伙伴們...

    乘月歸5022021-08-05
  • Redisredis中如何使用lua腳本讓你的靈活性提高5個逼格詳解

    redis中如何使用lua腳本讓你的靈活性提高5個逼格詳解

    這篇文章主要給大家介紹了關于redis中如何使用lua腳本讓你的靈活性提高5個逼格的相關資料,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具...

    一線碼農5812019-11-18
  • Redisredis 交集、并集、差集的具體使用

    redis 交集、并集、差集的具體使用

    這篇文章主要介紹了redis 交集、并集、差集的具體使用,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友...

    xiaojin21cen10152021-07-27
  • Redis詳解Redis復制原理

    詳解Redis復制原理

    與大多數db一樣,Redis也提供了復制機制,以滿足故障恢復和負載均衡等需求。復制也是Redis高可用的基礎,哨兵和集群都是建立在復制基礎上實現高可用的...

    李留廣10222021-08-09
  • RedisRedis 事務知識點相關總結

    Redis 事務知識點相關總結

    這篇文章主要介紹了Redis 事務相關總結,幫助大家更好的理解和學習使用Redis,感興趣的朋友可以了解下...

    AsiaYe8232021-07-28
  • RedisRedis的配置、啟動、操作和關閉方法

    Redis的配置、啟動、操作和關閉方法

    今天小編就為大家分享一篇Redis的配置、啟動、操作和關閉方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧 ...

    大道化簡5312019-11-14
主站蜘蛛池模板: 男女羞羞视频在线免费观看 | 中国成人在线视频 | 香蕉黄色网| 久国产 | a免费毛片| 久草视频在线看 | 99在线啪 | av电影免费在线看 | 视频一区二区精品 | 巨乳激情 | 成人三级免费电影 | 亚洲午夜一区二区三区 | 玩偶姐姐在线观看免费 | 国产91九色在线播放 | www.7777在线| 国产精品久久久久久模特 | 国产交换3p国产精品 | 久久久成人精品视频 | 欧美四级在线观看 | 久久精品a一级国产免视看成人 | 91精品国产99久久久久久红楼 | 美女黄色影院 | 免费91在线 | 免费视频一区 | 极品大长腿啪啪高潮露脸 | 热99热| 久久久入口 | 精品国产久 | 日韩精品中文字幕在线播放 | 久久精品视频一区二区三区 | av手机在线免费播放 | 黄污免费网站 | 久久综合给合久久狠狠狠97色69 | 精品视频一区二区三区四区 | 欧洲色阁中文字幕 | 爱高潮www亚洲精品 国产一区二区三区视频免费 | 亚洲成人国产综合 | 成人毛片免费 | 精品国产91久久久久久浪潮蜜月 | 一级片999 | 黄色片网站免费在线观看 |