LMDB的全稱是Lightning Memory-Mapped Database(快如閃電的內(nèi)存映射數(shù)據(jù)庫),它的文件結(jié)構(gòu)簡單,包含一個(gè)數(shù)據(jù)文件和一個(gè)鎖文件:
LMDB文件可以同時(shí)由多個(gè)進(jìn)程打開,具有極高的數(shù)據(jù)存取速度,訪問簡單,不需要運(yùn)行單獨(dú)的數(shù)據(jù)庫管理進(jìn)程,只要在訪問數(shù)據(jù)的代碼里引用LMDB庫,訪問時(shí)給文件路徑即可。
讓系統(tǒng)訪問大量小文件的開銷很大,而LMDB使用內(nèi)存映射的方式訪問文件,使得文件內(nèi)尋址的開銷非常小,使用指針運(yùn)算就能實(shí)現(xiàn)。數(shù)據(jù)庫單文件還能減少數(shù)據(jù)集復(fù)制/傳輸過程的開銷。
在python中使用lmdb: linux中,可以使用指令‘pip install lmdb' 安裝lmdb包。
1. 生成一個(gè)空的lmdb數(shù)據(jù)庫文件
1
2
3
4
5
6
7
|
# -*- coding: utf-8 -*- import lmdb # 如果train文件夾下沒有data.mbd或lock.mdb文件,則會生成一個(gè)空的,如果有,不會覆蓋 # map_size定義最大儲存容量,單位是kb,以下定義1TB容量 env = lmdb. open ( "./train" ,map_size = 1099511627776 ) env.close() |
2. LMDB數(shù)據(jù)的添加、修改、刪除
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
|
# -*- coding: utf-8 -*- import lmdb # map_size定義最大儲存容量,單位是kb,以下定義1TB容量 env = lmdb. open ( "./train" , map_size = 1099511627776 ) txn = env.begin(write = True ) # 添加數(shù)據(jù)和鍵值 txn.put(key = '1' , value = 'aaa' ) txn.put(key = '2' , value = 'bbb' ) txn.put(key = '3' , value = 'ccc' ) # 通過鍵值刪除數(shù)據(jù) txn.delete(key = '1' ) # 修改數(shù)據(jù) txn.put(key = '3' , value = 'ddd' ) # 通過commit()函數(shù)提交更改 txn.commit() env.close() |
3. 查詢lmdb數(shù)據(jù)庫內(nèi)容
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
|
# -*- coding: utf-8 -*- import lmdb env = lmdb. open ( "./train" ) # 參數(shù)write設(shè)置為True才可以寫入 txn = env.begin(write = True ) ############################################添加、修改、刪除數(shù)據(jù) # 添加數(shù)據(jù)和鍵值 txn.put(key = '1' , value = 'aaa' ) txn.put(key = '2' , value = 'bbb' ) txn.put(key = '3' , value = 'ccc' ) # 通過鍵值刪除數(shù)據(jù) txn.delete(key = '1' ) # 修改數(shù)據(jù) txn.put(key = '3' , value = 'ddd' ) # 通過commit()函數(shù)提交更改 txn.commit() ############################################查詢lmdb數(shù)據(jù) txn = env.begin() # get函數(shù)通過鍵值查詢數(shù)據(jù) print txn.get( str ( 2 )) # 通過cursor()遍歷所有數(shù)據(jù)和鍵值 for key, value in txn.cursor(): print (key, value) ############################################ env.close() |
4. 讀取已有.mdb文件內(nèi)容
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
|
# -*- coding: utf-8 -*- import lmdb env_db = lmdb.Environment( 'trainC' ) # env_db = lmdb.open("./trainC") txn = env_db.begin() # get函數(shù)通過鍵值查詢數(shù)據(jù),如果要查詢的鍵值沒有對應(yīng)數(shù)據(jù),則輸出None print txn.get( str ( 200 )) for key, value in txn.cursor(): #遍歷 print (key, value) env_db.close() |
以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持服務(wù)器之家。
原文鏈接:https://blog.csdn.net/touch_dream/article/details/80527341