激情久久久_欧美视频区_成人av免费_不卡视频一二三区_欧美精品在欧美一区二区少妇_欧美一区二区三区的

腳本之家,腳本語言編程技術及教程分享平臺!
分類導航

Python|VBS|Ruby|Lua|perl|VBA|Golang|PowerShell|Erlang|autoit|Dos|bat|

服務器之家 - 腳本之家 - Python - Python 循環讀取數據內存不足的解決方案

Python 循環讀取數據內存不足的解決方案

2021-11-13 10:44ON_THE_WAY_FOREVER Python

這篇文章主要介紹了Python 循環讀取數據內存不足的解決方案,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教

看代碼吧~

?
1
2
3
4
5
import gc
for x in list(locals().keys())[:]:
    del locals()[x]
# del all_s_x, ae, ae_split, x_ticks, split
gc.collect()

補充:python讀取大文件的"坑“與內存占用檢測

python讀寫文件的api都很簡單,一不留神就容易踩”坑“。筆者記錄一次踩坑歷程,并且給了一些總結,希望到大家在使用python的過程之中,能夠避免一些可能產生隱患的代碼。

1.read()與readlines():

隨手搜索python讀寫文件的教程,很經常看到read()與readlines()這對函數。所以我們會常常看到如下代碼:

?
1
2
with open(file_path, 'rb') as f:
    sha1obj.update(f.read())

or

?
1
2
3
with open(file_path, 'rb') as f:
    for line in f.readlines():
        print(line)

這對方法在讀取小文件時確實不會產生什么異常,但是一旦讀取大文件,很容易會產生memoryerror,也就是內存溢出的問題。

why memory error?

我們首先來看看這兩個方法:

當默認參數size=-1時,read方法會讀取直到eof,當文件大小大于可用內存時,自然會發生內存溢出的錯誤。

Python 循環讀取數據內存不足的解決方案

同樣的,readlines會構造一個list。list而不是iter,所以所有的內容都會保存在內存之上,同樣也會發生內存溢出的錯誤。

Python 循環讀取數據內存不足的解決方案

2.正確的用法:

在實際運行的系統之中如果寫出上述代碼是十分危險的,這種”坑“十分隱蔽。所以接下來我們來了解一下正確用,正確的用法也很簡單,依照api之中對函數的描述來進行對應的編碼就ok了:

如果是二進制文件推薦用如下這種寫法,可以自己指定緩沖區有多少byte。顯然緩沖區越大,讀取速度越快。

?
1
2
3
4
5
6
7
with open(file_path, 'rb') as f:
    while true:
        buf = f.read(1024)
        if buf:   
            sha1obj.update(buf)
        else:
            break

而如果是文本文件,則可以用readline方法或直接迭代文件(python這里封裝了一個語法糖,二者的內生邏輯一致,不過顯然迭代文件的寫法更pythonic )每次讀取一行,效率是比較低的。筆者簡單測試了一下,在3g文件之下,大概性能和前者差了20%.

?
1
2
3
4
5
6
7
8
9
10
with open(file_path, 'rb') as f:
    while true:
        line = f.readline()
        if buf:   
            print(line)
        else:
            break
with open(file_path, 'rb') as f:
    for line in f:
        print(line)

3.內存檢測工具的介紹:

對于python代碼的內存占用問題,對于代碼進行內存監控十分必要。這里筆者這里推薦兩個小工具來檢測python代碼的內存占用。

?
1
memory_profiler

首先先用pip安裝memory_profiler

?
1
pip install memory_profiler

memory_profiler是利用python的裝飾器工作的,所以我們需要在進行測試的函數上添加裝飾器。

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
from hashlib import sha1
import sys
@profile
def my_func():
    sha1obj = sha1()
    with open(sys.argv[1], 'rb') as f:
        while true:
            buf = f.read(10 * 1024 * 1024)
            if buf:
                sha1obj.update(buf)
            else:
                break
    print(sha1obj.hexdigest())
if __name__ == '__main__':
    my_func()

之后在運行代碼時加上** -m memory_profiler**

就可以了解函數每一步代碼的內存占用了

Python 循環讀取數據內存不足的解決方案

guppy

依樣畫葫蘆,仍然是通過pip先安裝guppy

?
1
pip install guppy

之后可以在代碼之中利用guppy直接打印出對應各種python類型(list、tuple、dict等)分別創建了多少對象,占用了多少內存。

?
1
2
3
4
5
6
7
8
9
10
11
from guppy import hpy
import sys
def my_func():
    mem = hpy()
    with open(sys.argv[1], 'rb') as f:
        while true:
            buf = f.read(10 * 1024 * 1024)
            if buf:
                print(mem.heap())
            else:
                break

如下圖所示,可以看到打印出對應的內存占用數據:

Python 循環讀取數據內存不足的解決方案

通過上述兩種工具guppy與memory_profiler可以很好地來監控python代碼運行時的內存占用問題。

4.小結:

python是一門崇尚簡潔的語言,但是正是因為它的簡潔反而更多了許多需要仔細推敲和思考的細節。希望大家在日常工作與學習之中也能多對一些細節進行總結,少踩一些不必要的“坑”。

以上為個人經驗,希望能給大家一個參考,也希望大家多多支持服務器之家。

原文鏈接:https://blog.csdn.net/weixin_41888257/article/details/107919638

延伸 · 閱讀

精彩推薦
主站蜘蛛池模板: 精品成人一区 | 国产精品成人免费一区久久羞羞 | 91精品一区二区综合在线 | 国产精品成人一区二区三区电影毛片 | 日韩黄色成人 | 欧美日韩中文字幕在线视频 | 欧美高清另类自拍视频在线看 | 女人叉开腿让男人桶 | 国产精品视频成人 | 成人黄视频在线观看 | 亚洲最大久久 | 国产精品亚洲三区 | 欧洲精品久久久久69精品 | 国产高潮失禁喷水爽到抽搐视频 | 欧美日韩亚洲国产精品 | 久久国产精品99国产 | 国产艳妇av视国产精选av一区 | 91成人亚洲| 亚洲成人自拍电影 | 国产99久久久久久免费看 | 欧美a视频在线观看 | 日韩视频在线一区二区三区 | 91精品国产91久久久久久丝袜 | 污污的视频在线观看 | 99亚洲伊人久久精品影院红桃 | 欧美人与禽性xxxxx杂性 | 久草高清视频 | 男人午夜小视频 | 爱草成年 | 免费视频aaa | 法国极品成人h版 | 久久国产精品99国产 | 播色网 | a视频在线免费观看 | 久久久久亚洲视频 | 91色成人| 草莓福利社区在线 | 免费国产成人高清在线看软件 | 欧美偷拍一区二区 | 黄色片网站免费看 | 色视频在线观看 |