激情久久久_欧美视频区_成人av免费_不卡视频一二三区_欧美精品在欧美一区二区少妇_欧美一区二区三区的

腳本之家,腳本語言編程技術(shù)及教程分享平臺!
分類導(dǎo)航

Python|VBS|Ruby|Lua|perl|VBA|Golang|PowerShell|Erlang|autoit|Dos|bat|

服務(wù)器之家 - 腳本之家 - Python - Python使用scrapy采集數(shù)據(jù)過程中放回下載過大頁面的方法

Python使用scrapy采集數(shù)據(jù)過程中放回下載過大頁面的方法

2020-06-01 10:50pythoner Python

這篇文章主要介紹了Python使用scrapy采集數(shù)據(jù)過程中放回下載過大頁面的方法,可實(shí)現(xiàn)限制下載過大頁面的功能,非常具有實(shí)用價(jià)值,需要的朋友可以參考下

本文實(shí)例講述了Python使用scrapy采集數(shù)據(jù)過程中放回下載過大頁面的方法。分享給大家供大家參考。具體分析如下:

添加以下代碼到settings.py,myproject為你的項(xiàng)目名稱

復(fù)制代碼 代碼如下:
DOWNLOADER_HTTPCLIENTFACTORY = 'myproject.downloader.LimitSizeHTTPClientFactory'

 

自定義限制下載過大頁面的模塊

復(fù)制代碼 代碼如下:
MAX_RESPONSE_SIZE = 1048576 # 1Mb
from scrapy.core.downloader.webclient import ScrapyHTTPClientFactory, ScrapyHTTPPageGetter
class LimitSizePageGetter(ScrapyHTTPPageGetter):
    def handleHeader(self, key, value):
        ScrapyHTTPPageGetter.handleHeader(self, key, value)
        if key.lower() == 'content-length' and int(value) > MAX_RESPONSE_SIZE:
            self.connectionLost('oversized')
class LimitSizeHTTPClientFactory(ScrapyHTTPClientFactory):
     protocol = LimitSizePageGetter

 

希望本文所述對大家的Python程序設(shè)計(jì)有所幫助。

延伸 · 閱讀

精彩推薦
主站蜘蛛池模板: 色阁五月| 色婷婷久久一区二区 | 美女很黄很黄免费的 | 欧美a级大胆视频 | 午夜免费一区 | 操操日日 | 亚洲午夜天堂吃瓜在线 | 国产毛片在线高清视频 | 久久久国产一级片 | 国产精品区一区二区三区 | 可以看逼的视频 | 一本一本久久a久久精品综合小说 | 精品一区二区免费视频视频 | 久久人人爽人人爽人人片av高请 | 亚洲va久久久噜噜噜久久男同 | 国产91在线播放九色 | 免费久久精品 | 黄色毛片视频在线观看 | 久久综合入口 | 免费国产一区二区视频 | 亚洲男人一区 | 99爱视频在线观看 | 97中文字幕第一一一页 | 一夜新娘第三季免费观看 | 国产在线精品一区二区三区 | 久久男人 | 全部免费毛片 | 99精品视频一区二区三区 | 乱淫67194| 成人一区二区在线观看视频 | avav在线播放 | 久久久成人999亚洲区美女 | 日日鲁一鲁视频 | 亚洲人成网站在e线播放 | 一区二区三区播放 | 黄网站免费观看视频 | freexxx69性欧美hd| 国产成人精品午夜视频' | 4p一女两男做爰在线观看 | 中文字幕亚洲情99在线 | 成人精品 |