激情久久久_欧美视频区_成人av免费_不卡视频一二三区_欧美精品在欧美一区二区少妇_欧美一区二区三区的

腳本之家,腳本語言編程技術及教程分享平臺!
分類導航

Python|VBS|Ruby|Lua|perl|VBA|Golang|PowerShell|Erlang|autoit|Dos|bat|

服務器之家 - 腳本之家 - Python - Python打印scrapy蜘蛛抓取樹結構的方法

Python打印scrapy蜘蛛抓取樹結構的方法

2020-06-01 10:44pythoner Python

這篇文章主要介紹了Python打印scrapy蜘蛛抓取樹結構的方法,實例分析了打印scrapy蜘蛛抓取樹結構的技巧,非常具有實用價值,需要的朋友可以參考下

本文實例講述了Python打印scrapy蜘蛛抓取樹結構的方法。分享給大家供大家參考。具體如下:

通過下面這段代碼可以一目了然的知道scrapy的抓取頁面結構,調用也非常簡單

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
#!/usr/bin/env python
import fileinput, re
from collections import defaultdict
def print_urls(allurls, referer, indent=0):
  urls = allurls[referer]
  for url in urls:
    print ' '*indent + referer
    if url in allurls:
      print_urls(allurls, url, indent+2)
def main():
  log_re = re.compile(r'<GET (.*?)> \(referer: (.*?)\)')
  allurls = defaultdict(list)
  for l in fileinput.input():
    m = log_re.search(l)
    if m:
      url, ref = m.groups()
      allurls[ref] += [url]
  print_urls(allurls, 'None')
main()

希望本文所述對大家的Python程序設計有所幫助。

延伸 · 閱讀

精彩推薦
主站蜘蛛池模板: 天天色综合2 | 九草av | 国产精品自在线拍 | 精品一区在线视频 | 康妮卡特欧美精品一区 | 最新在线黄色网址 | 成人黄色免费网址 | 男女污视频在线观看 | 在线看毛片的网站 | 国产一精品一av一免费爽爽 | 国产88久久久国产精品免费二区 | 羞羞的视频| 久草在线免费资源站 | 日韩毛片免费观看 | 成人在线视频精品 | 亚洲xxx在线观看 | 99国产精品国产免费观看 | 91经典视频| 日韩欧美动作影片 | 中文字幕天堂在线 | 国产在线精品一区二区不卡 | 中国字幕av | 久久久久99一区二区三区 | 斗破苍穹在线观看免费完整观看 | 久久国产一 | 亚洲免费在线视频 | 欧美一级毛片美99毛片 | 一区二区三区在线观看国产 | 国产精品免费观在线 | 亚洲国产高清一区 | 国产一区二区三区在线免费 | 日韩av有码在线 | 久久精品高清 | 青草伊人网 | 男女隐私免费视频 | 一区二区国产在线 | 一级做受大片免费视频 | 九九热国产视频 | 黄网站色成年大片免费高 | 国产精品视频久久久 | 久久亚洲精品国产 |