激情久久久_欧美视频区_成人av免费_不卡视频一二三区_欧美精品在欧美一区二区少妇_欧美一区二区三区的

腳本之家,腳本語言編程技術及教程分享平臺!
分類導航

Python|VBS|Ruby|Lua|perl|VBA|Golang|PowerShell|Erlang|autoit|Dos|bat|

服務器之家 - 腳本之家 - Python - python 爬取馬蜂窩景點翻頁文字評論的實現

python 爬取馬蜂窩景點翻頁文字評論的實現

2020-04-08 19:12MobChaos Python

這篇文章主要介紹了python 爬取馬蜂窩景點翻頁文字評論的實現,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧

使用Chrome、python3.7、requests庫和VSCode進行爬取馬蜂窩黃鶴樓的文字評論(http://www.mafengwo.cn/poi/5426285.html)。

首先,我們復制一段評論,查看網頁源代碼,按Ctrl+F查找,發現沒有找到評論,說明評論內容不在http://www.mafengwo.cn/poi/5426285.html頁面。

python 爬取馬蜂窩景點翻頁文字評論的實現

回到頁面,劃到評論列表,右鍵檢查,選擇Network,然后點擊后一頁翻頁,觀察Network里的變化,我們要爬的文件就在下面的某個文件里(主要找XHR和JS兩個模塊)。選擇Preview可以更好的讓我們尋找我們想要的文件,然后選擇Headers找到我們要爬的url。

python 爬取馬蜂窩景點翻頁文字評論的實現

python 爬取馬蜂窩景點翻頁文字評論的實現

經過分析我們找到要爬取的url是http://pagelet.mafengwo.cn/poi/pagelet/poiCommentListApi?callback=jQuery18102698237405245767_1579401525334&params=%7B%22poi_id%22%3A%225426285%22%2C%22page%22%3A2%2C%22just_comment%22%3A1%7D&_ts=1579402072160&sn=20e98d65a0&=1579402072161
然而點進去是這樣的

python 爬取馬蜂窩景點翻頁文字評論的實現

這個時候對比一下這兩個頁面的Request Headers,發現原頁面多了個Refer參數

原頁面

python 爬取馬蜂窩景點翻頁文字評論的實現

python 爬取馬蜂窩景點翻頁文字評論的實現

然后看一下請求get請求需要的參數Query String Parameters,其中poi_id是景點id,page是評論頁面(翻頁只用改變page的值就行)。

python 爬取馬蜂窩景點翻頁文字評論的實現

?
<abbr id="61661"></abbr>

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
import re
import time
import requests
#評論內容所在的url,?后面是get請求需要的參數內容
comment_url='http://pagelet.mafengwo.cn/poi/pagelet/poiCommentListApi?'
 
requests_headers={
  'Referer': 'http://www.mafengwo.cn/poi/5426285.html',
  'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.88 Safari/537.36'
}#請求頭
 
for num in range(1,6):
  requests_data={
    'params': '{"poi_id":"5426285","page":"%d","just_comment":1}' % (num)  #經過測試只需要用params參數就能爬取內容
    }
  response =requests.get(url=comment_url,headers=requests_headers,params=requests_data)
  if 200==response.status_code:
    page = response.content.decode('unicode-escape', 'ignore').encode('utf-8', 'ignore').decode('utf-8')#爬取頁面并且解碼
    page = page.replace('\\/', '/')#將\/轉換成/
    #日期列表
    date_pattern = r'<a class="btn-comment _j_comment" id="codetool">

結果

python 爬取馬蜂窩景點翻頁文字評論的實現

以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持服務器之家。

原文鏈接:https://blog.csdn.net/qq_45373920/article/details/104037607

延伸 · 閱讀

精彩推薦
主站蜘蛛池模板: 日本在线不卡一区二区 | 国产亚洲精品综合一区91555 | 一区二区视频在线看 | 草草视频在线 | 久久久久久久久亚洲精品 | 毛片免费观看视频 | 久夜tv| 黄色免费在线电影 | 久草在线新时代视觉 | 男女隐私免费视频 | 永久免费不卡在线观看黄网站 | 在线成人免费视频 | 老师你怎么会在这第2季出现 | 草草久久久| 欧产日产国产精品乱噜噜 | 亚洲免费永久 | 性爱视频免费 | 日韩在线视频免费 | 亚洲成a| 久久精品日产第一区二区三区 | 欧美精选一区二区 | 国产精品国产三级国产aⅴ无密码 | 久久av喷吹av高潮av懂色 | 亚洲精品久久久久www | 快播av在线| 久久精品中文字幕一区二区 | 久久久久国产一区二区三区不卡 | 亚洲自拍第二页 | 国产xxxx免费 | 97中文| 国产成人综合在线观看 | 中国美女一级黄色大片 | 欧美一级视频免费看 | 一区二区三区日韩在线观看 | 国产成人av免费看 | 国产一区二区三区在线免费观看 | 国产亚洲精品久久久久久久久久 | 久久免费精品 | av电影在线网 | 久久久久久久久久综合 | 久久精品一区视频 |