波多野结衣先锋影音,中文字幕视频二区,日韩欧美中文

介紹

本篇文章主要介紹如何爬取麥子學(xué)院的課程信息（本爬蟲仍是單線程爬蟲），在開始介紹之前，先來看看結(jié)果示意圖

Python 爬蟲學(xué)習(xí)筆記之單線程爬蟲

怎么樣，是不是已經(jīng)躍躍欲試了？首先讓我們打開麥子學(xué)院的網(wǎng)址，然后找到麥子學(xué)院的全部課程信息，像下面這樣

Python 爬蟲學(xué)習(xí)筆記之單線程爬蟲

這個(gè)時(shí)候進(jìn)行翻頁，觀看網(wǎng)址的變化，首先，第一頁的網(wǎng)址是 http://www.maiziedu.com/course/list/, 第二頁變成了 http://www.maiziedu.com/course/list/all-all/0-2/, 第三頁變成了 http://www.maiziedu.com/course/list/all-all/0-3/ ，可以看到，每次翻一頁，0后面的數(shù)字就會(huì)遞增1，然后就有人會(huì)想到了，拿第一頁呢？我們嘗試著將 http://www.maiziedu.com/course/list/all-all/0-1/ 放進(jìn)瀏覽器的地址欄，發(fā)現(xiàn)可以打開第一欄，那就好辦了，我們只需要使用 re.sub() 就可以很輕松的獲取到任何一頁的內(nèi)容。獲取到網(wǎng)址鏈接之后，下面要做的就是獲取網(wǎng)頁的源代碼，首先右擊查看審查或者是檢查元素，就可以看到以下界面

Python 爬蟲學(xué)習(xí)筆記之單線程爬蟲

找到課程所在的位置以后，就可以很輕松的利用正則表達(dá)式將我們需要的內(nèi)容提取出來，至于怎么提取，那就要靠你自己了，嘗試著自己去找規(guī)律才能有更大的收獲。如果你實(shí)在不知道怎么提取，那么繼續(xù)往下，看我的源代碼吧

實(shí)戰(zhàn)源代碼

									# coding=utf-8

									 import re

									 import requests

									 import sys

									 reload(sys)

									 sys.setdefaultencoding("utf8")

									 class spider():

									   def __init__(self):

									     print "開始爬取內(nèi)容。。。"

									    def changePage(self, url, total_page):

									     nowpage = int(re.search('/0-(\d+)/', url, re.S).group(1))

									     pagegroup = []

									     for i in range(nowpage, total_page + 1):

									       link = re.sub('/0-(\d+)/', '/0-%s/' % i, url, re.S)

									       pagegroup.append(link)

									     return pagegroup

									def getsource(self, url):

									  html = requests.get(url)

									  return html.text

									def getclasses(self, source):

									  classes = re.search('<ul class="zy_course_list">(.*?)</ul>', source, re.S).group(1)

									  return classes

									def geteach(self, classes):

									  eachclasses = re.findall('<li>(.*?)</li>', classes, re.S)

									  return eachclasses

									def getinfo(self, eachclass):

									  info = {}

									  info['title'] = re.search('<a py" id="highlighter_90957">
			
				?

									import requests

									html=requests.get("http://gupowang.baijia.baidu.com/article/283878")

									html.encoding='utf-8'

									print(html.text)




	第一行引入requests庫(kù)，第二行使用requests的get方法獲取網(wǎng)頁源代碼，第三行設(shè)置編碼格式，第四行文本輸出。

	把獲取到的網(wǎng)頁源代碼保存到文本文件中：

	
		
			
				?
			
				
					
						
							
								1
							
								2
							
								3
							
								4
							
								5
							
								6
							
								7
						
						
							
								
									import requests
								
									import os
								
									 
								
									html=requests.get("http://gupowang.baijia.baidu.com/article/283878")
								
									html_file=open("news.txt","w")
								
									html.encoding='utf-8'
								
									print(html.text,file=html_file)
							
						
					
				
			
		
	


			
					    
			
			
			
				
			
		
		
			
				 
				Python
				
				爬蟲
				
				單線程
				
			
			
				
			
		
		
			
				延伸 · 閱讀
			
			
				2022-03-11用Python實(shí)現(xiàn)一個(gè)模仿UP主彈幕控制的直播間功能
2022-03-11Python實(shí)戰(zhàn)之設(shè)計(jì)一個(gè)多功能辦公小工具
2022-03-11Python數(shù)據(jù)分析之缺失值檢測(cè)與處理詳解
2022-03-11Python變量的作用域詳解
2022-03-11Python之捕捉異常詳解
2022-03-11Python進(jìn)度條可視化之監(jiān)測(cè)程序運(yùn)行速度

			
		
		
		
		
			
				
			
		
		
			
				精彩推薦
			
		
		
			
				
					
				
				Python
				
					在Windows系統(tǒng)上搭建Nginx+Python+MySQL環(huán)境的教程
					
						這篇文章主要介紹了在Windows系統(tǒng)上搭建Nginx+Python+MySQL環(huán)境的教程,文中使用flup中間件及FastCGI方式連接,需要的朋友可以參考下
...
					
					
						沒有終點(diǎn)的列車13232020-08-05
					
				
				
Python
				
					python 列表轉(zhuǎn)為字典的兩個(gè)小方法(小結(jié))
					
						這篇文章主要介紹了python 列表轉(zhuǎn)為字典的兩個(gè)小方法(小結(jié))，文中通過示例代碼介紹的非常詳細(xì)，對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值，需要的...
					
					
						出泥的魚16532021-07-25
					
				
				
Python
				
					Python的dict字典結(jié)構(gòu)操作方法學(xué)習(xí)筆記
					
						這篇文章主要介紹了Python的dict字典結(jié)構(gòu)操作方法學(xué)習(xí)筆記本,字典的操作是Python入門學(xué)習(xí)中的基礎(chǔ)知識(shí),需要的朋友可以參考下...
					
					
						Lizo_Is_Me4402020-08-22
					
				
				
Python
				
					python直接訪問私有屬性的簡(jiǎn)單方法
					
						下面小編就為大家?guī)硪黄猵ython直接訪問私有屬性的簡(jiǎn)單方法。小編覺得挺不錯(cuò)的，現(xiàn)在就分享給大家，也給大家做個(gè)參考。一起跟隨小編過來看看吧
...
					
					
						Python教程網(wǎng)5152020-09-03
					
				
				
Python
				
					使用NumPy和pandas對(duì)CSV文件進(jìn)行寫操作的實(shí)例
					
						今天小編就為大家分享一篇使用NumPy和pandas對(duì)CSV文件進(jìn)行寫操作的實(shí)例，具有很好的參考價(jià)值，希望對(duì)大家有所幫助。一起跟隨小編過來看看吧...
					
					
						qq_2468356113602021-03-05
					
				
				
Python
				
					python 插入Null值數(shù)據(jù)到Postgresql的操作
					
						這篇文章主要介紹了python 插入Null值數(shù)據(jù)到Postgresql的操作，具有很好的參考價(jià)值，希望對(duì)大家有所幫助。一起跟隨小編過來看看吧...
					
					
						MichaelZhu6452021-09-16
					
				
				
Python
				
					Python實(shí)現(xiàn)ping指定IP的示例
					
						今天小編就為大家分享一篇Python實(shí)現(xiàn)ping指定IP的示例，具有很好的參考價(jià)值，希望對(duì)大家有所幫助。一起跟隨小編過來看看吧...
					
					
						EpisodeOne12902021-02-28
					
				
				
Python
				
					Python3以GitHub為例來實(shí)現(xiàn)模擬登錄和爬取的實(shí)例講解
					
						在本篇內(nèi)容里小編給大家分享的是關(guān)于Python3以GitHub為例來實(shí)現(xiàn)模擬登錄和爬取的實(shí)例講解，需要的朋友們可以參考下。
...
					
					
						愛喝馬黛茶的安東尼5262020-07-31
					
				
				

			
		
	
	
最近更新
用Python實(shí)現(xiàn)一個(gè)模仿UP主彈幕控制的直播間功
Python實(shí)戰(zhàn)之設(shè)計(jì)一個(gè)多功能辦公小工具
Python數(shù)據(jù)分析之缺失值檢測(cè)與處理詳解
Python變量的作用域詳解
Python之捕捉異常詳解
編輯推薦
十個(gè)好用的Python開發(fā)工具（IDE）
 2PyCharm設(shè)置SSH遠(yuǎn)程調(diào)試的方法
2021-03-18
 3Python安裝圖文教程 Pycharm安裝教程
2021-01-25
4python是什么意思？python有什么用？
2020-04-03
5使用Python抓取模板之家的CSS模板
2019-12-07
6Python 列表(List)操作方法詳解
2019-11-22
閱讀排行
1 2020最新pycharm漢化安裝（python工程獅親測(cè)有效
2 Pycharm 2020最新永久激活碼（附最新激活碼和插
3 分享PyCharm最新激活碼(真永久激活方法)不用每
 4 python高手之路python處理excel文件(方法匯總)
5 Python sklearn中的.fit與.predict的用法說明
6 Python爬蟲中Requests設(shè)置請(qǐng)求頭Headers的方法
7 Python中讀取圖片的6種方式
8 python保留小數(shù)位的三種實(shí)現(xiàn)方法
9 使用Python判斷質(zhì)數(shù)(素?cái)?shù))的簡(jiǎn)單方法講解
10 教你如何將Python程序打包成Linux可執(zhí)行文件
熱門標(biāo)簽
 2048 　  6006 　  contextlib 　  SLOTS 　  MELIAE 　  FEEDPARSER 　  暫存 　  持久性管理 　  pickle模塊 　  THREADING 　  reduce 　  nignx 　  裝飾器 　  函數(shù)式編程 　  兔子毒藥 　  監(jiān)控文件 　  流量監(jiān)控 　  Web框架 　  辦公工具 　  PIL庫(kù) 　  高斯模糊 　  wxPython 　  import 　  自定義模塊 　  Python開發(fā) 　  元類 　  metaclass 　  魔術(shù)方法 　  DNSPod 　  動(dòng)態(tài)解析域名 　 




© 2019-2023 腳本之家 | 服務(wù)器之家(www.zmynmublwnt.cn)旗下站點(diǎn) 版權(quán)所有關(guān)于我們聯(lián)系我們版權(quán)申明網(wǎng)站地圖


	







感谢您访问我们的网站，您可能还对以下资源感兴趣：
激情久久久|欧美视频区|成人av免费|不卡视频一二三区|欧美精品在欧美一区二区少妇|欧美一区二区三区的









主站蜘蛛池模板：
国产精品嘿咻嘿咻在线播放
|
国产免费最爽的乱淫视频a
毛片国产
|
色精品国产
|
久章草影院
|
涩涩屋av
|
久久成人黄色
|
国产91一区二区三区
|
天天干天天碰
|
精品一区二区在线视频
|
九九热播视频
|
在线看免费观看av
|
毛片在线免费观看网址
|
99热1|
久久久久九九九女人毛片
|
日日噜噜噜噜久久久精品毛片
|
久久精品视频一区二区三区
|
黄污视频在线看
|
久久成人福利
|
久久精品视频一区二区三区
|
久久久久中文字幕
|
午夜影视一区二区
|
全免费午夜一级毛片真人
|
国产剧情在线观看一区二区
|
成人在线精品视频
|
看免费一级毛片
|
成人高清在线
|
国产午夜精品一区二区三区免费
|
chinesexxx少妇露脸
|
蜜桃一本色道久久综合亚洲精品冫
|
日本娇小videos高潮
|
国外成人在线视频网站
|
日韩欧美视频一区二区三区
|
91重口视频
|
成人一级视频在线观看
|
一色屋任你操
|
亚洲男人的天堂在线视频
|
欧美日韩高清在线观看
|
国产成人精品免费视频大全办公室
|
欧美一级高清片在线
|
男人午夜小视频
|
国产毛片在线
|