剛開始學python,記錄下問題。
代碼如下:
1
2
3
4
5
6
7
8
9
10
|
#coding:utf-8 import re,urllib2 def getHTML(url): html = urllib2.urlopen(url) html = html.read() return html if __name__ = = '__main__' : url = 'https://www.baidu.com' #處理換行符以及空格 print getHTML(url).replace( '\n' ,' ').replace(' \t ',' ').replace(' ',' ') |
總結
以上所述是小編給大家介紹的python爬蟲正則表達式之處理換行符,希望對大家有所幫助,如果大家有任何疑問請給我留言,小編會及時回復大家的。在此也非常感謝大家對服務器之家網站的支持!
原文鏈接:https://blog.csdn.net/u013216667/article/details/80620568