精品国产欧美一区二区,国产成人精品免高潮在线观看,欧美日韩精品一区二区在线观看

在使用selenium模塊進行數據爬取時，通常會遇到爬取iframe中的內容。會因為定位的作用域問題爬取不到數據。

我們以菜鳥教程的運行實例為案例。
按照正常的定位

Python爬蟲實現selenium處理iframe作用域問題

會以文本塊生成xpath為/html/body/text()。這樣的話根據xpath進行如下代碼編寫。

#!/user/bin/
# -*- coding:UTF-8 -*-
# Author:Master
from selenium import webdriver
import time
driver = webdriver.Chrome(executable_path="./chromedriver")
driver.get('https://www.runoob.com/try/runcode.php?filename=HelloWorld&type=python3')
time.sleep(2)
text = driver.find_element_by_xpath('/html/body').text
print(text)
time.sleep(5)
driver.quit()

執行結果：

Python爬蟲實現selenium處理iframe作用域問題

很明顯這并不是想要的結果。

當我們打開抓包工具定位到Hello, World!文本的時候會發現，該文本是在一個iframe中。這樣的話我們xpath所定位到的內容則是大的html中的路徑。我們需要的內容則是在iframe中的小的html中。

通過分析發現，想要解決問題的實質就是改變作用域。通過switch_to.frame(‘id')方法來改變作用域就可以了。

重新編寫代碼：

#!/user/bin/
# -*- coding:UTF-8 -*-
# Author:Master
from selenium import webdriver
import time
driver = webdriver.Chrome(executable_path="./chromedriver")
driver.get('https://www.runoob.com/try/runcode.php?filename=HelloWorld&type=python3')
time.sleep(2)
driver.switch_to.frame('iframeResult')
text = driver.find_element_by_xpath('/html/body').text
print(text)
time.sleep(5)
driver.quit()