天天看點

通過Selenium擷取頁面元素的某一個屬性-轉載

本文來介紹如何通過Selenium擷取頁面元素的某一個屬性。一個元素可能有多個屬性,例如 class, id, name, text, href, vale等等。這裡我們舉例一個爬蟲中經常需要處理的連結問題:找出目前頁面所有的超連結。

已百度首頁為例,列印所有包含href的元素的連結。

相關腳本代碼如下:

# coding=utf-8
import time
from selenium import webdriver
 
 
driver = webdriver.Chrome()
driver.maximize_window()
driver.implicitly_wait(6)
driver.get("https://www.baidu.com")
time.sleep(1)
 
for link in driver.find_elements_by_xpath("//*[@href]"):
    print (link.get_attribute('href'))
driver.quit()
           

這裡隻是找元素的href屬性,如果你需要其它屬性,例如你需要檢視頁面所有元素具有id值的話,你可以這樣寫

print (link.get_attribute('id'))