通過Selenium擷取頁面元素的某一個屬性-轉載

2023-08-06 00:32:14

本文來介紹如何通過Selenium擷取頁面元素的某一個屬性。一個元素可能有多個屬性，例如 class, id, name, text, href, vale等等。這裡我們舉例一個爬蟲中經常需要處理的連結問題：找出目前頁面所有的超連結。

已百度首頁為例，列印所有包含href的元素的連結。

相關腳本代碼如下：

# coding=utf-8
import time
from selenium import webdriver
 
 
driver = webdriver.Chrome()
driver.maximize_window()
driver.implicitly_wait(6)
driver.get("https://www.baidu.com")
time.sleep(1)
 
for link in driver.find_elements_by_xpath("//*[@href]"):
    print (link.get_attribute('href'))
driver.quit()

這裡隻是找元素的href屬性，如果你需要其它屬性，例如你需要檢視頁面所有元素具有id值的話，你可以這樣寫

print (link.get_attribute('id'))

通過Selenium擷取頁面元素的某一個屬性-轉載

繼續閱讀

2023爬蟲學習筆記 -- 多線程操作

M團店鋪評價采集不到問題問題展示：解決方案：

Python爬蟲學習（1）

Python爬蟲學習進階

Python爬蟲（入門+進階）學習筆記 1-2 初識Python爬蟲

Python進階爬蟲——Class1：認識爬蟲

python爬蟲學習筆記-1

python學習之urllib使用小結

NOIp模拟題之肮髒的牧師（桶排序）

一篇文章教你如何在一個月内學會爬取大規模資料

爬取央視網節目單欄目資訊！

Pyhton爬蟲實戰 - 抓取BOSS直聘職位描述和資料清洗Pyhton爬蟲實戰 - 抓取BOSS直聘職位描述和資料清洗

selenium 自動搶課——電子科大自動搶課腳本前言：使用方法：`代碼：

selenium操作cookie

利用Selenium內建TestLink做自動化測試

sort()函數到底是怎樣進行數字排序的