selenium安裝:
Selenium是一個用于web自動化測試的架構,在使用Ajax請求資料的頁面中,會出現 sign ,token等密鑰,如果考慮去破解可能花費的精力較多,是以考慮借助使用Selenium架構來實作資料爬取
如果沒安裝selenium的先安裝一下,再配置完 webdriver 的驅動程式才可以正常使用selenium。
1.安裝 Selenium 子產品,使用如下語句進行安裝
pip install selenium
2.這裡以 Chrome 浏覽器為例:檢視Chrome浏覽器的版本

點選關于 Google Chrome 既可以檢視版本資訊:
去 這個網址: https://npm.taobao.org/mirrors/chromedriver/,尋找對應大版本的 Chrome Driver
點進去之後,再下載下傳對應系統版本的 webdriver: (我這裡是Windows系統)
将下載下傳下來的壓縮檔案解壓,将其中的 chromedriver 放置到自己 Python安裝檔案的 Scripts 目錄下:
嘗試運作如下代碼,能打開浏覽器(不閃退)則表示配置成功:
或者打開百度試試
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.support.wait import WebDriverWait
import time
# 初始化浏覽器
browser = webdriver.Chrome()
try:
browser.get('https://baidu.com')
# 通過 id 找到input框
input = browser.find_element(By.CSS_SELECTOR, '#kw')
# 輸入python
input.send_keys('python')
input.send_keys(Keys.ENTER) # 按下Enter鍵
# 設定等待id為 content_left 的元素
wait = WebDriverWait(browser, 10) # 等待browser對象都為10秒
# presence_of_element_located 表示定位元素
wait.until(EC.presence_of_element_located((By.ID, 'content_left')))
time.sleep(3)
finally:
browser.close()
到這裡selenium就配置完成了。