天天看點

爬蟲之selenium的安裝篇

linux系統安裝(預設安裝成功python3)

1.安裝selenium

pip install selenium
           

2.浏覽器驅動安裝

谷歌驅動位址:http://chromedriver.storage.googleapis.com/index.html(需要和谷歌浏覽器版本對應)
火狐驅動位址:https://github.com/mozilla/geckodriver/releases/


wget https://github.com/mozilla/geckodriver/releases/download/v0.23.0/geckodriver-v0.23.0-linux64.tar.gz
tar -xvzf geckodriver-v0.23.0-linux64.tar.gz
chmod +x geckodriver
sudo mv geckodriver /usr/local/bin/
           
1.進入github選擇相對應的浏覽器驅動安裝進行下載下傳
2.解壓,給與執行權限
3.添加到linux系統環境中
           

window系統安裝(預設安裝成功python3)

1.安裝selenium

pip install selenium (可能通過***安裝成功率比較高)
           

2.浏覽器驅動安裝

谷歌驅動位址:http://chromedriver.storage.googleapis.com/index.html(需要和谷歌浏覽器版本對應)
火狐驅動位址:https://github.com/mozilla/geckodriver/releases/

下載下傳對應的浏覽器驅動,将解壓得到的exe檔案放到python的安裝目錄下即可;
           

安裝測試代碼

from selenium import webdriver
import time

brower = webdriver.Firefox()
brower.get("http://www.baidu.com")

brower.find_element_by_id(\'kw\').send_keys(\'selenium\')
brower.find_element_by_id(\'su\').click()

time.sleep(3)
print(brower.current_url)

brower.quit()
           

常見錯誤

selenium.common.exceptions.WebDriverException: Message: \'geckodriver\' executable needs to be in PATH.
           

表示

geckodriver

沒有安裝成功。

也可以指定目錄,例如指定在目前路徑下。

brower = webdriver.Firefox(executable_path=\'./geckodriver\')
這是linux系統安裝常見的問題,主要就是系統找不到浏覽器驅動程式,環境配置問題
           

無頭參數

rom selenium import webdriver
from selenium.webdriver.firefox.options import Options
import time
options = Options()
options.add_argument(\'-headless\') # 無頭參數
brower = webdriver.Firefox(firefox_options=options)
brower.get("http://www.baidu.com")

brower.find_element_by_id(\'kw\').send_keys(\'selenium\')
brower.find_element_by_id(\'su\').click()

time.sleep(3)
print(brower.current_url)
brower.quit()
           

總結

  1. 安裝selenium時經常碰到安裝中斷,在嘗試使用***後,安裝成功率提升
  2. 安裝浏覽器驅動程式時,linux系統安照步驟幾乎沒有出錯,一次成功。而在window系統中還需把浏覽器驅動程式(exe檔案)放在python的安裝目錄下