天天看點

第六講 使用第三方庫及簡單網頁

httplib2

爬蟲:從某個網站上下載下傳一個網頁,并在自己的主機上自動打開浏覽器浏覽。

copy網上的代碼,運作提示,***函數沒有定義,可能是因為沒有下載下傳其使用的第三方函數庫并安裝

linux下安裝第三方函數庫

easy_install httplib2

eg:

>>> import urllib---------urllib可以通路公網的網頁

>>> import webbrowser as web---------------webbrowser是第三方的

>>> url="http://www.163.com"---------------要登入的url

>>> content=urllib.urlopen(url).read()-----擷取首頁

>>> open("robin.html").write(content)-如果檔案存在則打開,不存在則建立,然後寫入變量内容,存到本地,名字為robin.html

>>> web.open_new_tab('robin.html')------通過浏覽器打開,浏覽

使用第三方函數庫的方法

module_name.method(參數)

eg:urllib.urlopen().read()

    webbrowser.open_new_tab()

      本文轉自Tenderrain 51CTO部落格,原文連結:,http://blog.51cto.com/tenderrain/1620665如需轉載請自行聯系原作者

繼續閱讀