天天看點

python_網絡爬蟲_urllib

1.域名與IP位址

“ 域名----->DNS伺服器------>IP位址”

你的電腦先把域名傳給DNS伺服器,通過DNS伺服器找到域名所對應的IP位址,在傳回你的電腦進行通路。

2.調用urllib進行爬取

#讀取資料
import urllib
f = urllib.urlopen("http://www.baidu.com")
print(f.read())
#讀取狀态
print(f.getcode())
#讀取網址
print(f.geturl())
#關閉對象
f.close()
           

3.使用urllib下載下傳圖檔

#這裡找了百度上的一張照片并且下載下傳到桌面上
import urllib
urllib.urlretrieve("http://pic51.nipic.com/file/20141025/8649940_220505558734_2.jpg",
filename="/home/desktop/風景.jpg")