天天看点

python_网络爬虫_urllib

1.域名与IP地址

“ 域名----->DNS服务器------>IP地址”

你的电脑先把域名传给DNS服务器,通过DNS服务器找到域名所对应的IP地址,在传回你的电脑进行访问。

2.调用urllib进行爬取

#读取数据
import urllib
f = urllib.urlopen("http://www.baidu.com")
print(f.read())
#读取状态
print(f.getcode())
#读取网址
print(f.geturl())
#关闭对象
f.close()
           

3.使用urllib下载图片

#这里找了百度上的一张照片并且下载到桌面上
import urllib
urllib.urlretrieve("http://pic51.nipic.com/file/20141025/8649940_220505558734_2.jpg",
filename="/home/desktop/风景.jpg")