Python天天美味(28) - urlopen

2017-01-10 23:50:00

一、打開一個網頁擷取所有的内容

from urllib import urlopen

doc = urlopen("http://www.baidu.com").read()

print doc

二、擷取Http頭

from urllib import urlopen

doc = urlopen("http://www.baidu.com")

print doc.info()

print doc.info().getheader('Content-Type')

三、使用代理

1. 檢視環境變量

print ""n".join(["%s=%s" % (k, v) for k, v in os.environ.items()])

print os.getenv("http_proxy")

2. 設定環境變量

import os

os.putenv("http_proxy", "http://proxyaddr:<port>")

3. 使用代理

# Use http://www.someproxy.com:3128 for http proxying

proxies = {'http': 'http://www.someproxy.com:3128'}

filehandle = urllib.urlopen(some_url, proxies=proxies)

# Don't use any proxies

filehandle = urllib.urlopen(some_url, proxies={})

# Use proxies from environment - both versions are equivalent

filehandle = urllib.urlopen(some_url, proxies=None)

filehandle = urllib.urlopen(some_url)

本文轉自CoderZh部落格園部落格，原文連結：http://www.cnblogs.com/coderzh/archive/2008/06/07/1215657.html，如需轉載請自行聯系原作者

繼續閱讀