天天看點

Python天天美味(28) - urlopen

一、打開一個網頁擷取所有的内容

 from urllib import urlopen

doc = urlopen("http://www.baidu.com").read()

print doc

二、擷取Http頭

from urllib import urlopen

doc = urlopen("http://www.baidu.com")

print doc.info()

print doc.info().getheader('Content-Type')

 三、使用代理

    1. 檢視環境變量

print ""n".join(["%s=%s" % (k, v)  for k, v in os.environ.items()])

print os.getenv("http_proxy")

    2. 設定環境變量

import   os 

os.putenv("http_proxy",   "http://proxyaddr:<port>")

     3. 使用代理

Python天天美味(28) - urlopen

# Use http://www.someproxy.com:3128 for http proxying

proxies = {'http': 'http://www.someproxy.com:3128'}

filehandle = urllib.urlopen(some_url, proxies=proxies)

# Don't use any proxies

filehandle = urllib.urlopen(some_url, proxies={})

# Use proxies from environment - both versions are equivalent

filehandle = urllib.urlopen(some_url, proxies=None)

filehandle = urllib.urlopen(some_url)

Python天天美味(28) - urlopen

..

本文轉自CoderZh部落格園部落格,原文連結:http://www.cnblogs.com/coderzh/archive/2008/06/07/1215657.html,如需轉載請自行聯系原作者