天天看點

urlparse子產品(python子產品)

一、urlparse子產品簡介

    urlparse子產品主要是把url拆分為6部分,并傳回元組。并且可以把拆分後的部分再組成一個url。主要有函數有urljoin、urlsplit、urlunsplit、urlparse等。

二、urljoin函數使用

    urljoin主要是拼接url,它以base作為其基位址,然後與url中的相對位址相結合組成一個絕對url位址。函數urljoin在通過為url基位址附加新的檔案名的方式來處理同一位置處的若幹檔案的時候格外有用。需要注意的是,如果基位址并非以字元/結尾的話,那麼url基位址最右邊部分就會被這個相對路徑所替換。如果希望在該路徑中保留末端目錄,應確定url基位址以字元/結尾。

輸入代碼:

代碼運作結果:

c:\python27\python.exe c:/users/lee/desktop/d/pycharmprojects/untitled/test.py

http://www.sina.cn/file/down.php

http://www.sina.cn/cc/file/down.php

三、urlparse函數和urlsplit函數使用

    主要是分析urlstring,傳回一個包含5個字元串項目的元組:協定、位置、路徑、查詢、片段。allow_fragments為false時,該元組的組後一個項目總是空,不管urlstring有沒有片段,省略項目的也是空。urlsplit()和urlparse()差不多

splitresult(scheme='http', netloc='www.baidu.com', path='/good/index.php', query='id=18', fragment='')

http

www.baidu.com

/good/index.php

id=18