天天看點

urlparse子產品

urlparse -- 解析(絕對和相對)URL

函數:

    parse_qs(qs, keep_blank_values=0, strict_parsing=0)

        解析一個查詢字元串

        qs: 要被解析的由%編碼的查詢字元串

        keep_blank_values: 辨別查詢字元串中空值是否應該看出空字元串,預設為False,直接忽略

        strict_parsing:辨別解析錯誤時做什麼。預設為False忽略錯誤,True則抛出ValueError異常

        傳回字典對象

    parse_qsl(qs, keep_blank_values=0, strict_parsing=0)

        傳回清單,每個項為元組('key名', 'value值')

    urljoin(base, url, allow_fragments=True)

        連接配接base和url傳回絕對URL

    urlparse(url, shceme='', allow_fragments=True)

        将URL解析為6個部分:

            <scheme>://<netloc>/<path>;<params>?<query>#<fragment>

            傳回6個元素的元組: (scheme, netloc, path, prams, query, fragment)

    urlunparse(data)    urlparse的反向操作

    urlsplit(url, scheme='', allow_fragments=True)

        将URL解析為5個部分:

            <scheme>://<netloc>/<path>?<query>#<fragment>

            傳回5個元素的元組: (scheme, netloc, path, query, fragment)

    urlunsplit(data) urlsplit的反向操作

    urldefrag(url)    移除存在的fragment(即#fragment),傳回元組(URL, Fragment)

執行個體:

    #!/usr/bin/env python

    # -*- coding:UTF-8 -*-

    import urlparse

    url = 'http://www.example.com/index.php?arg1=val1&arg2=val2#frag1'

繼續閱讀