天天看點

Hive之parse_url函數詳解

Hive的parse_url函數使用

parse_url(url, partToExtract[, key]) - extracts a part from a URL

解析URL字元串
partToExtract的選項包含[HOST,PATH,QUERY,REF,PROTOCOL,FILE,AUTHORITY,USERINFO]
           

舉例 :

select parse_url('http://hujiang.com/category/12258437290?query=test', 'PROTOCOL') from dual;
--http
   
select parse_url('http://hujiang.com/category/12258437290?query=test', 'HOST') from dual;
---hujiang.com​

select parse_url('http://hujiang.com/category/12258437290?query=test', 'REF') from dual;
---空​

select parse_url('http://hujiang.com/category/12258437290?query=test', 'PATH') from dual;
---/category/12258437290

select parse_url('http://hujiang.com/category/12258437290?query=test', 'QUERY') from dual;
---query=test

​select parse_url('http://hujiang.com/category/12258437290?query=test', 'FILE') from dual;
​---/category/12258437290?query=test

​select parse_url('http://hujiang.com/category/12258437290?query=test', 'AUTHORITY') from dual;​
---hujiang.com​

​select parse_url('http://hujiang.com/category/12258437290?query=test', 'USERINFO') from dual;​
---空