Hive 中parse_url的使用


1、Hive的parse_url函数
parse_url(url, partToExtract[, key]) - extracts a part from a URL
解析URL字符串,partToExtract的选项包含[HOST,PATH,QUERY,REF,PROTOCOL,FILE,AUTHORITY,USERINFO]。
【host,path,query,ref,protocol,file,authority,userinfo】

举例 :

1
2
3
4
5
6
7
8
9
select parse_url('http://facebook.com/path/p1.php?query=1', 'PROTOCOL')    -- http
select parse_url('http://facebook.com/path/p1.php?query=1', 'HOST') -- -facebook.com
select parse_url('http://facebook.com/path/p1.php?query=1', 'REF') ---空
select parse_url('http://facebook.com/path/p1.php?query=1', 'PATH') ---/path/p1.php
select parse_url('http://facebook.com/path/p1.php?query=1', 'QUERY') ---空
select parse_url('http://facebook.com/path/p1.php?query=1', 'FILE') ---/path/p1.php?query=1
select parse_url('http://facebook.com/path/p1.php?query=1', 'AUTHORITY') ---facebook.com
select parse_url('http://facebook.com/path/p1.php?query=1', 'USERINFO') ---空
select parse_url('http://facebook.com/path/p1.php?query=1', 'QUERY','query') -- 1

文章作者: Callable
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 Callable !
评论
  目录