天天看點

hive lateral view和explode的了解

今天使用hive的時候需要把一個字段中的josn資料分開,于是需要用到explode()函數。網上有許多文章,但是寫的複雜,在此就概括下。

表生成函數:explode:把map集合或數組array中每個鍵值對或數組中的每個元素都單獨生成一行的形式。

explode()就是内置表生成函數(UDTF),UDTF将為每個輸入行生成零個或多個輸出行。

fromClause: FROM baseTable (lateralView)*
lateralView: LATERAL VIEW udtf(expression) tableAlias AS columnAlias (',' columnAlias)*
           

具體的代碼:

select goods_id2,sale_info 
from explode_lateral_view LATERAL VIEW explode(split(goods_id,','))goods as goods_id2;
           

這裡的explode_lateral_view就是basetable,lateral view可以使用basetable中的任意列,LATERAL VIEW explode(split(goods_id,’,’))goods這個就是虛拟表,相當于在這個表中做select,然後goods_id2就是explode()後的列的列名

hive lateral view和explode的了解

這個就是原始圖。

hive lateral view和explode的了解

這個就是select後的圖。

參考的博文:

https://blog.csdn.net/guodong2k/article/details/79459282

https://blog.csdn.net/SunnyYoona/article/details/62894761

繼續閱讀