天天看點

Hive基礎(四十):Hive 實戰(一)準備

統計矽谷影音視訊網站的正常名額,各種 TopN 名額:

-- 統計視訊觀看數 Top10

-- 統計視訊類别熱度 Top10

-- 統計出視訊觀看數最高的 20 個視訊的所屬類别以及類别包含 Top20 視訊的個數

-- 統計視訊觀看數 Top50 所關聯視訊的所屬類别排序

-- 統計每個類别中的視訊熱度 Top10,以 Music 為例

-- 統計每個類别視訊觀看數 Top10

-- 統計上傳視訊最多的使用者 Top10 以及他們上傳的視訊觀看次數在前 20 的視訊

1)視訊表

Hive基礎(四十):Hive 實戰(一)準備

2)使用者表

Hive基礎(四十):Hive 實戰(一)準備

3.1 準備表

1)需要準備的表

建立原始資料表:gulivideo_ori,gulivideo_user_ori,

建立最終表:gulivideo_orc,gulivideo_user_orc

2)建立原始資料表:

(1)gulivideo_ori

(2)建立原始資料表: gulivideo_user_ori

2)建立 orc 存儲格式帶 snappy 壓縮的表:

(1)gulivideo_orc

(2)gulivideo_user_orc

(3)向 ori 表插入資料

(4)向 orc 表插入資料

3.2 安裝 Tez 引擎(了解)

繼續閱讀