取數所需的表
- 使用者視訊互動表 tb_user_video_log
注:uid-使用者ID, video_id-視訊ID, start_time-開始觀看時間, end_time-結束觀看時間, if_follow-是否關注, if_like-是否點贊, if_retweet-是否轉發, comment_id-評論ID
- 短視訊資訊表 tb_video_info
注:video_id-視訊ID, author-創作者ID, tag-類别标簽, duration-視訊時長(秒), release_time-釋出時間
1、計算2021年裡有播放記錄的每個視訊的完播率(結果保留3位小數),并按完播率降序排序
注:視訊完播率=完成播放次數/總播放次數,結束觀看時間與開始觀看時間的差大于等于視訊時長,視為完成播放
代碼:
輸出:
2、計算各類視訊的平均播放進度,将進度大于60%的類别輸出
注:播放進度=播放時長/視訊時長*100%,當播放時長大于視訊時長時,播放進度均記為100%,結果保留兩位小數,并按播放進度倒序排序
代碼:
輸出:
3、統計在有使用者互動的最近一個月(按包含當天在内的近30天算,比如10月31日的近30天為10.2~10.31之間的資料)中,每類視訊的轉發量和轉發率(保留3位小數)
注:轉發率=轉發量/播放量。結果按轉發率降序排序
代碼:
輸出:
4、統計2021年裡每個創作者每月的漲粉率及截止當月的總粉絲量
備注:漲粉率=(加粉量 - 掉粉量) / 播放量,結果按創作者ID、總粉絲量升序排序。
注:if_follow-是否關注為1表示使用者觀看視訊中關注了視訊創作者,為0表示此次互動前後關注狀态未發生變化,為2表示本次觀看過程中取消了關注
代碼:
輸出:
5、統計2021年國慶頭3天每類視訊每天的近一周總點贊量和一周内最大單天轉發量,結果按視訊類别降序、日期升序排序。假設資料庫中資料足夠多,至少每個類别下國慶頭3天及之前一周的每天都有播放記錄
代碼:
輸出:
以上,希望對你有所幫助。
你好,我是Bottle!做過社交産品、寫過品牌策劃、也鬧騰過使用者增長,現在是一位上市公司的資料分析師,主要負責資料産品規劃以及經營分析相關。
在這裡寫的文章類型不固定,主要是資料分析方法論、讀書筆記及生活感悟等,希望能與你一起從零搭建資料分析師知識體系,見證彼此成長!
有問題留言,歡迎交流!
全平台同名:數分Bottle