1.過濾原則:
(1)去除所有u中不包含happyjuzi.com的日志
(2)去除所有u中包含&uid=的日志
(3)去除所有日志中不包含ipt、et的日志
2.su來源判定原則:
(1).su==null
1)包含d_source=mobile 分享
2)包含from 三方
3)其他的都是直接來源
(2).su!=null
1)su包含baidu.com、google.com、weibo.com、weibo.cn為搜尋
2)u包含d_source=mobile 分享
3)u包含from 三方
4)su包含happyjuzi.com 直接
5)others
3.定義原則:
(1)sessionid為ipt加上10萬以内的随機數
(2)count字段為當et=0的時候,count才會加一
4.需要注意的問題:
(1)跨小時通路sessionid出現錯誤(檔案路徑讀取不按順序)
(2)ep出現小數情況,已處理(隻取整數)
(3)ipt機關不一直(出現13位,機關毫秒),已處理(全部10位,機關秒)
(4)搜尋關鍵詞無法擷取
如果,您認為閱讀這篇部落格讓您有些收獲,不妨拿出手機【微信掃一掃】

您的資助是我最大的動力!
金額随意,歡迎來賞!