本節書摘來自華章計算機《splunk智能運維實戰》一書中的第2章,第2.5節,作者 [美]喬史·戴昆(josh diakun),保羅r.約翰遜(paul r. johnson),德萊克·默克(derek mock),譯 宮鑫,康甯,劉法宗 ,更多章節内容可以通路雲栖社群“華章計算機”公衆号檢視。
web通路日志還能提供有關網站和通路網站使用者的更多資訊。了解使用者來自哪裡可以深入了解潛在客戶,也許還能告訴我們哪些營銷活動更有效果。擷取這一資訊需要搜尋日志資料中referer_domain字段的值。
本節将通過編寫一個搜尋語句找到浏覽量來源最多的網站。
做好準備
本節操作需運作splunk enterprise伺服器,導入和第1章相同的樣本資料。我們已經很熟悉splunk搜尋欄和時間選擇器了。
如何操作
按照下列步驟搜尋浏覽量來源最多的網站:
登入splunk伺服器。
選擇“搜尋和報表”應用程式。
設定時間選擇器為“過去24小時”,在splunk搜尋欄輸入下列搜尋後單擊搜尋圖示或按enter鍵。
![](https://img.laitimes.com/img/9ZDMuAjOiMmIsIjOiQnIsIyZuBnLlNmY2IDOihTYlFzNjZ2NwQ2NmhDM3YjYjFzN5UWOxI2MkJGO3UjN18CXt92Yu4GZjlGbh5SZslmZxl3Lc9CX6MHc0RHaiojIsJye.png)
splunk傳回表格式清單,按照每個網站提供的推薦通路流量進行排序。
單擊“儲存為”,選擇“報表”,儲存此次搜尋結果,将報表命名為cp02_top_referring_websites并單擊“儲存”。在下一個頁面,單擊“繼續編輯”,回到搜尋。
工作原理
将搜尋以段的形式分開。
更多内容
本節沒有使用top指令,因為這個指令隻能提供有限的功能。stats指令遠比top指令強大,并且具備很多函數,包括distinct count函數。
使用stats指令代替top指令來搜尋浏覽量來源排名前十的網站
本節使用stats指令找到了web通路日志中的所有網站,并按它們的獨立推薦通路量将它們排序。如果僅僅顯示排名前十位的網站,隻需要在搜尋語句最後添加head指令,如下所示:
head指令保留了最前面的指定行數。本例中,因為我們進行了降序,是以保留前十行結果也就保留了排名前十的網站。
另參見