天天看點

《Splunk智能運維實戰》——2.5 找出浏覽量來源最多的網站

本節書摘來自華章計算機《splunk智能運維實戰》一書中的第2章,第2.5節,作者 [美]喬史·戴昆(josh diakun),保羅r.約翰遜(paul r. johnson),德萊克·默克(derek mock),譯 宮鑫,康甯,劉法宗 ,更多章節内容可以通路雲栖社群“華章計算機”公衆号檢視。

web通路日志還能提供有關網站和通路網站使用者的更多資訊。了解使用者來自哪裡可以深入了解潛在客戶,也許還能告訴我們哪些營銷活動更有效果。擷取這一資訊需要搜尋日志資料中referer_domain字段的值。

本節将通過編寫一個搜尋語句找到浏覽量來源最多的網站。

做好準備

本節操作需運作splunk enterprise伺服器,導入和第1章相同的樣本資料。我們已經很熟悉splunk搜尋欄和時間選擇器了。

如何操作

按照下列步驟搜尋浏覽量來源最多的網站:

登入splunk伺服器。

選擇“搜尋和報表”應用程式。

設定時間選擇器為“過去24小時”,在splunk搜尋欄輸入下列搜尋後單擊搜尋圖示或按enter鍵。

《Splunk智能運維實戰》——2.5 找出浏覽量來源最多的網站

splunk傳回表格式清單,按照每個網站提供的推薦通路流量進行排序。

《Splunk智能運維實戰》——2.5 找出浏覽量來源最多的網站

單擊“儲存為”,選擇“報表”,儲存此次搜尋結果,将報表命名為cp02_top_referring_websites并單擊“儲存”。在下一個頁面,單擊“繼續編輯”,回到搜尋。

工作原理

将搜尋以段的形式分開。

《Splunk智能運維實戰》——2.5 找出浏覽量來源最多的網站

更多内容

本節沒有使用top指令,因為這個指令隻能提供有限的功能。stats指令遠比top指令強大,并且具備很多函數,包括distinct count函數。

使用stats指令代替top指令來搜尋浏覽量來源排名前十的網站

本節使用stats指令找到了web通路日志中的所有網站,并按它們的獨立推薦通路量将它們排序。如果僅僅顯示排名前十位的網站,隻需要在搜尋語句最後添加head指令,如下所示:

《Splunk智能運維實戰》——2.5 找出浏覽量來源最多的網站

head指令保留了最前面的指定行數。本例中,因為我們進行了降序,是以保留前十行結果也就保留了排名前十的網站。

另參見

《Splunk智能運維實戰》——2.5 找出浏覽量來源最多的網站