《Splunk智能運維實戰》——2.5　找出浏覽量來源最多的網站

2021-11-08 13:18:49

本節書摘來自華章計算機《splunk智能運維實戰》一書中的第2章，第2.5節，作者 [美]喬史·戴昆（josh diakun），保羅r.約翰遜（paul r. johnson），德萊克·默克（derek mock），譯宮鑫，康甯，劉法宗，更多章節内容可以通路雲栖社群“華章計算機”公衆号檢視。

web通路日志還能提供有關網站和通路網站使用者的更多資訊。了解使用者來自哪裡可以深入了解潛在客戶，也許還能告訴我們哪些營銷活動更有效果。擷取這一資訊需要搜尋日志資料中referer_domain字段的值。

本節将通過編寫一個搜尋語句找到浏覽量來源最多的網站。

做好準備

本節操作需運作splunk enterprise伺服器，導入和第1章相同的樣本資料。我們已經很熟悉splunk搜尋欄和時間選擇器了。

如何操作

按照下列步驟搜尋浏覽量來源最多的網站：

登入splunk伺服器。

選擇“搜尋和報表”應用程式。

設定時間選擇器為“過去24小時”，在splunk搜尋欄輸入下列搜尋後單擊搜尋圖示或按enter鍵。

splunk傳回表格式清單，按照每個網站提供的推薦通路流量進行排序。

單擊“儲存為”，選擇“報表”，儲存此次搜尋結果，将報表命名為cp02_top_referring_websites并單擊“儲存”。在下一個頁面，單擊“繼續編輯”，回到搜尋。

工作原理

将搜尋以段的形式分開。

更多内容

本節沒有使用top指令，因為這個指令隻能提供有限的功能。stats指令遠比top指令強大，并且具備很多函數，包括distinct count函數。

使用stats指令代替top指令來搜尋浏覽量來源排名前十的網站

本節使用stats指令找到了web通路日志中的所有網站，并按它們的獨立推薦通路量将它們排序。如果僅僅顯示排名前十位的網站，隻需要在搜尋語句最後添加head指令，如下所示：

head指令保留了最前面的指定行數。本例中，因為我們進行了降序，是以保留前十行結果也就保留了排名前十的網站。

另參見

繼續閱讀