1、下載下傳avazu資料集,可以選擇Download ALL下載下傳3個檔案的壓縮包,也可以隻下載下傳train.gz。然後将壓縮檔案上傳到伺服器上,在伺服器上進行解壓(因為本地解壓後檔案體積較大,上傳很慢)。
2、如果是選擇Download ALL下載下傳3個檔案,會得到一個avazu-ctr-prediction.zip,使用如下指令進行解壓:
unzip avazu-ctr-prediction.zip
指令執行結果:
![](https://img.laitimes.com/img/9ZDMuAjOiMmIsIjOiQnIsIyZuBnLlVGNwMjNwkjZiVDMzADMhRmZjRDZwMTOkRWZkRWMhdzLc52YucWbp5GZzNmLn9Gbi1yZtl2Lc9CX6MHc0RHaiojIsJye.png)
3、得到train.gz後,使用如下指令進行解壓:
gunzip train.gz
得到的train就可以直接讀取用于訓練了:
注,這裡的gunzip指令不會保留源壓縮檔案。如果需要保留,則可以加上 -k 參數。詳見Linux gunzip 指令 | 菜鳥教程。