天天看點

【CTR預估】avazu資料集預處理shell指令

1、下載下傳avazu資料集,可以選擇Download ALL下載下傳3個檔案的壓縮包,也可以隻下載下傳train.gz。然後将壓縮檔案上傳到伺服器上,在伺服器上進行解壓(因為本地解壓後檔案體積較大,上傳很慢)。

2、如果是選擇Download ALL下載下傳3個檔案,會得到一個avazu-ctr-prediction.zip,使用如下指令進行解壓:

unzip avazu-ctr-prediction.zip
           

指令執行結果:

【CTR預估】avazu資料集預處理shell指令

3、得到train.gz後,使用如下指令進行解壓:

gunzip train.gz
           

得到的train就可以直接讀取用于訓練了:

【CTR預估】avazu資料集預處理shell指令

 注,這裡的gunzip指令不會保留源壓縮檔案。如果需要保留,則可以加上 -k 參數。詳見Linux gunzip 指令 | 菜鳥教程。

繼續閱讀