天天看点

【CTR预估】avazu数据集预处理shell命令

1、下载avazu数据集,可以选择Download ALL下载3个文件的压缩包,也可以只下载train.gz。然后将压缩文件上传到服务器上,在服务器上进行解压(因为本地解压后文件体积较大,上传很慢)。

2、如果是选择Download ALL下载3个文件,会得到一个avazu-ctr-prediction.zip,使用如下命令进行解压:

unzip avazu-ctr-prediction.zip
           

命令执行结果:

【CTR预估】avazu数据集预处理shell命令

3、得到train.gz后,使用如下命令进行解压:

gunzip train.gz
           

得到的train就可以直接读取用于训练了:

【CTR预估】avazu数据集预处理shell命令

 注,这里的gunzip命令不会保留源压缩文件。如果需要保留,则可以加上 -k 参数。详见Linux gunzip 命令 | 菜鸟教程。

继续阅读