天天看點

擷取minist資料并轉換成lmdb

caffe本身是沒有資料集的,但在data目錄下有擷取資料的一些腳本。MNIST,一個經典的手寫數字庫,包含60000個訓練樣本和10000個測試樣本,每個樣本為28*28大小的黑白圖檔,手寫數字為0-9,是以分為10類。

1.擷取資料

這個是在caffe的目錄下執行的。運作成功後,在caffe/data/mnist/目錄下有四個檔案:

train-images-idx3-ubyte:訓練集樣本 (9912422 bytes) 

train-labels-idx1-ubyte: 訓練集對應标注 (28881 bytes) 

 t10k-images-idx3-ubyte: 測試集圖檔 (1648877 bytes)

 t10k-labels-idx1-ubyte: 測試集對應标注 (4542 bytes)

這些資料不能在caffe中直接使用,需要轉換成LMDB資料

2.轉換成lmdb資料

這個也是在caffe的目錄下執行的。但運作過程中出現了以下錯誤:

擷取minist資料并轉換成lmdb

這是因為這個腳本本身要調用convert_mnist_data的二進制檔案,需要将convert_mnist_data編譯。我使用的caffe并沒有編譯。

caffe編譯之後生成build檔案夾,convert_mnist_data.bin就在build檔案夾裡。

使用編譯過後的caffe就能正常轉換了:

擷取minist資料并轉換成lmdb