擷取minist資料并轉換成lmdb

2021-10-13 10:15:44

caffe本身是沒有資料集的，但在data目錄下有擷取資料的一些腳本。MNIST，一個經典的手寫數字庫，包含60000個訓練樣本和10000個測試樣本，每個樣本為28*28大小的黑白圖檔，手寫數字為0-9，是以分為10類。

1.擷取資料

這個是在caffe的目錄下執行的。運作成功後，在caffe/data/mnist/目錄下有四個檔案：

train-images-idx3-ubyte:訓練集樣本 (9912422 bytes)

train-labels-idx1-ubyte: 訓練集對應标注 (28881 bytes)

t10k-images-idx3-ubyte: 測試集圖檔 (1648877 bytes)

t10k-labels-idx1-ubyte: 測試集對應标注 (4542 bytes)

這些資料不能在caffe中直接使用，需要轉換成LMDB資料

2.轉換成lmdb資料

這個也是在caffe的目錄下執行的。但運作過程中出現了以下錯誤：

這是因為這個腳本本身要調用convert_mnist_data的二進制檔案，需要将convert_mnist_data編譯。我使用的caffe并沒有編譯。

caffe編譯之後生成build檔案夾，convert_mnist_data.bin就在build檔案夾裡。

使用編譯過後的caffe就能正常轉換了：

繼續閱讀