天天看点

【caffe-Windows】以mnist为例lmdb格式数据前言第一步第二步第三步

前言

前面介绍的案例都是leveldb的格式,但是比较流行和实用的格式是lmdb,原因从此网站摘取

  • 它们都是键/值对(Key/Value Pair)嵌入式数据库管理系统编程库。
  • 虽然lmdb的内存消耗是leveldb的1.1倍,但是lmdb的速度比leveldb快10%至15%,更重要的是lmdb允许多种训练模型同时读取同一组数据集。
  • 因此lmdb取代了leveldb成为Caffe默认的数据集生成格式。

以下步骤均为在E:\CaffeDev-GPU\caffe-master下实施

第一步

确保路径E:\CaffeDev-GPU\caffe-master\examples\mnist下存在从mnist官网下载的四个文件,我在mnist下新建了一个mnist文件夹,把文件丢进去了

【caffe-Windows】以mnist为例lmdb格式数据前言第一步第二步第三步

并在E:\CaffeDev-GPU\caffe-master\examples\mnist文件夹下新建bat文件创建训练集create_minist_trainlmdb.bat,内容如下:

E:\CaffeDev-GPU\caffe-master\Build\x64\Debug\convert_mnist_data.exe ./mnist/train-images-idx3-ubyte ./mnist/train-labels-idx1-ubyte ./mnist_train_lmdb
pause
           

接下来创建测试集create_minist_testlmdb.bat,内容如下:

E:\CaffeDev-GPU\caffe-master\Build\x64\Debug\convert_mnist_data.exe ./mnist/t10k-images-idx3-ubyte ./mnist/t10k-labels-idx1-ubyte ./mnist_test_lmdb
pause
           

或者跟我们前面建立leveldb一样,建立一个bat,内容如下:

set DATA=../../data/mnist
set TOOLS=../../Build/x64/Debug

REM set BACKEND=leveldb
set BACKEND=lmdb

echo "Creating %BACKEND%..."

rd /s /q "mnist_train_%BACKEND%"
rd /s /q "mnist_test_%BACKEND%"

"%TOOLS%/convert_mnist_data.exe" %DATA%/train-images-idx3-ubyte %DATA%/train-labels-idx1-ubyte mnist_train_%BACKEND% --backend=%BACKEND%
"%TOOLS%/convert_mnist_data.exe" %DATA%/t10k-images-idx3-ubyte %DATA%/t10k-labels-idx1-ubyte mnist_test_%BACKEND% --backend=%BACKEND%

echo "Done."

pause
           

第二步

运行建立训练集的bat,出现我们的第一个问题

【caffe-Windows】以mnist为例lmdb格式数据前言第一步第二步第三步

原因在于内存问题,打开caffe.sln,然后修改convert_mnist_data.cpp第101行

【caffe-Windows】以mnist为例lmdb格式数据前言第一步第二步第三步

原始值设置内存为1T,然而我们的内存并没这么大,所以改小一点,差不多100M多一点吧

改完以后重新编译此cpp文件,然后再去运行前面建立训练集和测试集的bat文件

第三步

运行create_minist_trainlmdb.bat会出现

【caffe-Windows】以mnist为例lmdb格式数据前言第一步第二步第三步

如果你原来有mnist_train_lmdb这个文件夹记得删掉,否则会出现

【caffe-Windows】以mnist为例lmdb格式数据前言第一步第二步第三步

因为我们写bat的时候并未检测这个文件夹是否存在,只是想单纯建立这个文件夹,用来存lmdb数据,所以会出现mkdir应该就是make dir失败。

如果我们使用第三个bat就不会出现这个问题了,一目了然

【caffe-Windows】以mnist为例lmdb格式数据前言第一步第二步第三步