資料準備

google的flower資料集http://download.tensorflow.org/example_images/flower_photos.tgz

從上述連結下載下傳的圖檔資料集放在本地，這裡我的存放目錄是：/home/tf/source/my_flowers_5/mydata。

該資料集有5個分類，共有3670張圖檔。

daisy(鄒菊)類有633張圖檔，dandelion(蒲公英)類有898張圖檔，roses(玫瑰)類有641張圖檔，sunflowers(向日葵)類有699張圖檔，tulips(郁金香)類有799張圖檔，格式都為jpg。

圖檔資料集打包成TFRecord格式的方法資料準備腳本檔案準備修改腳本運作腳本

腳本檔案準備

用到腳本檔案隻有兩個：

download_and_convert_data.py
convert_quiz.py

這兩個腳本都在我們提供的參考代碼中，convert_quiz.py在datasets檔案夾裡。

download_and_convert_data.py存放的本地目錄是：/home/tf/source/my_flowers_5

convert_quiz.py存放的本地目錄是：/home/tf/source/my_flowers_5/datasets

修改腳本

download_and_convert_data.py需要修改的内容：

代碼第69行，FLAGS.dataset_name == 'quiz' 改成 FLAGS.dataset_name == 'mydata'

‘mydata’ 是随便起的，你也可以用自己喜歡的名字，但是資料集儲存的檔案夾名稱、convert_quiz.py以及後續的作業訓練代碼都要做相應的修改

convert_quiz.py腳本修改的内容包括：

代碼第39行，_NUM_VALIDATION = 734，即設定驗證集的資料量，這裡采用20%*3670

代碼第80行，flower_root = os.path.join(dataset_dir, 'quiz') ，'quiz' 改成 'mydata'

代碼第99行，output_filename = 'quiz_%s_%05d-of-%05d.tfrecord'，quiz 改成 mydata

運作腳本

修改好後在目前目錄/home/tf/source/my_flowers_5打開shell，然後輸入以下指令行:

python3 download_and_convert_data.py --dataset_name=mydata --dataset_dir=./

參數說明：

dataset_name = mydata # 資料集的名稱

dataset_dir = ./ # 資料集mydata儲存的位置，用的是download_and_convert_data.py的相對位置

如果資料打包成功，會有以下的資訊提示，

圖檔資料集打包成TFRecord格式的方法資料準備腳本檔案準備修改腳本運作腳本

最後生成的TFRecord資料如下圖所示，

圖檔資料集打包成TFRecord格式的方法資料準備腳本檔案準備修改腳本運作腳本

圖檔資料集打包成TFRecord格式的方法資料準備腳本檔案準備修改腳本運作腳本

資料準備

腳本檔案準備

修改腳本

運作腳本

繼續閱讀

Pascal VOC資料集轉成tfrecord檔案形式---------------------解讀！！！原因：我自己想對資料集進行一些預處理，看大神的代碼，終于了解是怎麼轉成tensorflow的資料檔案tfrecord！！！！

tensorflow通過tfrecord高效讀寫資料寫入TFRecordWriter讀取并解析為dataset

Tensorflow學習筆記-通過slim讀取TFRecord檔案

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xff in position 0: invalid start bytewen報錯

Image轉tfrecord和tfrecod轉image

tensorflow系列之1：加載資料

18-TFRecord 資料格式化存儲工具（CDBmax 資料國度）

【Tensorflow】讀取TFRecord檔案時，Image和Label無法一一對應問題原因解決

tensorflow資料加載之TFRecord

TensorFlow詳解貓狗識别（一）--讀取自己的資料集

tensorflow入門：tfrecord 和tf.data.TFRecordDataset1.建立tfrecord2.tfrecord檔案的使用：tf.data.TFRecordDataset3.mnist實驗

Tensorflow資料集制作專題【四】— 将圖檔檔案制作成TFRecord資料集，并從TFRecord檔案集讀取資料

tensorflow系列——讀取tfrecord資料-----------TensorFlow1.x-----------方式彙總：一、為現成的estimator建立TrainSpec二、為自定義estimator建立TrainSpec三、本地調試列印tfrecord資料-----------TensorFlow2.x-----------四、本地列印tfrecord資料

tfRecord寫入

讀取hdfs上的image資料，包括csv，pickle和tfrecord類型