詳細記錄DBNet.pytorch訓練 Win10

2023-06-20 14:12:40

DBNet.pytorch: 添加連結描述

系統：windows 10

1、資料集預處理：

（1）把訓練資料train和測試資料test的img和gt，放到datasets檔案夾下

詳細記錄DBNet.pytorch訓練 Win10

（2）将訓練資料和測試資料生成如下圖的格式：

詳細記錄DBNet.pytorch訓練 Win10

生成train.txt和test.txt,儲存到datasets檔案夾下(必須也把test.txt也生成)。

生成檔案的代碼如下：

import os
def get_images(img_path):
    '''
    find image files in data path
    :return: list of files found
    '''
    img_path = os.path.abspath(img_path)
    files = []
    exts = ['jpg', 'png', 'jpeg', 'JPG', 'PNG']
    for parent, dirnames, filenames in os.walk(img_path):
        for filename in filenames:
            for ext in exts:
                if filename.endswith(ext):
                    files.append(os.path.join(parent, filename))
                    break
    print('Find {} images'.format(len(files)))
    return sorted(files)

def get_txts(txt_path):
    '''
    find gt files in data path
    :return: list of files found
    '''
    txt_path = os.path.abspath(txt_path)
    files = []
    exts = ['txt']
    for parent, dirnames, filenames in os.walk(txt_path):
        for filename in filenames:
            for ext in exts:
                if filename.endswith(ext):
                    files.append(os.path.join(parent, filename))
                    break
    print('Find {} txts'.format(len(files)))
    return sorted(files)

if __name__ == '__main__':
    import json
    #img_path = './data/ch4_training_images'
    #img_path = './train/img'
    img_path = './test/img'
    files = get_images(img_path)
    #txt_path = './data/ch4_training_localization_transcription_gt'
    #txt_path = './train/gt'
    txt_path = './test/gt'
    txts = get_txts(txt_path)
    n = len(files)
    assert len(files) == len(txts)
    with open('test.txt', 'w') as f:
        for i in range(n):
            line = files[i] + '\t' + txts[i] + '\n'
            #line = files[i] + ' ' + txts[i] + '\n'
            f.write(line)
    print('dataset generated ^_^ ')

參考：添加連結描述

2、配置檔案的修改

詳細記錄DBNet.pytorch訓練 Win10

（1）把data_path的路徑改為：- E:\ZhuoZhuangOCR\Paper\Latest\DB-Resnet\DBNet.pytorch\datasets\train.txt （使用絕對路徑）

dataset:
  train:
    dataset:
      args:
        data_path:
          - E:\ZhuoZhuangOCR\Paper\Latest\DB-Resnet\DBNet.pytorch\datasets\train.txt
        img_mode: RGB

（2）把base的路徑由相對路徑改為絕對路徑，

詳細記錄DBNet.pytorch訓練 Win10

詳細記錄DBNet.pytorch訓練 Win10

繼續閱讀

weka3.7.2版本及以上使用package manager安裝libsvm

Python3.8及PyCharm的安裝步驟Python下載下傳與安裝PyCharm的下載下傳與安裝

SSD算法了解及利用SSD訓練自己的資料

筆記（六）Jetson Nano 安裝TensorFlow GPU筆記（六）Jetson Nano 安裝TensorFlow GPU

如何安裝YEOMAN

cocoapods:更新Ruby環境

接口的幂等性分析以及解決方案

Intellij Idea 2017.3 開發前基本設定

windows7+caffe 僅CPU

eclipse如何把java代碼，打包成jar檔案以及轉換為exe可執行檔案1、背景：2、前言：3、準備：4、具體步驟：5、備注

centos7安裝jdk1.8和maven3.5centos7安裝jdk1.8和maven3.5

文本檢測算法：CTPN1. 簡單介紹2. CTPN4. 實驗結果5. 結論

文本檢測算法----DB、DBNet1. 摘要2. 算法3. 實驗4. 結論

paddleocr文本檢測模型的訓練1、環境的安裝和開源項目的下載下傳2、算法的介紹三、文本檢測模型的訓練

Jetson Nano Ubuntu編譯OpenCV4.4.0+opencv_contrib(帶CUDA)

Ubuntu下安裝OpenCV2.4.13