NanoDet：這是個小于4M超輕量目标檢測模型

摘要：NanoDet 是一個速度超快和輕量級的移動端 Anchor-free 目标檢測模型。

前言

YOLO、SSD、Fast R-CNN等模型在目标檢測方面速度較快和精度較高，但是這些模型比較大，不太适合移植到移動端或嵌入式裝置；輕量級模型 NanoDet-m，對單階段檢測模型三大子產品（Head、Neck、Backbone）進行輕量化，目标加檢測速度很快；模型檔案大小僅幾兆（小于4M）。

NanoDet作者開源代碼位址：https://github.com/RangiLyu/nanodet （緻敬）

基于NanoDet項目進行小裁剪，專門用來實作Python語言、PyTorch 版本的代碼位址：https://github.com/guo-pu/NanoDet-PyTorch

下載下傳直接能使用，支援圖檔、視訊檔案、攝像頭實時目标檢測

先看一下NanoDet目标檢測的效果：

同時檢測多輛汽車：

檢視多目标、目标之間重疊、同時存在小目标和大目标的檢測效果：

NanoDet 模型介紹

NanoDet 是一種 FCOS 式的單階段 anchor-free 目标檢測模型，它使用 ATSS 進行目标采樣，使用 Generalized Focal Loss 損失函數執行分類和邊框回歸（box regression）。

1）NanoDet 模型性能

NanoDet-m模型和YoloV3-Tiny、YoloV4-Tiny作對比：

備注：以上性能基于 ncnn 和麒麟 980 (4xA76+4xA55) ARM CPU 獲得的。使用 COCO mAP (0.5:0.95) 作為評估名額，兼顧檢測和定位的精度，在 COCO val 5000 張圖檔上測試，并且沒有使用 Testing-Time-Augmentation。

NanoDet作者将 ncnn 部署到手機（基于 ARM 架構的 CPU 麒麟 980，4 個 A76 核心和 4 個 A55 核心）上之後跑了一下 benchmark，模型前向計算時間隻要 10 毫秒左右，而 yolov3 和 v4 tiny 均在 30 毫秒的量級。在安卓攝像頭 demo app 上，算上圖檔預處理、檢測框後處理以及繪制檢測框的時間，NanoDet 也能輕松跑到 40+FPS。

2）NanoDet 模型架構

3）NanoDet損失函數

NanoDet 使用了李翔等人提出的 Generalized Focal Loss 損失函數。該函數能夠去掉 FCOS 的 Centerness 分支，省去這一分支上的大量卷積，進而減少檢測頭的計算開銷，非常适合移動端的輕量化部署。

詳細請參考：Generalized Focal Loss: Learning Qualified and Distributed Bounding Boxes for Dense Object Detection

4）NanoDet 優勢

NanoDet 是一個速度超快和輕量級的移動端 Anchor-free 目标檢測模型。該模型具備以下優勢：

超輕量級：模型檔案大小僅幾兆（小于4M——nanodet_m.pth）；
速度超快：在移動 ARM CPU 上的速度達到 97fps（10.23ms）；
訓練友好：GPU 記憶體成本比其他模型低得多。GTX1060 6G 上的 Batch-size 為 80 即可運作；
友善部署：提供了基于 ncnn 推理架構的 C++ 實作和 Android demo。

基于PyTorch 實作NanoDet

基于NanoDet項目進行小裁剪，專門用來實作Python語言、PyTorch 版本的代碼位址：

1）NanoDet目标檢測效果

同時檢測出四位少年

在複雜街道中，檢測出行人、汽車：

通過測試發現NanoDet确實很快，但識别精度和效果比YOLOv4差不少的。

2）環境參數

測試環境參數

系統：Windows 程式設計語言：Python 3.8 整合開發環境：Anaconda

深度學習架構：PyTorch1.7.0+cu101 （torch>=1.3 即可）開發代碼IDE：PyCharm

開發具體環境要求如下：

Cython
termcolor
numpy
torch>=1.3
torchvision
tensorboard
pycocotools
matplotlib
pyaml
opencv-python
tqdm

通常測試感覺GPU加速（顯示卡驅動、cudatoolkit 、cudnn）、PyTorch、pycocotools相對難裝一點

Windows開發環境安裝可以參考：

安裝cudatoolkit 10.1、cudnn7.6請參考 https://blog.csdn.net/qq_41204464/article/details/108807165

安裝PyTorch請參考 https://blog.csdn.net/u014723479/article/details/103001861

安裝pycocotools請參考 https://blog.csdn.net/weixin_41166529/article/details/109997105

3）體驗NanoDet目标檢測

下載下傳代碼，打開工程

先到githug下載下傳代碼，然後解壓工程，然後使用PyCharm工具打開工程；

githug代碼下載下傳位址：https://github.com/guo-pu/NanoDet-PyTorch

說明：該代碼是基于NanoDet項目進行小裁剪，專門用來實作Python語言、PyTorch 版本的代碼

NanoDet作者開源代碼位址：https://github.com/RangiLyu/nanodet （緻敬）

使用PyCharm工具打開工程

選擇開發環境】

檔案(file)——>設定(setting)——>項目(Project)——>Project Interpreters 選擇搭建的開發環境；

然後先點選Apply，等待加載完成，再點選OK；

進行目标檢測

具體指令請參考：

'''目标檢測-圖檔'''
python detect_main.py image --config ./config/nanodet-m.yml --model model/nanodet_m.pth --path  street.png
 
'''目标檢測-視訊檔案'''
python detect_main.py video --config ./config/nanodet-m.yml --model model/nanodet_m.pth --path  test.mp4
 
'''目标檢測-攝像頭'''
python detect_main.py webcam --config ./config/nanodet-m.yml --model model/nanodet_m.pth --path  0

【目标檢測-圖檔】

【目标檢測-視訊檔案】

檢測的是1080*1920的圖檔，很流暢毫不卡頓，就是目前識别精度不太高

4）調用模型的核心代碼

detect_main.py 代碼：

import cv2
import os
import time
import torch
import argparse
from nanodet.util import cfg, load_config, Logger
from nanodet.model.arch import build_model
from nanodet.util import load_model_weight
from nanodet.data.transform import Pipeline
 
image_ext = ['.jpg', '.jpeg', '.webp', '.bmp', '.png']
video_ext = ['mp4', 'mov', 'avi', 'mkv']
 
'''目标檢測-圖檔'''
# python detect_main.py image --config ./config/nanodet-m.yml --model model/nanodet_m.pth --path  street.png
 
'''目标檢測-視訊檔案'''
# python detect_main.py video --config ./config/nanodet-m.yml --model model/nanodet_m.pth --path  test.mp4
 
'''目标檢測-攝像頭'''
# python detect_main.py webcam --config ./config/nanodet-m.yml --model model/nanodet_m.pth --path  0
 
def parse_args():
    parser = argparse.ArgumentParser()
    parser.add_argument('demo', default='image', help='demo type, eg. image, video and webcam')
    parser.add_argument('--config', help='model config file path')
    parser.add_argument('--model', help='model file path')
    parser.add_argument('--path', default='./demo', help='path to images or video')
    parser.add_argument('--camid', type=int, default=0, help='webcam demo camera id')
    args = parser.parse_args()
    return args
 
 
class Predictor(object):
    def __init__(self, cfg, model_path, logger, device='cuda:0'):
        self.cfg = cfg
        self.device = device
        model = build_model(cfg.model)
        ckpt = torch.load(model_path, map_location=lambda storage, loc: storage)
        load_model_weight(model, ckpt, logger)
        self.model = model.to(device).eval()
        self.pipeline = Pipeline(cfg.data.val.pipeline, cfg.data.val.keep_ratio)
 
    def inference(self, img):
        img_info = {}
        if isinstance(img, str):
            img_info['file_name'] = os.path.basename(img)
            img = cv2.imread(img)
        else:
            img_info['file_name'] = None
 
        height, width = img.shape[:2]
        img_info['height'] = height
        img_info['width'] = width
        meta = dict(img_info=img_info,
                    raw_img=img,
                    img=img)
        meta = self.pipeline(meta, self.cfg.data.val.input_size)
        meta['img'] = torch.from_numpy(meta['img'].transpose(2, 0, 1)).unsqueeze(0).to(self.device)
        with torch.no_grad():
            results = self.model.inference(meta)
        return meta, results
 
    def visualize(self, dets, meta, class_names, score_thres, wait=0):
        time1 = time.time()
        self.model.head.show_result(meta['raw_img'], dets, class_names, score_thres=score_thres, show=True)
        print('viz time: {:.3f}s'.format(time.time()-time1))
 
 
def get_image_list(path):
    image_names = []
    for maindir, subdir, file_name_list in os.walk(path):
        for filename in file_name_list:
            apath = os.path.join(maindir, filename)
            ext = os.path.splitext(apath)[1]
            if ext in image_ext:
                image_names.append(apath)
    return image_names
 
 
def main():
    args = parse_args()
    torch.backends.cudnn.enabled = True
    torch.backends.cudnn.benchmark = True
 
    load_config(cfg, args.config)
    logger = Logger(-1, use_tensorboard=False)
    predictor = Predictor(cfg, args.model, logger, device='cuda:0')
    logger.log('Press "Esc", "q" or "Q" to exit.')
    if args.demo == 'image':
        if os.path.isdir(args.path):
            files = get_image_list(args.path)
        else:
            files = [args.path]
        files.sort()
        for image_name in files:
            meta, res = predictor.inference(image_name)
            predictor.visualize(res, meta, cfg.class_names, 0.35)
            ch = cv2.waitKey(0)
            if ch == 27 or ch == ord('q') or ch == ord('Q'):
                break
    elif args.demo == 'video' or args.demo == 'webcam':
        cap = cv2.VideoCapture(args.path if args.demo == 'video' else args.camid)
        while True:
            ret_val, frame = cap.read()
            meta, res = predictor.inference(frame)
            predictor.visualize(res, meta, cfg.class_names, 0.35)
            ch = cv2.waitKey(1)
            if ch == 27 or ch == ord('q') or ch == ord('Q'):
                break
 
 
if __name__ == '__main__':
    main()

本文分享自華為雲社群《目标檢測模型NanoDet（超輕量，速度很快）介紹和PyTorch版本實踐》，原文作者：一顆小樹x。

點選關注，第一時間了解華為雲新鮮技術~

NanoDet：這是個小于4M超輕量目标檢測模型

前言

NanoDet 模型介紹

1）NanoDet 模型性能

2）NanoDet 模型架構

3）NanoDet損失函數

4）NanoDet 優勢

基于PyTorch 實作NanoDet

1）NanoDet目标檢測效果

2）環境參數

3）體驗NanoDet目标檢測

下載下傳代碼，打開工程

選擇開發環境】

進行目标檢測

4）調用模型的核心代碼

detect_main.py 代碼：

繼續閱讀

感覺機(Perceptron) Python實作scikit-learn 方法

深度學習的一些小記錄裡面有一部分是摘錄

LabelImg的安裝與使用（Anaconda環境）Labellmg的安裝

pytorch：List中包含Tensor的grad資料怎麼辦？

目标檢測：YOLOV3論文解讀一、yolov3論文解讀

Pytorch機器學習（九）—— YOLO中對于錨框，預測框，産生候選區域及對候選區域進行标注詳解 Pytorch機器學習（九）—— YOLO中錨框，預測框，産生候選區域及對候選區域進行标注詳解前言一、基本概念二、代碼講解總結

沒錯! AI已經開始“引領”服裝潮流趨勢了

2021-09-30三維點雲測量正方形包裹體積

CogView: Mastering Text-to-Image Generation via Transformers翻譯摘要1.介紹2.方法3.Finetuning

用Matlab搞計算機視覺是怎樣的體驗？

人工智能有朝一日真的能取代人類教師嗎?

【深度學習】損失函數記錄0. 前言1. 正文參考文獻

深度學習之卷積01 卷積02 填充Padding03 步幅Stride04 卷積核的選擇05 多通道卷積參考

【人工智能行業大師訪談1】吳恩達采訪 Geoffery Hinton

人工智能如何有效地運用于自然語言處理

【Torch】最簡潔logging使用指南