極智AI | 講解 TensorRT 顯式batch 和隐式batch

2022-09-05 07:19:22

歡迎關注我的公衆号 [極智視界]，擷取我的更多筆記分享

大家好，我是極智視界，本文講解一下 TensorRT 顯式batch 和隐式batch。

TensorRT 支援使用兩種方式來指定網絡的 Layout，即：

explicit batch

和

implicit batch

。所謂顯式和隐式的差别就在于 Batch 這一維，即顯式 ==> NCHW，隐式 ==> CHW。在比較老版本的 TensorRT 中一般就用

implicit batch

隐式batch，而現在新的開始慢慢用

explicit batch

進行替代。這是為啥呢？這主要是因為，随着算法的不斷發展，網絡中新出現了很多新算子、新結構，有些時候需要操控 batch 這個次元，這個時候如果使用隐式batch 來開發，顯然是不可行的。

隐式batch 模式不能勝任的場景主要包括：

Reducing across the batch dimension ==> batch 次元上的規約操作，如 [N, C, H, W] -> [1, C, H, W]；
Reshaping the batch dimension ==> batch 次元上的變化，如 [N, C, H, W] -> [M, C, H, W]；
Transposing the batch dimension with another dimension ==> 涉及 batch 的次元變換操作，如 [N, C, H, W] -> [C, H, W, N]；

總的來說，就是涉及到 batch 的操作，

explicit batch

就無能為力了，而顯而易見的是，隐式batch 的開發難度會低一些，因為開發自始至終，你隻需要關注 CHW。有同學可能會關心的一點是，那麼我們如果要從隐式batch模式遷移到顯式batch模式的工作量到底有多少呢。這個問題我覺得需要從兩個方面進行回答：

(1) 開發模式上如何設定成 explicit batch 模式；
(2) 網絡中算子 Layout 從 CHW -> NCHW，TensorRT 算子實作要改動的代碼量；

從第 (1) 個方面來說，很簡單，隻要在建立

INetworkDefinition

的時候，使用

flag

來指定是顯式batch 還是隐式batch。

C++ 的做法是這樣的，顯式batch 時，手動指定

flag

為

NetworkDefinitionCreationFlag::kEXPLICIT_BATCH

以标志建構網絡使用

explicit batch mode

；若要使用

implicit batch mode

，則

flag

不進行手動指定或使用

createNetwork

方法來建構網絡：

// cpp mark explicit batch mode
IBuilder* builder = ...;
INetworkDefinition* network = builder->createNetworkV2(1U << static_cast<uint32_t>(NetworkDefinitionCreationFlag::kEXPLICIT_BATCH)))

Python 的代碼是這樣的，顯式batch 時，手動指定

flag

為

trt.NetworkDefinitionCreationFlag.EXPLICIT_BATCH

以标志建構網絡使用

explicit batch mode

；若要使用

implicit batch mode

，則

flag

不進行手動指定：

# python mark explicit batch mode
builder = trt.Builder(...)
builder.create_network(1 << int(trt.NetworkDefinitionCreationFlag.EXPLICIT_BATCH))

從第 (2) 個方面來說，工作量其實是不太好評估的，這取決于你網絡中涉及了多少操控 batch 的操作，如果涉及的多，那改動自然就大。還有一點需要注意的是，

explicit batch

中的

batch

一般一直都是在

axis 0

位置，除非特别指定

Transposing the batch dimension with another dimension

可能會涉及 N 的

axis

動一動，但這并不是常見的操作。因為一般一個高效的推理架構，會對你的

Data Layout

有嚴格要求，語義上就是用 NCHW 還是 NHWC，架構是有一個期望的，而不是讓你随意動，而反觀 TensorRT，NCHW 的 Layout 是其期望。

好了，以上分享了講解 TensorRT 顯式batch 和隐式batch，希望我的分享能對你的學習有一點幫助。

極智AI | 講解 TensorRT 顯式batch 和隐式batch

繼續閱讀

吳恩達logistic回歸實作

【人工智能行業大師訪談1】吳恩達采訪 Geoffery Hinton

吳恩達機器學習筆記（3）

吳恩達j機器學習之過拟合

吳恩達機器學習(一) 介紹

深度學習模型分析人類複雜疾病的準确性

疾病研究：重症肌無力

人工智能如何有效地運用于自然語言處理

新聞 | Mapbox 牽手阿裡，飛豬旅行上線六大城市地圖功能

【趨高機器視覺】機器視覺技術原了解析及解決方案

[HTML5]自定義屬性 data-* 和 jQuery.data 詳解

解碼器用于語義分割：資料依賴的解碼可以實作靈活的特征聚合

2021-2025年中國運動療法（KT）帶行業市場供需與戰略研究報告

cs231n斯坦福基于卷積神經網絡的CV學習筆記（一）KNN和線性分類器/分類器損失/反向傳播一，KNN圖像分類算法二，線性分類器三，線性分類器損失四，反向傳播五，神經網絡

2021年危險化學品經營機關安全管理人員考試題庫及危險化學品經營機關安全管理人員考試技巧

無人機--飛控科普

極智AI | 講解 TensorRT 顯式batch 和 隐式batch

繼續閱讀

極智AI | 講解 TensorRT 顯式batch 和隐式batch