天天看點

移動深度學習 Mobile-deep-learning(MDL)

Free and open source mobile deep learning framework, deploying by Baidu.

This research aims at simply deploying CNN on mobile devices, with low complexity and high speed. It supports calculation on iOS GPU, and is already adopted by Baidu APP.

Size: 340k+ (on arm v7)

Speed: 40ms (for iOS Metal GPU Mobilenet) or 30 ms (for Squeezenet)

百度研發的移動端深度學習架構,緻力于讓卷積神經網絡極度簡單的部署在手機端。目前正在手機百度内運作。支援iOS gpu計算。體積小,速度快。

體積 armv7 340k+

速度 iOS GPU mobilenet 可以達到 40ms、squeezenet 可以達到 30ms

項目位址:

https://github.com/baidu/mobile-deep-learning

更多機器學習教程:

http://www.tensorflownews.com

特征

一鍵部署,腳本參數就可以切換ios或者android

支援iOS gpu運作MobileNet、squeezenet模型

已經測試過可以穩定運作MobileNet、GoogLeNet v1、squeezenet模型

體積極小,無任何第三方依賴。純手工打造。

提供量化腳本,對32位float轉8位uint直接支援,模型體積量化後4M上下

與ARM相關算法團隊線上線下多次溝通,針對ARM平台會持續優化

NEON使用涵蓋了卷積、歸一化、池化所有方面的操作

彙編優化,針對寄存器彙編操作具體優化

loop unrolling 循環展開,為提升性能減少不必要的CPU消耗,全部展開判斷操作

将大量繁重的計算任務前置到overhead過程

繼續閱讀