訓練千億參數模型的法寶，昇騰CANN異構計算架構來了~

2021-08-31 14:43:00

摘要：盤古的訓練以「昇騰AI處理器」為基座，同時借助了「CANN 異構計算架構」，讓硬體算力得以充分釋放，大大縮短了訓練時間！

2021年4月，“華為雲盤古大模型”一炮走紅AI人工智能領域。

如果你問：明明明明明白白白喜歡他，但他就是不說，白白喜歡誰？

你的同伴可能還要猶豫3秒鐘，而盤古卻能輕松地回答出：明明！

諸如此類的「中文同詞不同義」的快速語義識别也僅僅是它的雕蟲小技而已。

領先的語言了解和模型生成能力，這個大網紅瞬間被貼上了“最接近人類中文了解能力”、“全球最大中文語言（NLP）預訓練模型”各類标簽。

标簽不是白帖的，在AI領域，大智慧就意味着大模型，他背後的“千億參數”、“TB 級記憶體模型”絕對是他成功的法寶！

模型大，意味着資料也大，你想到如何訓練出這樣大的模型了麼？

盤古的訓練以「昇騰AI處理器」為基座，同時借助了「CANN 異構計算架構」，讓硬體算力得以充分釋放，大大縮短了訓練時間！

什麼是CANN？

以提升使用者開發效率和釋放昇騰AI處理器極緻算力為目标，昇騰CANN（Compute Architecture for Neural Networks）是華為針對AI場景推出的異構計算架構。它對上支援業界主流前端架構，向下對使用者屏蔽系列化晶片的硬體差異，以豐富的軟體棧功能滿足使用者全場景的人工智能應用訴求。

目前CANN已經釋出到3.0的版本，統一程式設計架構，同時支援推理+訓練的端、邊、雲全量場景，實作三大使能。

使能全場景：通過支援業界主流AI架構，支援14+種主流作業系統，實作一次開發，全場景各種硬體形态和運作環境的靈活部署。

使能極簡開發：通過統一程式設計接口AscendCL（Ascend Computing Language），為開發者屏蔽底層處理器的差異，支援開發者隻需要掌握一套API，就可以全面應用于昇騰全系列晶片+推理、訓練全場景。

使能極緻性能：通過軟硬協同優化，親和昇騰的圖編譯技術，以及超過1200個高性能算子，來釋放昇騰晶片的澎湃算力。

CANN的開放能力：

CANN為開發者提供算子開發、模型開發、應用開發的全流程開發體驗，可覆寫全場景應用。

算子開發

DSL語言開發接口：提供了一套基于記憶體的開發接口，處理器上的指令映射和排程是自動實作的。開發者僅需要關注算子的數學邏輯計算，不需要了解硬體細節，即可開發出高性能的算子。根據統計可以滿足60%以上算子開發需求。
TIK語言開發接口：提供了一套比較完備的基于處理器内部Buffer可見的程式設計語言，開發者可以自行決定搬進搬出資料量的大小，進而充分發揮晶片的能力，提升開發算子的性能。

模型開發

支援多種模型開發架構MindSpore，TensorFlow, PyTorch, ONNX 等
支援通過标準化的Ascend IR(Intermediate Representation)接口隔離上層架構差異，進行直接構圖和模型開發

應用開發

提供一套标準的AscendCL程式設計接口，提升使用者APP程式設計效率

CANN的硬核技術：

高性能算子庫：支援包括TensorFlow、Pytorch、Mindspore、Onnx架構在内1200+算子，開發者直接基于内置算子即可開發模型。
自動融合技術：支援基于算子、子圖、SCOPE多元度的自動融合，支援動态DSL融合，可有效減少計算節點，縮短計算時間，讓昇騰AI處理器瞬間加速。

異構部署排程架構：充分利用昇騰晶片的異構執行單元，将不同的計算任務配置設定給最合适的計算引擎，高效協同異步流水，提升計算任務整體效率。
高效的記憶體生命周期管理算法：兼顧記憶體的充分複用以及資料交換的效能，實作資源與效率的均衡。
預置的業界主流模型庫：華為昇騰Model Zoo提供100+主流模型的代碼以及相應的調優參數example，為開發者提供貨架式的參考實作，詳細資訊參見：https://www.hiascend.com/software/modelzoo
高性能的圖下沉執行架構：将所有計算下沉到晶片，減少Host CPU與晶片之間的互動時間，實作高性能的訓練和推理。
高性能動态圖排程：支援基于異步流水的單算子執行架構，支援靈活的H2D、D2H互動，解決PyTorch等架構下動态圖模式的高性能運作問題。
業界領先的智能調優：支援基于強化學習、遺傳算法、CostModel等多種智能調優算法，提供算子級或者圖級調優選擇，為使用者提供自動的極緻性能調優體驗。

CANN的5.0版本會給你帶來更多想象，了解更多資訊，請通路昇騰社群。

點選關注，第一時間了解華為雲新鮮技術~

訓練千億參數模型的法寶，昇騰CANN異構計算架構來了~

什麼是CANN？

CANN的開放能力：

CANN的硬核技術：

繼續閱讀

預計8月份釋出的華為鴻蒙4.0提前到來，花粉們，你的鴻蒙3.0更新了嗎？1、全面融入人工智能。本次更新對語音互動、識别和

大模型必看報告!國際知名機構IDC釋出測評，文心大模型3.5登頂國内No.1要問今年哪些概念最火，恐怕大模型會榜上有名。

咱們是不是該感謝老美卡[奸笑]脖子？它這一卡，硬是将OpenEuler逼進了伺服器作業系統全球第一陣營，也把OpenEu

ChatGPT神器開放；華為盤古大模型3.0；李飛飛“具身智能”新成果

新能源汽車第二次變革前夕，華為又一盤大棋浮現，建構自動駕駛中國方案！溪雲初起日沉閣，山雨欲來風滿樓！就在7月21日，華為

特斯拉和華為誰的自動駕駛技術更牛？現在已經顯而易見了，華為和特斯拉明顯不是一個級别和賽道華為釋出了華為雲自動駕駛開發平台

#華為雲自動駕駛開發平台重磅釋出##媒體：中國需要自己的自動駕駛解決方案#看到這兩個硬核的标題，真的是振奮人心，民族自豪

華為雲釋出自動駕駛開發平台，科技感比YY星耀版還強？日前，華為雲公有雲業務部總裁高江海在釋出會上宣布，華為雲自動駕駛開發

中科馭數正式加入openEuler社群，共建多樣性計算生态

這次HDC2023華為開發者大會，聽說小藝會有非常大的更新，從下面的預熱海報中也可以看出一些端倪。如果智慧助手小藝能夠得

【編碼能力超越ChatGPT！揭秘華為新一代代碼大模型】AI奇點網7月30日報道丨去年7月，華為諾亞方舟實驗室旗下的語音

并行計算系統的異構并行有多少種呢？異構計算中引擎并行計算系統的異構并行有多少種呢？GPU、FPGA、DSA、ASIC等引

大模型的未來市場格局可能是怎樣的？由OpenAI公司打造的ChatGPT在今年年初迅速火遍全球網際網路，一躍成為AI領域的

我去，AI開花結果的時代，偏逢[我想靜靜]微軟、華為之類的神對手，谷歌硬是沒過上幾天安心的日[捂臉]子！年初的時候，Ch

就在今天下午，大家期待許久的鴻蒙4.0，正式釋出了，而且根據華為公布的資料，如今接入鴻蒙生态裝置已經超過7億，開發者超過

#鴻蒙新版本##搭載了鴻蒙##8月份鴻蒙更新##華為開發者大會2023（Cloud）#華為2023開發者大會<HD