天天看點

蘋果 M2 Ultra 晶片現身 Geekbench 資料庫,頻率 3.68 GHz

作者:web大雜燴

華為公司将在即将舉行的華為雲開發者大會(HDC.Cloud 2023)上釋出一款名為"盤古 Chat"的多模态千億級大模型産品,直接與ChatGPT競争。

蘋果 M2 Ultra 晶片現身 Geekbench 資料庫,頻率 3.68 GHz

古大模型項目于2020年11月在華為雲内部啟動,并于今年7月7日計劃對外釋出和内測。該産品主要面向政企端客戶,即To B/G市場。華為公開的論文資料顯示,華為盤古大模型參數最多可達1.085萬億,采用了華為自家研發的MindSpore架構。綜合來看,盤古大模型在對話任務方面的表現可能接近GPT-3.5的水準。

根據IT之家的查詢結果,華為盤古大模型于2021年4月首次對外釋出,後來在2022年4月更新到2.0版本。目前,NLP大模型、CV大模型以及科學計算大模型(氣象大模型)均處于即将上線的狀态。

蘋果 M2 Ultra 晶片現身 Geekbench 資料庫,頻率 3.68 GHz

盤古大模型

是首個具有千億參數的中文預訓練大模型,其中CV大模型也首次達到了30億參數。盤古 CV 大模型是業界最大的CV大模型之一,同時兼顧判别和生成能力,基于不同模型大小和運作速度需求,能夠自适應抽取不同規模的模型以滿足AI應用的開發需求。此外,盤古氣象大模型提供了秒級天氣預報,在關鍵要素和常用時間範圍上的精度超過了目前最先進的預報方法,而在台風路徑預測任務上,與傳統數值氣象預報方法相比,盤古氣象大模型的位置誤差可降低20%以上。

蘋果 M2 Ultra 晶片現身 Geekbench 資料庫,頻率 3.68 GHz

計原則

核心設計原則:模型規模大、網絡結構強、具備優秀的泛化能力

衍生模型

此外,盤古還推出了盤古氣象大模型,提供秒級天氣預報。借助創新的3DEST網絡結構和分層時間聚合算法,盤古氣象大模型在氣象預報的關鍵要素和常用時間範圍上的精度均超過了目前最先進的預報方法,速度更是傳統方法的1000倍以上。在台風路徑預測任務中,盤古氣象大模型相比傳統數值氣象預報方法,能夠降低20%以上的位置誤差。

華為的盤古大模型項目采用了超過2000塊昇騰910晶片進行訓練,耗時超過2個月。據梳理,每年大模型訓練調用GPU/TPU卡超過4000片,3年的大模型算力成本高達9.6億元人民币。

繼續閱讀