天天看點

M1 MAX暴擊,倚天710補刀

落花有意随流水,流水無情戀落花。英特爾和蘋果的良好關系,可以一直追溯到 2005 年,彼時這兩家巨頭在 Mac、一體機等桌面産品線合作較為融洽,但 2010 年以後,英特爾“擠牙膏”似的産品更新政策以及 2020 年蘋果 M1 的全新登場,讓他們逐漸形同陌路,甚至最終分道揚飙。

不過前不久英特爾新任 CEO 帕特·基辛格公開表示想追回“前任”,放出豪言要造出一款比 M1 更能打的晶片,以争取和蘋果再續前緣,結果話音未落就遭蘋果光速打臉:10 月 19 号蘋果炸場釋出會上基于 ARM 架構的 M1 Max 閃耀全場,完爆各種 X86 架構的處理器,用實力告訴英特爾什麼叫“慢擠牙膏一時爽,追回前任火葬廠”,更向世界證明比 M1 更強的處理器也還是出于蘋果之手。

M1 MAX暴擊,倚天710補刀

圖檔來自蘋果官網

而令筆者更為欣喜的是,M1 Max 竟然還不是如今 ARM 架構處理器最為高光的時刻,隔壁平頭哥半導體在雲栖大會上拿出的倚天處理器,更是完美诠釋了什麼叫“大就完了”。倚天 710 中內建的半導體比 M1 MAX 還多 30 億,此外倚天還搭載了最新的 V9 系列 ARM 核心,在雲計算領域強到“爆炸”。

M1 MAX暴擊,倚天710補刀

在桌面與雲方面接連遭受暴擊,幾乎讓英特爾的 X86 進入了病危狀态,後續再擠牙膏就沒法翻盤了。好在基辛格接手之後,英特爾已逐漸開展了 IDM2.0 的全面轉型,經曆過這個灰色星期三之後,英特爾會有什麼回應也值得我們期待。不過這都是後話了,我們還是先來看看 M1 Max 到底有多強。

M1 Max 到底有多強

M1 Max 搭建了一個 10 核心 CPU,其中包括 8 個大核,2 個小核,MAX 相較于 M1 初代性能直接提升 70%;GPU 性能提升了 3 倍;最令人驚豔的名額是統一記憶體管理技術,即記憶體與顯存共用統一管理;M1 MAX 記憶體帶寬最高可達 400GB/s,是 M1 晶片的 6 倍,已經達到了新一代遊戲主機的水準。

M1 MAX暴擊,倚天710補刀

來自蘋果官網

據筆者所知,目前唯一一個能在記憶體帶寬上與 M1 Max 一叫長的是英偉達 Grace 處理器。通過 NVlink 技術,Grace 中 CPU 到 GPU 的記憶體帶寬可達  900GB/s。不過老黃的 Grace 目前還在 PPT 上沒下來,但是搭建 M1 Max 的 Mac Pro 已經開始接受預訂并馬上就要與使用者見面了,是以可以說 M1 Max 在記憶體帶寬方面幾乎是現階段地表最強。

而且最關鍵的是 M1 Max 的功耗控制還很好,幾乎是在沒有功耗、散熱問題的性能下完成性能成倍的提升。目前的已而可謂是人是鬼都在秀,隻有牙膏堿在挨揍。

M1 Max 為何這麼強

由于目前隻有釋出會跑分圖的資料,而且以蘋果的調性也根本不會把晶片手冊拿出來,想進一步了解 M1 Max 估計還是要等大神把 Linux 移動到 Mac Pro 上去才行。

CPU 和 GPU 的通信能力加強,提升機率 100%。我們記憶體與顯示卡進行統一管理,可以大大提高 CPU 與 GPU 的通信效率,進而增強圖像處理、3D 模組化等任務的處理效率。CPU 和 GPU 通信速度的重要性可以用 M1 初代的例子來加以說明,我們知道蘋果 M1 顯存與記憶體加在一起隻有 16G,而 M1 前一代的 Mac Pro 記憶體是 128G,光是顯存都與 M1 持平 16G,不過搭載 M1 的入門版 Mac 在進行圖像處理等任務時,卻要比上一代頂配的 Mac 還要強出近一倍。而本次釋出的 M1 Max 更是直接将記憶體帶寬提升到初代 M1 的 6 位,其性能加強的程度也就可想而知了。正如上文所說英偉達之前釋出的 Grace 處理器也采用了和蘋果比較類似的思路,相信未來會被英特爾、AMD 等 X86 廠商借鑒。

譯碼器增強,提升機率 90%。目前處理器的流水線一般分為取指、譯碼、取操作數等等環節,其中譯碼是一個非常重要的環節。譯碼器方面 ARM 架構的精簡指令集的确有一定優勢,由于指令都是定長的,完全可以做出高效的多路譯碼器以提升效率。沒記錯的話之前 M1 應該是四路譯碼,當時筆者就表示, M1在譯碼器這方面還有後手,未來還能更秀,這裡筆者大膽預測 M1 Max 的 CPU 應該是能有 6 路指令解碼器,8µop 發射寬度,6 路配置設定、10 路執行端口的名額。具體如何待最終揭曉。

大小核心的排程更新。提升機率 70%。由于 M1 Max 大小核的配比是 4:1,而由于大核比較費電,而小核又無法應對高性能計算,是以像 M1 Max 表現這麼均衡的處理大機率會用軟、硬結合的高度方案,比如英特爾在剛剛釋出的 Alder Lake 處理器中搭建的 Thread Director 就是這樣一種軟、硬結合的核心排程方案,英特爾的做法是在處理器中內建了一個專用的 MCU,用來監控目前處理器核心的運作情況,能夠監測到每個線程的特征,比如它運作什麼樣的指令集、它的性能需求如何等等。在收集完資訊之後,MCU 會将收集到的資訊回報給作業系統,再次作業系統把這些資訊與線程排程資訊相結合,判斷是否應該将線程轉移到别的核心上。如果與作業系統結合的好話,那麼一輪排程資訊采集工作僅需要 30 微秒就能完成,而傳統方案排程器可能需要 100 多毫秒才能判斷出結論。由于 Mac OS 與 M1 Max 都是蘋果自己的産品,是以這個調試方案 Thread Director 更極緻,不過由于英特爾在本次釋出會上沒特别提到排程器方案的提升。

而對這麼強的 M1 Max 筆者似乎隻能在生态建設方面給蘋果提出一些建議了。我們知道英偉達之是以能在 AI 及區塊鍊方面有着如此出彩的表現,高性能計算架構 CUDA 絕對是居功至偉,正是在 CUDA 的幫助下英偉爾的 GPU 進可以 AI 訓練、區塊鍊挖礦;退可以玩大型遊戲,爽得不亦樂乎。目前蘋果的 M1 Max 最大的短闆在于對于遊戲的支援一般,尤其是 3A 級的大作更是很少登陸 M1 系列的平台。如果未來像《悟空傳》之類的遊戲也能首發在 Mac 系列,那麼 X86 甚至基于 X86 的遊戲主機可能都要涼涼。

M1 Max 影響幾何

成也蕭何,敗也蕭何,我們知道雲平台最重要的工作是資源進行嚴謹的隔離,由于 M1 Max 統一記憶體管理技術太能打了,記憶體與顯存之間的傳輸帶寬太高,是以這也決定了這款處理器很難在虛拟化的雲環境中使用,是以 M1 Max 短期内帶來的最大沖擊還應該是在于桌面市場。

但是從長期來看,英偉達收購 ARM 的計劃大機率是要黃了,我要是庫克是不可能放 ARM 出去的,就算放猛瑪也不放 ARM,放了 ARM 以後新一代 ARM V9 系列的處理器可能要 gg,建議黃教主去和 VMware 接觸,具體詳見《

若 ARM 收購不成,英偉達應該轉向 VMware

》。

筆者最大的期待是基于 M1 Max 版的 Linux 趕快遷移出來,與此同時,平頭哥的倚天有了,屠龍系列還遠嗎?

繼續閱讀