“我們努力了十年。”黃仁勳說:“這是GPU自2006年以來最重大的飛躍。”
在剛剛的SIGGRAPH 2018主旨演講中,黃仁勳将英偉達的GPU實力展現得淋漓盡緻。
雖然摩爾定律已見終點,但對于英偉達GPU來說,似乎完全不存在。黃仁勳認為,曆史正處于一個轉折點,存在一個全新的定律——“GPU加速定律”(注:不是黃教主本人說的)。

在演講中,黃仁勳釋出了世界首款實時光線追蹤GPU——NVDIA QUADRO RTX,每秒處理高達10GB Rays,做AI能夠達到每秒500 Trillion Tensor Ops,16TFLOPS + 16TIPS,使用NVLink 擴充後,每秒處理速度最高能達到100GB。
在長達5分鐘的時間裡,黃仁勳驕傲地舉起實物,“以前有誰曾用GB做過機關?有誰曾經想過能夠用GB做機關?”
黃仁勳自豪地重複了很多遍:“每秒10 GB Rays!”
實時渲染光線在環境中的反射和散射,是計算機圖形處理界的“聖杯”,這個過程非常複雜,涉及光線在各種不同媒體上的多次反射和散射。在上世紀70年代,相關算法年首次提出時,一小時隻能模拟一幀,相當于每小時處理60像素。
而現在,英偉達讓它提升到了“每秒10 GB Rays”。
這樣得益于兩大核心技術:英偉達全新研發的基于圖靈架構的更新版光線實時追蹤RT Core,以及深度學習Tensor Core。
黃仁勳感歎,為了設計RT Core架構,英偉達用了整整十年時間研發,終于實作了在一塊GPU上進行光線實時追蹤,這個以前業界曾經認為不可能的事情。
全新的Turing架構,“這是GPU自2006年以來最重大的飛躍。”黃仁勳說。
從Step-function到Realism,全新的混合渲染模型,光線追蹤、計算以及AI,現在好用,也考慮到了未來。
英偉達再一次,實力展現了深度學習時代GPU超乎想象的計算力。
實時渲染光線變化效果
全新圖靈架構,全球首個實時光線追蹤GPU!
黃仁勳表示,英偉達RTX是首款基于 Turing™架構的 GPU,革新了 5000 萬設計師和藝術家的工作,使他們能夠實時渲染逼真的場景,為其工作流程添加基于 AI 的新功能,享受複雜模型和場景的互動性。
PASCAL和TURING架構對比
關鍵在于結合深度學習(Tensor Core)和全新實時光線追蹤架構(RT Core)
圖靈架構相比PASCAL實作6倍速度提升
黃仁勳還釋出了NVIDIA Quadro RTX 8000,Quadro RTX 6000 和 Quadro RTX 5000,實作不同性能的硬體加速光線追蹤、AI、先進的陰影和模拟等。
同時推出的還有完整的軟體堆棧:
以及 Quadro RTX Server,這是一種參考架構,用于從資料中心提供高度可配置、按需呈現和虛拟工作站解決方案。
在展示Quadro RTX Server時,黃仁勳在現場展示了他最喜歡的前後對比:
現在的渲染叢集
使用英偉達RTX伺服器
“隻要1萬美元,簡直是搶錢啊,”黃仁勳感歎,然後是那句經典的:
“你買得越多,省得越多。”
提前5年實作,徹底革新計算機圖形處理
英偉達專業可視化副總裁 Bob Pette 表示:“Quadro RTX 标志着全球計算機圖形行業新紀元的開始。”
“使用者現在可以享受的強大功能,原來被認為至少是 5 年後才可能實作的。設計師和藝術家現在可以通過光線追蹤照片寫實的細節,實作複雜的設計和視覺效果。電影工作室和制片公司現在可以通過渲染工作負載實作更高的吞吐量,進而大大節省時間和成本。”
Quadro RTX 專業 GPU
Quadro RTX GPU 專為要求最苛刻的視覺計算工作負載而設計,例如用于電影和視訊内容建立; 汽車和建築設計; 以及科學可視化。
它們突破性的技術遠遠超過上一代,包括:
新的 RT Cores,可以通過實體上精确的陰影、反射、折射和全局光照,實時跟蹤物體和環境的光線。
Turing Tensor Cores 可加速深度神經網絡訓練和推理,這對于 AI 增強的渲染、産品和服務至關重要。
新的 Turing Streaming Multiprocessor 架構,具有多達 4608 個 CUDA 核心,可并行提供高達每秒 16 萬億次浮點運算和每秒 16 萬億次整數運算,可加速真實世界的複雜模拟。
先進的可程式設計着色技術,可提高複雜視覺效果和圖形密集型體驗的性能。
首次實作超高速三星 16Gb GDDR6 記憶體,支援更複雜的設計,龐大的建築資料集,8K 電影内容等。
NVIDIANVLink 将兩個 GPU 與一個高速鍊路結合,可将記憶體容量擴充至 96GB,并通過高達 100GB/s 的資料傳輸提高驅動性能。
提供 USB Type-C和 VirtualLink的硬體支援,這是一種新的開放行業标準,旨在通過單個 USB-C™連接配接器滿足下一代 VR 耳機的功率,顯示和帶寬要求。
提高 VR 應用性能的新技術,包括可變速率着色、多視圖渲染和 VRWorks 音頻。
Quadro RTX 伺服器
Quadro RTX 伺服器為資料中心的按需渲染定義了一個新标準,可以輕松配置按需渲染節點以進行批處理和互動式渲染。
Quadro RTX 伺服器将 Quadro RTX GPU 與新的 Quadro Infinity 軟體(将在 2019 年第一季度推出)相結合,提供強大而靈活的架構,以滿足創意專業人士的需求。Quadro Infinity 将允許多個使用者通過虛拟工作站通路單個 GPU,進而顯着提高資料中心的密度。最終使用者還可以根據他們的特定需求輕松配置渲染節點和工作站。
Quadro RTX 伺服器預裝了業界領先的内容建立和渲染軟體,提供功能強大且易于部署的渲染解決方案,可從小型安裝擴充到最大的資料中心,成本僅為隻有 CPU 渲染的四分之一。
原文釋出時間為:2018-08-14本文來自雲栖社群合作夥伴新智元,了解相關資訊可以關注“AI_era”。原文連結:
12年來最大飛躍!黃仁勳釋出史上最強GPU,世界首個實時光線追蹤新一代圖靈架構