天天看點

量子計算的裡程碑:用超算模拟45個量子位(附論文)相關論文

本文來自AI新媒體量子位(QbitAI)

量子計算的裡程碑:用超算模拟45個量子位(附論文)相關論文

關于量子計算機性能超越傳統計算機這一關鍵轉折點,計算機科學家有個專有名詞,即“量子霸權”。從各方面來看,這樣的轉折點正在臨近。

一般認為,能夠處理49個量子位的量子計算機性能将可以匹敵全球最強大的超級計算機。如果量子計算機的規模進一步擴大,那麼性能将遠遠超出傳統計算機。

目前這還無法成為現實。一個重要問題在于,我們如何才能知道,這些量子計算機的工作是否符合期望。是以,計算機科學家開始利用強大的傳統計算機去模拟量子計算機的行為。

這裡的關鍵是在人類仍有能力的情況下,盡可能準确地測定量子計算機的行為。在此之後,我們隻能完全信任量子世界所發生的一切。

當然,到目前為止,還沒有任何人有能力模拟包含49個量子位的量子計算機。本周,瑞士蘇黎世聯邦理工學院的Thomas Haner和Damian Steiger公布了迄今為止目标最遠大的一項實驗計劃。

研究團隊利用了全球排名第五的超級計算機,模拟由45個量子位組成的量子計算機的行為。Haner和Steiger表示:“就我們所知,以模拟的量子位個數來看,這創造了新紀錄。”他們也證明了,這樣的模拟可以有多麼強大。

由于量子計算機能夠實作的計算複雜度,這樣的模拟非常困難。量子計算機的計算能力來自疊加态這種量子現象,即一個量子微粒,例如光子,同時可以處于超過一種狀态。

例如,水準極化的光子可以代表0,而垂直極化的光子可以代表1。但如果一個光子同時處于水準極化和垂直極化的疊加态,那麼在計算中就可以同時代表0和1。

通過這種方式,2個光子可以代表4個數字,3個量子可以代表8個數字,以此類推。這就解釋了為何量子計算機的計算能力如此強大,為何傳統計算機的性能相形見绌。

例如,50個光子就可以代表10的16次方個數字,而傳統計算機需要1PB(1024TB)規模的記憶體,才能存儲這些數字。

量子計算的裡程碑:用超算模拟45個量子位(附論文)相關論文

在傳統計算機中處理這些資料則是規模更大的任務。這是由于,大部分超級計算機由多個處理單元組成,這些處理單元通過互相連接配接形成計算網絡。是以,管理不同節點之間的資料流将造成巨大的通信負荷。

這樣的挑戰限制了傳統計算機模拟量子計算機的規模。目前的世界紀錄是模拟42個量子位,這一成就是Julich超級計算機在2010年取得的。自那時以來,由于計算負荷的問題,這方面未能取得太大進展。

由于Haner和Steiger的工作,這樣的情況将發生改變。他們的突破在于尋找多種方式去降低計算負荷,使模拟速度比以往提升至少1個數量級。

研究人員已在加州勞倫斯伯克利國家實驗室Cori II超級計算機的一系列模拟中應用了這些技術。這台超級計算機包含9304個節點,每個節點都包含68核英特爾至強Phi 7250處理器,運作頻率為1.4GHz。峰值性能為每秒29.1千萬億次浮點運算,記憶體則為1PB。

這台超級計算機以首位女性諾貝爾醫學獎得主Gerty Cori來命名,是全球排名第五的超級計算機。

Haner和Steiger使用這台超級計算機模拟了包含30、36、42和45個量子位的量子計算機。在規模最大的一次模拟中,他們使用了0.5PB的記憶體和8192個節點,實作的性能為每秒0.428千萬億次浮點運算。

這距離發揮Cori II超級計算機的峰值性能還有很大差距。研究團隊表示,這是由于大量計算性能都被用于處理通信負荷,而通信負荷仍占據了75%的計算時間。

Haner和Steiger比較了在性能較弱的超級計算機Edsion上,對30和36個量子位進行模拟的結果。這台超級計算機同樣屬于勞倫斯伯克利實驗室。他們發現,他們的方法同樣可以加速計算。“這表明,實作的速度提升并不僅僅是啟用新一代硬體(即Cori II超級計算機)的結果。”

他們認為,這樣的技術進步表明,對49個量子位的模拟将在不久的将來實作。

這方面的工作将為未來量子計算機的發展鋪平道路。其中獲得的資料将扮演重要角色,使實體學家能夠知道,當“量子霸權”最終到來時,量子計算究竟有多麼強大。毫無疑問,這一天不會太遠。

量子計算的裡程碑:用超算模拟45個量子位(附論文)相關論文

《0.5 Petabyte Simulation of a 45-Qubit Quantum Circuit》

摘要:

Near-term quantum computers will soon reach sizes that are challenging to directly simulate, even when employing the most powerful supercomputers. Yet, the ability to simulate these early devices using classical computers is crucial for calibration, validation, and benchmarking. In order to make use of the full potential of systems featuring multi- and many-core processors, we use automatic code generation and optimization of compute kernels, which also enables performance portability. We apply a scheduling algorithm to quantum supremacy circuits in order to reduce the required communication and simulate a 45-qubit circuit on the Cori II supercomputer using 8,192 nodes and 0.5 petabytes of memory. To our knowledge, this constitutes the largest quantum circuit simulation to this date. Our highly-tuned kernels in combination with the reduced communication requirements allow an improvement in time-to-solution over state-of-the-art simulators by more than an order of magnitude at every scale.

PDF版本可在量子位微信公衆号回複:“45”這個數字下載下傳。

本文作者:陳桦 

原文釋出時間:2017-04-12 

繼續閱讀