天天看點

ChatGPT背後的AI技術誕生于愛荷華州 用了很多水

作者:cnBeta

打造像 ChatGPT 這樣的人工智能産品的成本很難衡量。微軟支援的 OpenAI 的技術需要大量的水,這些水來自愛荷華州中部的浣熊河和得梅因河流域,用于冷卻一台強大的超級計算機,幫助其人工智能系統學習如何模仿人類寫作。

當微軟、OpenAI 和Google等領先的技術開發商競相利用生成式人工智能的熱潮時,他們也承認,對其人工智能工具日益增長的需求會帶來高昂的成本,從昂貴的半導體到增加的耗水量。

但他們往往對具體細節秘而不宣。在愛荷華州,很少有人知道這裡是 OpenAI 最先進的大型語言模型 GPT-4 的誕生地,直到微軟的一位高管在一次演講中說,該模型"實際上是在得梅因西部的玉米地旁開發的"。

ChatGPT背後的AI技術誕生于愛荷華州 用了很多水

建立大型語言模型需要分析大量人類撰寫文本的模式。所有這些計算都需要耗費大量的電力并産生大量的熱量。為了在炎熱的天氣保持涼爽,資料中心需要抽水--通常是抽到倉庫大小的建築外的冷卻塔。

微軟在其最新的環境報告中披露,從2021年到2022年,其全球耗水量激增了34%(達到近17億加侖,或超過2500個奧林匹克規格的遊泳池),與前幾年相比,耗水量急劇增加,外部研究人員認為這與微軟的人工智能研究有關。

加州大學河濱分校(University of California, Riverside)的研究員任少磊(Shaolei Ren)說:"可以說大部分耗水量增長都是人工智能造成的,包括它在生成式人工智能方面的大量投資以及與 OpenAI 的合作。"

在即将于今年晚些時候發表的一篇論文中,任少磊的團隊估計,每當你向 ChatGPT 提出 5 到 50 個提示或問題時,ChatGPT 就會喝掉 500 毫升的水(接近一個 16 盎司水瓶的容量)。這個範圍因伺服器的位置和季節而異。這一估算還包括公司沒有測量的間接用水量,例如冷卻為資料中心供電的發電廠。

"大多數人并不了解 ChatGPT 的資源使用情況,"任說。"如果你不知道資源的使用情況,那麼我們就沒有辦法幫助你節約資源"。

Google同期的用水量增長了 20%,任也将其主要歸因于人工智能工作。Google的用水量增長并不均衡--在俄勒岡州,Google的用水量保持穩定,該州的用水量引起了公衆的關注,而在拉斯維加斯以外的地區,Google的用水量則翻了一番。在愛荷華州,Google的裝置對水資源同樣饑渴,其理事會布拉夫斯資料中心的飲用水用量比其他任何地方都要多。

在回答美聯社的提問時,微軟在本周的一份聲明中表示,它正在投資研究,以測量人工智能的能源和碳足迹,"同時研究如何使大型系統在訓練和應用中更加高效"。

"我們将繼續監控我們的排放量,加快進度,同時增加使用清潔能源為資料中心供電,購買可再生能源,并做出其他努力,以實作我們的可持續發展目标,即到 2030 年實作負碳排放、正水排放和零浪費。"該公司的聲明說。

OpenAI 周五在自己的聲明中也表達了同樣的觀點,表示正在"認真思考"如何更好地利用計算能力。它說,"我們認識到大型模型的訓練可能是能源和水資源密集型的",并努力提高效率。

微軟于 2019 年首次向總部位于舊金山的 OpenAI 投資 10 億美元,這距離這家初創公司推出 ChatGPT 并引發全球對人工智能進步的關注已有兩年多時間。作為交易的一部分,這家軟體巨頭将提供訓練人工智能模型所需的計算能力。

為了至少完成其中的一部分工作,兩家公司将目光投向了愛荷華州的西得梅因(West Des Moines),這座擁有 6.8 萬人口的城市十多年來一直是微軟雲計算服務的資料中心聚集地。微軟的第四個和第五個資料中心将于今年晚些時候在這裡啟用。

史蒂夫-蓋爾(Steve Gaer)說:"他們正在以最快的速度建造這些資料中心。"吸引該公司的是該市對建設公共基礎設施的承諾,并通過納稅為支援這項投資貢獻了一筆"驚人"的資金。他補充說:"但是,你知道,他們對自己在那裡的所作所為相當保密。"

微軟首次表示,它正在為2020年的OpenAI開發世界上最強大的超級計算機之一,當時公司拒絕透露其位置,但将其描述為一個"單一系統",擁有超過285,000個傳統半導體核心和10,000個圖形處理器--這種晶片已成為人工智能工作負載的關鍵。

專家們表示,在單一地點"預訓練"人工智能模型是有意義的,因為大量資料需要在計算核心之間傳輸。

直到 5 月底,微軟總裁布拉德-史密斯(Brad Smith)才透露,微軟已在愛荷華州建立了"先進的人工智能超級計算資料中心",專門用于讓 OpenAI 訓練其第四代模型 GPT-4。該模型現在為進階版本的 ChatGPT 和微軟自己的一些産品提供動力,并加速了關于遏制人工智能社會風險的讨論。它是由加利福尼亞州的非凡工程師制造的,但實際上是在愛荷華州制造的。

從某種程度上來說,西得梅因是一個相對高效的地方,可以用來訓練強大的人工智能系統,尤其是與微軟位于亞利桑那州的資料中心相比,後者在相同的計算需求下消耗的水資源要多得多。

任少磊說:"是以,如果你要在微軟内部開發人工智能模型,那麼你應該把訓練安排在愛荷華州,而不是亞利桑那州。在教育訓練方面沒有任何差別。但在耗水量或能耗方面,差别就大了。"

在一年中的大部分時間裡,愛荷華州的天氣都很涼爽,微軟可以利用外部空氣來保持超級計算機的正常運作,并将熱量排出大樓。隻有當溫度超過 29.3 攝氏度(約 85 華氏度)時,微軟才會取水,該公司在一份公開披露的檔案中如是說。

這仍然會消耗很大的水量,尤其是在夏天。根據西得梅因水廠(West Des Moines Water Works)的資料,2022 年 7 月,也就是 OpenAI 稱其完成 GPT-4 教育訓練的前一個月,微軟向其愛荷華州資料中心叢集泵入了約 1150 萬加侖的水。這約占該地區用水總量的 6%,該地區還為該市居民提供飲用水。

2022 年,西得梅因水廠的一份檔案稱,如果微軟的資料中心項目能夠"展示并實施在目前水準上大幅降低高峰用水量的技術",以保護住宅和其他商業用水的供應,那麼西得梅因水廠和市政府"會考慮這些項目"。

微軟周四表示,它正在直接與水務局合作,以解決其回報的問題。水廠在一份書面聲明中表示,微軟一直是一個很好的合作夥伴,并一直在與當地官員合作,在滿足用水需求的同時減少水足迹。

繼續閱讀