天天看點

ChatGPT Plus停售風波:算力不足是僞命題,資料才是關鍵

界面新聞記者 | 李京亞

昨日中午,一則ChatGPT Plus停售的消息在國内科技圈引發震動。據量子位等媒體報道,OpenAI暫停了Plus的銷售,ChatGPT已不支援Plus付費,之後何時開放也未可知。

幾位使用者告訴界面新聞,昨天确實發生了ChatGPT Plus的停售,這些使用者包括國内售賣ChatGPT賬号的中間商和賣虛拟信用卡的中間商。

今日早間,多位使用者告訴界面新聞,ChatGPT會員可以正常更新到ChatGPT Plus,更新後功能一切正常。

算力告急?

ChatGPT Plus的推出是為了使用者可在ChatGPT高峰時段優先使用,獲得更迅速的服務響應,是以,付費的ChatGPT Plus相對于免費的ChatGPT而言,擁有更大的模型容量、更先進的訓練和更好的預處理,在使用上能夠更加快速高效地處理輸入并完成輸出。 OpenAI是在今年2月1日釋出了ChatGPT Plus訂閱計劃,ChatGPT Plus每月收費20美元(約合135元人民币)。

ChatGPT Plus的強大功能是基于GPT-4模型而生,而此前風靡全網的ChatGPT使用的是GPT-3.5模型,更強大的模型就意味着更大規模的算力。

目前,大模型算力成本主要有初始訓練成本和後續營運成本兩部分。東吳證券對GPT模型所需的算力作了測算:在GPT-3模型初始訓練階段,根據OpenAI官網資料,每個token(token是服務端生成的一串字元串, 以作用戶端進行請求的一個令牌)的訓練成本通常約為 6N FLOPS(FLOPS 指每秒浮點運算次數,可了解為計算速度,可以用來衡量硬體的性能), 那麼OpenAI對ChatGPT的初始訓練成本需要843顆英偉達A100晶片。

當進入營運階段,由于這個階段所需算力量與使用者數量緊密相關,東吳證券作出假設,如果GPT-3每日有5000萬活躍使用者,每個使用者提10個問題,每個問題回答400字,則這個階段需要16255顆英偉達A100晶片。

根據ChatGPT Plus的收費金額,東吳證券推論,GPT-4的參數量是GPT-3的10倍以上,是以預計GPT-4的算力需求是GPT-3的10倍以上。

此等算力規模需求,自然會引發算力告急的猜想。随着使用者需求量超過預期,OpenAI很可能采取一些方式來減少對ChatGPT的通路。比如從3月31日開始,ChatGPT開始集中在亞洲地區大規模封号,據各方消息彙總,這次封号受到影響的賬戶多達百萬。

OpenAI想借ChatGPT Plus作為打開豐富商業模式的開端。但在現實階段體驗中,無論是ChatGPT還是ChatGPT Plus,都存在顯著的相應延遲和回答錯誤率提升等問題。3月下旬開始,OpenAI對于Plus付費使用者的通路連續下降門檻值,其應用模型GPT-4通路限制由第一天的150msg/4hr到100msg/4hr到50msg/3hr直到最近的25msg/3hr,相當于不到一個月連續下降了4次通路門檻值,這都被視為算力不足的展現。

不過,也出現了專業聲音認為,算力并非大模型發展和功能體驗的真正瓶頸。

氪信科技創始人兼CEO朱明傑告訴界面新聞,他并沒有把算力問題太當成瓶頸,做大模型,最先解決的是最終結果的問題。

氪信科技是将搜尋引擎級别的大規模機器學習技術用于金融領域的最早一批人工智能公司,朱明傑告訴記者,“用第一性原理來說,本質上OpenAI解決的問題是如何把這麼大體量的資料壓縮到模型裡面去,變成知識的問題,這才是它的終極目标。中間算力到底用A100還是A800,用的是GPU架構還是CPU架構,反而都是可解的事情。”

事實上,此番撲朔迷離的ChatGPT Plus停售事件,是近日“唱衰ChatGPT大合唱”的最新樂章。

剛剛,加拿大和德國加入了意大利的“反感ChatGPT”陣營。當地時間4月4日,加拿大隐私專員辦公室(OPC)宣布開始調查ChatGPT背後的公司OpenAI,涉及“指控OpenAI未經同意收集、使用和披露個人資訊”的投訴。

據路透社消息,德國聯邦資料保護專員Ulrich Kelber在4月3日發表的評論中告訴德國《商報》,德國可能會追随意大利的腳步,因資料安全考量而“封殺”ChatGPT。

3月底,意大利個人資料保護局宣布,即日起暫時禁止ChatGPT的使用,同時對OpenAI展開調查,限制其處理意大利的使用者資訊。該機構認為,3月20日ChatGPT平台出現了使用者對話資料和付款服務支付資訊丢失情況。此外,平台沒有就收集處理使用者資訊予以告知,缺乏大量收集和存儲個人資訊的法律依據。

兩天後,OpenAI首席執行官Sam Altman回應稱這是一個 “重大問題”,“我們對此感覺很糟糕。”他表示,将會遵從意大利政府的要求,并已停止在意大利提供ChatGPT——盡管其認為自身遵守所有的隐私法。

而在意大利對ChatGPT做出封禁決定前兩天,馬斯克率一衆科技圈大佬呼籲暫停高階AI系統訓練,其所發表的一封公開信引發了軒然大波。信中指出,“隻有在我們确信強大的人工智能系統的效果将是積極的,風險是可控的,才應該開發。”

資料才是關鍵

縱觀近期圍繞ChatGPT的争議事件會發現,表面看,算力是影響OpenAI發展的瓶頸,但事實上,資料才是OpenAI能否繼續發展的助力和關隘。

“算力的擴容目前不會是提供服務的瓶頸,不難克服。”北京師範大學法學院博士生導師、中國網際網路協會研究中心副主任吳沈括對界面新聞表示。

“ChatGPT們當然需要新的監管規則,但現行的法規依然有效,在這個意義上,從資料切入是目前最紮實有效的監管方式。”吳沈括表示,無論是意大利、德國還是加拿大,他們本次監管切入點都是資料流轉。

“不過,意大利等國針對ChatGPT的監管舉措到目前為止,都不能得出技術本身是違法的結論。”吳沈括強調。

吳沈括進一步分析了歐美在ChatGPT監管中的不同站位,他指出,歐洲有嚴格的資料法規,從資料流轉角度切入得心應手,能夠反映歐洲關于數字主權、技術主權的核心立場,特别是針對美國企業,“這裡有一個數字經濟、數字發展的主導權問題。”

他判斷歐洲各國效法跟進的可能性較大,而美國方面,由于處于技術先發的優勢地位,對ChatGPT們的監管思路會更為寬松。

“美國和其他國家的監管思路必然出現明顯差異,因為這種技術存在本身,能放大其已有的資料優勢、算力優勢和算法優勢。”吳沈括直言。

他預計此後,ChatGPT們運算處理過程中的規則透明度、可解釋性,會成為監管關系的重點。

“這裡面的要害是資料收集彙聚,是否具有合法性,是否取得了當事人同意,是否屬于違法爬取資料;第二是加工處理角度,是否有超過、超越權利人授權;第三,關于資料處理運算結果的輸出,是否符合倫理的要求,法律規則和安全的要求,是否會帶來危害社會和公衆利益的結果。”吳沈括從三個層次概括了ChatGPT們要度過目前資料屏障的關鍵。

在移除資料屏障的過程中,OpenAI可能還面臨着一樁難題。

OpenAI已經面臨與自己的金主微軟之間尴尬的客戶競争,很多企業級客戶開始在OpenAI和Azure OpenAI中進行權衡。有觀點指出,OpenAI已經向Azure保留了一些模型,迫使很多公司直接和OpenAI合作,比如3月1日開始,OpenAI對外銷售其語音識别模型Whisper的通路權限,目前該模型仍不可用于Azure OpenAI服務。

亞洲地區大規模封号事件開始後,OpenAI的系統出現了部分問題,而微軟的Azure雲上所提供的OpenAI相關服務仍然保持穩定,客戶還可在運作與OpenAI相同的模型時獲得Microsoft Azure的安全功能。安全性,已成為微軟從OpenAI手上搶奪客戶的一大優勢。

接下來,OpenAI需要在紛繁複雜的線頭中厘清制約發展的真正瓶頸在哪兒。OpenAI的聯合創始人John Schulman給别人提出的建議也适用于其自身:選擇去解決什麼問題的能力比你本身擁有的技能更重要。

繼續閱讀