天天看點

​ChatGPT悄悄變懶, OpenAI還能加速跑嗎?

作者:钛媒體APP
文 | 矽基研究室,作者|kiki

無論是公開場合還是媒體爆料,盡管OpenAI創始人Sam Altman已多次劇透GPT-5的相關消息,但與這位創始人浮出水面的硬體、算力等野心相比,眼下最棘手的問題是—ChatGPT的一群忠實使用者們,正在發現GPT-4正在變得越來越「懶」。

所謂的「變懶」指的是ChatGPT的個人使用者體驗。近期,在OpenAI線上論壇上,不少使用者正在抱怨GPT-4性能下降,包括推理變差、響應變慢等。一位使用者甚至直言:“ChatGPT已經完全無法使用了,今天我在等待答案的同時居然煮了咖啡。”

與變懶的GPT-4相比,OpenAI對外正在講述更多的「既要又要」的商業化故事,加速變現。

一是在ChatGPT這一對話式産品上,一面尋找更多的個人使用者,如幾天前開放免登入使用,争搶更多的流量和資料。另一面則是面向企業端的商業化前景。ChatGPT首席營運官Brad Lightcap就在近期透露,已有60萬使用者正在ChatGPT的企業級産品(包括ChatGPT Enterprise和ChatGPT Team)。Brad Lightcap稱,92%的财富500強公司正在以某種形式使用ChatGPT,每周有1億人積極使用ChatGPT。二是圍繞硬體、算力和全球化上的布局。

對OpenAI來說,「既要又要」是某種必然,「模型變懶」也是其加速變現和跑馬圈地所帶來的直接結果。隻不過,對Sam Altman和他的OpenAI來說,至少在拿出GPT-5前,需要解決的問題和麻煩還有很多。

GPT-4又又又變懶了

“我曾經是一名OpenAI的布道者,總是告訴大家GPT有多棒以及該如何使用它。但現在我不再推薦它,因為它已經變得很難有效使用。”一位使用者近期在OpenAI線上論壇上這樣寫道。

​ChatGPT悄悄變懶, OpenAI還能加速跑嗎?

一些忠實使用者選擇放棄使用GPT-4 圖源:OpenAI論壇

今年3月中旬,在一篇名為《How to deal with “lazy” GPT-4》的文章下擠滿了OpenAI變懶的「受害者們」。他們發現在使用ChatGPT的過程中,響應速度越來越慢,且回答問題的準确性也不及預期。

​ChatGPT悄悄變懶, OpenAI還能加速跑嗎?

一部分個人使用者對OpenAI産生不滿 圖源:OpenAI論壇

有的人抱怨,GPT-4沒有遵循他們給出的指令,當使用者需要它給出完整的代碼時,GPT-4會給出帶有占位符(placeholders)的截斷代碼。當要求它給出用于更新代碼的示例時,也更容易出錯。有的人則發現,ChatGPT的廢話也越來越多,在被問及它的「來源」、它的背景以及它如何産生答案時,GPT-4現在變得更加難以捉摸。還有的使用者更是直接吐槽起了它的響應速度:“今天我在等待答案的同時居然煮了咖啡。”

​ChatGPT悄悄變懶, OpenAI還能加速跑嗎?

開發者抱怨GPT-4變懶 圖源:OpenAI論壇

事實上,這并不是ChatGPT第一次變懶。

早在去年7月,很多使用者就在社交媒體和OpenAI開發者論壇裡表達了自己的不滿,變懶、變笨的GPT-4出現了邏輯弱化、錯誤響應、難以遵循指令、隻記住最近的提示等問題。今年年初,更多的投訴下,Sam Altman直接承認了GPT-4「一直在偷懶」這一事實,并表示自己「已經釋出了修複程式來解決投訴」。

​ChatGPT悄悄變懶, OpenAI還能加速跑嗎?

Sam Altman承認GPT-4「偷懶」,圖源:X

眼下,這一輪的「變懶抱怨」似乎沒有等來OpenAI的回複。社群之内的ChatGPT使用者們正在讨論GPT-4變懶的原因以及自己尋找解決上述問題的方法。「它曾經很聰明,現在确實一個徹頭徹尾的白癡」「我感覺自己被騙了」,社群内的憤怒情緒正在增加。

對于「變懶」的原因,使用者甚至猜測OpenAI是不是将背後的模型偷偷換成了GPT-3.5,還有的則認為OpenAI正在将更多的精力放在其「企業級客戶」上,而非「平民」上。

使用者的抱怨和吐槽GPT-4性能下降其實反向印證了兩點,一是目前使用者對GPT-4已積累下使用者心智,他們迫切希望OpenAI推出新的産品。二是,這很有可能是OpenAI釋出的GPT-5的重要時機,AI天使投資人Allie K. Miller就表示:“他們(OpenAI)有使用者基礎,有訂閱,如果他們發現使用者下降,或許将釋出更新版本的模型,時機是關鍵。”

使用者尋找替代方案,OpenAI還有沒有餘糧?

對OpenAI來說,一個不太好的迹象是,随着GPT-4變懶,即便是它的忠實使用者們,也開始尋找替代方案。

在上述抱怨OpenAI變懶的文章下,不少使用者就提到了至少在編碼能力上,Anthropic的Claude Opus 3顯得可靠,在實際使用的性能方面似乎也與GPT-4 不相上下。在截至3月29日的Chatbot Arena排行榜上,Claude Opus 3就打敗了GPT-4,占據第一位置。

​ChatGPT悄悄變懶, OpenAI還能加速跑嗎?

截至3月29日,Claude Opus 3打敗了GPT-4, 位列第一 圖源: Hugging Face

在過去人工智能的模型競逐中,各類科技企業「追趕GPT-4」已成為共識,各類評測和跑分表中「與GPT-4對比」也成了鐵律。而Chatbot Arena排行榜的來源則來自使用者實打實的投票,在使用者體驗端Claude Opus 3暫時跑赢GPT-4,也說明了至少在個人使用者眼中,OpenAI所謂的使用者護城河并不牢固。

榜單之上,除了老對手Anthropic的Claude、谷歌的Gemini外,被稱為「法國OpenAI」,主打MoE架構的Mistral AI 的名字也赫然在列。此前Mistral-Medium這一「中杯版」模型就因開源和強大性能十分受開發者的擁趸,而此前在2月底釋出的「大杯版」Mistral Large更是直奔着OpenAI的GPT-4去,順便還官宣了和微軟的閉源合作。

前有狼後有虎,何時釋出GPT-5也還未有定論,OpenAI手中餘糧又還有多少?

OpenAI和Sam Altman自然也沒有閑着,剛剛結束的2024年Q1,這家全球最火熱的人工智能初創企業的日程表上寫了三件事:一是尋找AI的下一個入口,二是更大的算力野心,三是全球化之路。

首先,尋找AI的下一個入口,也就是OpenAI野心勃勃的硬體計劃。除了此前出圈的人形機器人Figure 01外,據外媒最新報道,Sam Altman正計劃和前蘋果設計師Jony Ive創立的一家神秘公司,推出一款人工智能驅動的個人裝置,更早前,Altman領投了AI硬體初創企業Humane,OpenAI也在讨論将其名為GPT-4 with Vision的物體識别軟體嵌入到Snapchat母公司Spectacles的智能眼鏡中。

其次,是更大的算力計劃。Altman此前在公開場合多次表明算力是掣肘模型進化的原因,AI伺服器晶片數量嚴重不足。為了尋求更穩定的晶片供應,除了自己下場投資GPU晶片公司和成立晶片公司外,OpenAI和「最鐵的盟友」微軟被曝出計劃砸1000億美元建造名為「星際之門」的AI超級計算機。

不過,在硬體和晶片計劃外,過去一年之中,OpenAI也還在下一盤全球化的棋局。

今年1月,Altman開啟自己的南韓之旅,與南韓晶片巨頭三星、SK探讨合作的可能。近期,Altman還前往日本與日本首相岸田文雄會面,并表示OpenAI正在考慮将日本作為其亞洲首個辦事處。奧爾特曼在東京對當地記者表示:“看到這項技術在日本得到采用真是令人驚奇。”據「矽基研究室」不完全統計,除日本外,OpenAI目前在倫敦和都柏林分别設立了國際辦事處。

更大的野心面前,有更棘手的新麻煩

不過,在GPT-5以及種種野心計劃外,擺在OpenAI眼前的,還有諸多需要解決的新麻煩。

如上文提到的「模型變懶」,OpenAI究竟是繼續縫縫補補舊模型,還是提早放出GPT-5的大招,還尚未确定。

另一個新麻煩則是資料問題。視訊巨頭YouTube就在近期開戰OpenAI,其表示,如果OpenAI在未經許可的情況下使用其視訊來開發文生視訊模型Sora,将違反YouTube的規則。OpenAI首席技術官Mira Murati在接受采訪時表示,她不知道Sora是否接受過YouTube視訊訓練,公司也沒有透露資料來自哪裡。

《紐約時報》在近期的一則報道中,揭開了OpenAI上述資料的來源。時間撥回2021年底,OpenAI需要更多的資料,為此研究人員建立了一款名為Whisper的語音識别工具,該工具可以轉錄YouTube視訊中的音頻,生成新的對話文本,盡管一些的OpenAI員工讨論了此舉可能違反YouTube的規則,但最終還是轉錄了超過100萬小時的YouTube視訊。OpenAI并未立即回應上述媒體的評論。

大算力與大資料的Scaling Law奠定了OpenAI所有工作的基礎。但如今,資料的擷取與使用問題是包括OpenAI在内的人工智能企業必須要面臨的問題,這涉及兩個層面,一是商業層大公司間的競争,更優質的使用者資料決定模型的性能。二是社會層的使用者隐私問題,這些科技公司必須要為使用者隐私的安全性負責。

資料問題外,不可忽視的還有人們對科技公司情緒的變化。據《The Information》資料,目前人工智能初創企業估值可能正在從峰值回落,回歸現實。初創公司市盈率的下降反映出人們對人工智能初創公司前景并沒有想象中那麼樂觀。更多投資者想要知道的是,随着業務邊界的拓展,當這些初創企業拿到更多的錢時,除了如何花錢外,它們如何賺錢,如何應對更激烈的競争,這些問題顯得更為重要。

​ChatGPT悄悄變懶, OpenAI還能加速跑嗎?

對OpenAI來說,他們或許更需要回應GPT-4變懶的問題,更好的産品體驗依舊是核心護城河。正如論壇内一位使用者所言:“如果有更好的産品,我會像在燃燒的船上一樣跳船。”OpenAI在造一艘更大的船,但它的使用者此刻可能正在選擇離開。

參考資料:

  • 1、Business Insider:Uh-oh — it looks like ChatGPT's AI model got lazy again
  • 2、The Information:AI Valuations May Be Coming Down to Earth; A Glimpse of OpenAI’s Search Engine
  • 3、The New York Times:How Tech Giants Cut Corners to Harvest Data for A.I.

繼續閱讀