天天看點

ChatGPT也漲不動了

作者:i黑馬
ChatGPT也漲不動了

來源:深燃(ID:shenrancaijing),作者:李秋涵,編輯:魏佳

你還在用ChatGPT嗎?

在全球掀起AI熱潮的ChatGPT,似乎進入了瓶頸期。

首先是關于ChatGPT的使用率,有不利的資料出現。6月初,摩根士丹利釋出的一項調查顯示,隻有19%的受訪者表示他們之前使用過ChatGPT,隻有4%的人表示依賴ChatGPT。調查表示,比例低的驚人。

這項調查在今年4月進行,涉及人數為2000人。不過,在全球78億人口面前,這樣的樣本量不算大,也一定程度上降低了其參考性。

還有一個基數更廣泛的資料值得關注,ChatGPT的增長已經明顯放緩。

根據網站資料分析工具SimilarWeb資料,前期ChatGPT的通路量增長率驚人,1月份的環比增長率為131.6%,2月份為62.5%,3月份為55.8%,在4月份明顯放緩,環比增長率為12.6%,到了5月,這個數字已經變為了2.8%。

随着ChatGPT普及,參考基數變大,增長率放緩是正常現象,不過,根據目前已有的趨勢來看,6月的環比增長率也有可能為負數。

今年年初,ChatGPT像一聲驚雷,讓全球見識到了生成式AI的威力,也讓背後的GPT(生成式預訓練Transfomer模型)大火,掀起大模型創業潮。它重新整理了很多數字,最讓人印象深刻的,是史上使用者增長速度最快的消費級應用,在推出僅兩個月後,ChatGPT的月活使用者已經突破了1億。

但對它未來的發展,即便是創造者也很難給出明确答案。此前OpenAI董事會成員海倫·托勒就曾表示,“甚至創造它們的人也不知道它們能做什麼,不能做什麼。我預計,我們真正了解GPT-4能做和不能做的所有事情,可能還需要幾年時間。”

ChatGPT現在的天花闆,不代表就是GPT的天花闆,但作為目前最厲害的大語言模型支撐的産品,ChatGPT的走向,也能成為觀察GPT應用的一個視窗。關于AI的狂想還在繼續,時間已經過去了近半年,我們好奇的是,ChatGPT的使用情況到底如何?它被高估了嗎?

01 ChatGPT真的很多人用嗎?

對于ChatGPT的使用體驗,不同行業、不同人答案不同。有人把它當玩具,使用了一兩次後就不再登入;有人努力把它變為工具,在工作中以提高效率;也有人,在努力将ChatGPT變為工具的過程中失敗了,因為覺得它“不夠好用”。

夏楠屬于第三種。她從事外貿行業,會用ChatGPT寫工作郵件,也會讓它解答一些生活中的煩惱,為了能更好的使用ChatGPT,她都是用英文發指令。

從2月開始使用ChatGPT,她的體驗分為了三個階段,最開始是好奇,很多問題都想抛給ChatGPT,看它怎麼回答,探索它。從5月開始,她感覺ChatGPT“變笨了”,之前能做到的,現在做不到了。現在,她對ChatGPT的評價是,“不好用”。

比如最近,他們公司接了一個炒菜機器人的ODM(原始裝置制造)業務,她想讓ChatGPT提供這個市場的預測資料,在反複推拉後,ChatGPT還是沒有給她答案。而在寫工作郵件上,經過調教,ChatGPT也隻給到她一個指令式的跟進郵件,文字官方式的長篇大論,也不是她想要的,她希望“它能寫出有禮貌的,資訊表達很明确的郵件”。

她覺得,ChatGPT之是以做不到,短闆在于“不懂得人情世故”。得不到想要的結果,她的使用頻次也降低了,從一個星期五六次變為了一周一次。

當然,之是以會有這樣的體驗,背後綜合影響因素很多,和使用者是否問到了ChatGPT擅長的領域有關,也要看使用者有沒有找到與ChatGPT合适的交流方式。

正在澳洲生活的Lucy,從去年底ChatGPT一推出後就開始用英文使用它。現在,她日常用ChatGPT來整理學術研究上的思路、學習語言,是生活裡必不可少的工具。隻是,準确性的問題一直讓她煩惱,文獻參考需要自己找,“如果我質疑它的回答,它就會順着我的思路回答”。

除了ChatGPT的使用體驗感受不一,從資料來看,ChatGPT的普及率,暫時也還沒有想象中的廣。

ChatGPT也漲不動了

摩根士丹利相關報告截圖

除了摩根士丹利的報告,還有一些資料可以作為佐證。根據SimilarWeb資料,3月-5月,美國、日本是全球為ChatGPT貢獻流量份額最高的國家,分别位列第一、第三。不過,最近,美國的流量已經下滑了10.28%。

ChatGPT也漲不動了

ChatGPT的全球流量分布 來源 / SimilarWeb資料

美國方面,在5月底,皮尤研究中心釋出了一份調查,他們在今年3月中旬在1萬多名美國成年人當中展開調查,18%的人聽說過很多關于ChatGPT的事情,39%的人聽說過一點,42%的人根本沒有聽說過。

而在日本,根據日本ICT市場調查咨詢機構MM總研的最新調查報告,5月24日-31日期間,以日本及美國企業所屬的13814名員工(其中,日本13412人、美國402人)為對象,進行的網絡調查結果是,日本企業的ChatGPT使用率僅7%,與美國企業的51%使用率相比,兩者相差高達44個百分點。

日本企業中,近半數員工(46%)回答“不知道”ChatGPT,而即便知道ChatGPT,但回答“未使用”的比重也達42%。

這些都是最近的報告,樣本量在1萬人左右。不過ChatGPT大熱後,全球關于它的使用報告衆多,觀點不一,甚至有的得出的是相反結論。上述報告有一定參考性,但也因地域和人群的差别,不一定能完全反應真實情況。

還有更明确的值得參考的整體性資料,可以幫助我們認識ChatGPT的應用現狀。

根據SimilarWeb,ChatGPT增長明顯放緩,尤其到6月,截至6月20日,6月已經過去三分之二,通路量比5月少了38%左右,粗略推算,到6月31日如果沒有特别新的刺激,6月的環比流量或将下降。

ChatGPT也漲不動了

ChatGPT近期流量變化 來源 / SimilarWeb資料

同時,還可以參考的是,根據SimilarWeb,在5月,ChatGPT的跳出率是12.59%,低于谷歌、Youtube等,而在6月24日,跳出率已經上升到37.37%。平均通路持續時間也從8分32秒,下降到7分48秒。

另一個資料是,接入GPT大模型後Bing的市場佔有率變化。

ChatGPT也漲不動了

來源 / Statcounter

Bing的市場占有率,在二三月份剛引入GPT時引發關注,根據網站通訊流量監測機構Statcounter,2023年3月Bing的市場佔有率是2.86%,5月是2.77%,不僅占比沒有提高,甚至還有下降趨勢。

02 是什麼限制了ChatGPT?

關于ChatGPT應用上的問題,已經老生常談,不過這些問題對它應用普及上的影響,或許比想象中廣。

首先是“變笨”這件事。

6月初,“ChatGPT變笨了”的聲音引發過讨論。不過OpenAI開發者推廣大使Logan Kilpatrick曾出面回應,表示自3月14日釋出GPT-4以來,大模型的本體一直處于靜态,不存在大量外部資料污染模型的情況。同時他也承認,大模型本身存在不穩定性,是以對相通的提示詞,存在回答前後不一緻的情況。

一位AI從業者告訴深燃,5月就有國外從業者在OpenAI論壇裡分享論證GPT變笨的文章。最近,他用GPT-4的API做了測試,讓它做簡單的計算題。從結果準确度來看,GPT-4-0314取得了滿分,GPT-4取得了80分,GPT-4-0613,勉強可以拿50分。其中,0314、0613即指3月14号、6月13号的快照(指整個系統在某個時間點上的狀态)。這個結果,給他一種GPT-4在被削弱的感受。

根據監管機構NewsGuard的專家分析,OpenAI最新版本的GPT-4,在輸出資訊方面,比GPT-3.5要糟糕。在今年3月份釋出的報告中,NewsGuard提到,GPT-4不僅在其研究人員的提示下回答了完全虛假的新聞叙述,而且比GPT-3.5回答的内容更差。

在上述AI行業從業者看來,這樣變化的結果是,使用者需要變得更為具體和主動地引導GPT-4,才能獲得與過去相當的回答品質。

這也再度影響ChatGPT的使用門檻,而這與ChatGPT的初衷有所背離。

最開始ChatGPT爆火,就有業内人士對深燃分析,它帶來的影響是将通用人工智能放在了每個使用者面前,也把人機互動的門檻,打到了最低點。

但目前來看,門檻還是存在。從ChatGPT的使用者畫像,也能看出這個産品的普及情況。根據SimilarWeb資料,使用者主要分布在計算機電子與技術行業,其中,程式設計和軟體開發占比最大。其他行業裡,隻有遊戲行業中的視訊遊戲機和配件的從業者占比較多。

在使用ChatGPT的體驗上,一位工程師給深燃的回報最為積極,表示一直在用,“能幫我解決小的程式上的問題”。

盡管都說,“淘汰你的不是AI,是會用AI的人”,如果普通人使用起來門檻越來越高,那也一定程度上脫離了ChatGPT的初衷。

還有兩個問題,是ChatGPT從最開始就面臨的質疑,即準确率和隐私保護。

根據上述日本相關機構的報告,在被問到今後若要繼續/擴大使用ChatGPT,需要解決什麼問題時,日本企業、美國企業分别有高達49%、45%的回答是“案件的精度”,其次為“個人資料等隐私(日企34%、美企35%)”,和“對問題的了解程度(日企33%、美企34%)”。

準确度方面,OpenAI的CEO山姆·奧特曼,也做出過解釋,這個程式會自信地宣稱一些東西是事實,但其實它是編造出來的,就像謊話連篇的政客一樣。他給這種現象起了個名字——“幻覺難題”。

總之,準确率要實作起來非常不容易。原因就是因為它不是靠記憶,而是憑借演繹推理能力來工作。“大語言模型靠的是推理的拼字遊戲,不可能像資料庫一樣完全準确,人也不能完全保證準确”,關注AI行業的工程師楊陽告訴深燃。

隐私方面,OpenAI至今還沒有給出明确的解決方案。在加拿大工作的小虹就告訴深燃,公司特地發郵件通知,讓大家謹慎使用ChatGPT。

基于這些限制,ChatGPT的應用場景也受限制。

關注産業的投資人陳默默告訴深燃,它其實适合“生産力驅動”的内容生産,而不是“創意驅動”的内容生産,在前者上,能替代不少有重複經驗累積的人力。

使用者洛洛從4月開始使用ChatGPT,她開了會員,主要用于寫腳本和文案,“隻要能給它正确的公式,基本可以回報給我任意思維的腳本,隻是拿到手要改”。她表示,産出的腳本比較基礎,沒法做成爆款,但它邏輯沒有問題,“像公司日常的一些大量的視訊輸出,是可以支援的”,她現在的ChatGPT使用頻率,基本上一周3次以上。

現在夏楠調整了政策,隻問它一些流程式的問題,比如開ebay網店的流程。盡管這類問題也可以問谷歌、百度,但“ChatGPT的回答更好”,她舉例,最近她去德國旅行,讓ChatGPT給她安排旅遊計劃,給出的答案有參考性,交通安排的也很清楚。

這些長期使用ChatGPT的使用者,不論對ChatGPT的使用體驗滿意與否,他們都提到,ChatGPT更像是一個更新了的谷歌、百度,帶來了一定助力。

03 ChatGPT,象征意義高過實質意義?

最近,OpenAI推出了類似于LLM版的App Store,加速生态的建設,還被曝光了一些功能上的優化。這背後也隐藏着一個信号,GPT4暫時已經到天花闆,要加速生态建設,在GPT5出不來之前,先做一些體驗上的優化。

早在4月,山姆·奧特曼就表示,還沒有開始研究GPT-5,也沒有立即開始的打算,還曾表示,“大型模型時代已經到頭了。”

據OpenAI官網,GPT模型參數數量(可以了解為喂養模型的語言材料)在不斷提升。GPT-1是1.17億,GPT-2有15億,到了GPT-3,飙升至1750億,GPT-4,根據國外媒體機構Semafor的一份報告,比GPT-3大六倍左右,具有1萬億個參數。

此前楊陽也對深燃表示,或許GPT-4就成長到頭了,語料是一個原因,“人類曆史上創造出的優秀資源就這些了”,模型本身的限制也是一個原因。在他看來,現在GPT-4被限制了,應該有能力沒有被完全開發出來。

近日,Facebook母公司Meta首席人工智能科學家Yann LeCun就指出,ChatGPT背後的生成式人工智能技術已進入了死胡同,擁有太多的局限性。

出于巨頭間的競争關系,或許很難将這話作為客觀參考。但可以肯定的是,ChatGPT的确遇到了瓶頸。

要讓大語言模型有更好的應用,不少人把視線投向垂直領域的應用上。

AI行業從業者秦凱對深燃做了一個比喻,ChatGPT這類泛化型的人工智能,應用寬泛時,能力就像是高中生、大學生,和垂直場景結合時,fine-tuning(在自然語言進行中使用的技術,也叫微調)的資料足夠精确和貼合場景,能力就能變為碩士、博士,能解決更具體的需求。

楊陽也認同這一看法。他提到,目前的模型最多隻能進行一倍左右的優化,“大家有一個基礎共識,GPT-5來了,也不會帶來颠覆性的進化”,短期内不可能達到AGI(通用人工智能)水準。

不過,他表示,現在做具體垂類應用,首先是費用高,訓練模型對公司來說依舊是不小的成本;其次是資料安全、資料隔離的問題,目前采用的辦法是,“在大模型基礎上套小模型”,但帶來的問題是,現在的底層技術還在變化,“沒有人知道下一個模型,更優秀的模型什麼時候出現”,這個中間階段讓大家很迷茫,“如果三五年後才出現,那現在基于大模型做垂類的産品是不虧的,場景落地後有機會回收資金。但如果很快就出現了,那大家現在做的外挂型垂類産品,是沒有多少意義的。”

投資人陳默默表示,這是一個“先有雞還是先有蛋”的問題,他們還是願意去看相關項目,在細分領域裡切一個特定場景的應用,因為“哪怕未來的底層有變化,隻要行業沒有變動,在應用層的行業了解上還是會有沉澱”。

但他們在看項目時遇到的問題是,很難有人可以明确告訴他們,産品能節省多少人力成本。“看下來,還是得給機器配個人”,她舉例,關注賦能研發端論文篩選歸納相關的垂類産品,實際使用也還是需要一個人順着機器的結果,再做進一步驗真、開發和研究,實際上很難說效率有特别好的優化”,是以現在,一些投資人都會傾向于再觀望觀望。

在關注垂類領域的AI創業公司的産品時,她的感受是,“我們對技術帶來的産業更新機會保持謹慎樂觀,目前可能它的市場意義,高過實質意義”。

秦凱總結,人們對ChatGPT的期望過高,但有兩個瓶頸。首先,下一代大語言模型通過更大的參數規模和更強算力的收益邊際遞減,人們的期望可能無法很快滿足。其次,目前的大語言模型是泛化的,需要很長時間來解決特定、真實的問題。目前垂直領域的生成式AI,已經變成了針對具體企業做定制化需求和私有部署的體力活,“底層模型依靠transformer方式缺乏解決非常複雜問題的能力,現在的應用情況與預期的水準相距甚遠”。

應用還在繼續,技術還在發展,關于ChatGPT的應用及潛力還需要再觀望。即便是這樣,ChatGPT已經讓一些人的生産效率,有了一個數量級的提高,即便當下有瓶頸,“ChatGPT已經是很偉大的産品,這就夠了。”楊陽表示。

*題圖來源于unsplash。應受訪者要求,文中夏楠、Lucy、楊陽、小虹、洛洛為化名。

[本文作者深燃,i黑馬授權轉載。如需轉載請聯系微信公衆号(ID:shenrancaijing)授權,未經授權,轉載必究。]

繼續閱讀