天天看點

GPT-4,你若安好 ,那還得了!

作者:特大号

一覺醒來,GPT-4刷屏了,這個場面怎麼說呢,有點混亂。吃瓜群衆一邊津津樂道,一邊瑟瑟發抖。

津津樂道的是那些革命性的新功能,瑟瑟發抖的是矽基人距離取代碳基人又前進了一步。

GPT-4,你若安好 ,那還得了!

那麼,相比上一代模型,GPT-4都有哪些變化呢?

早上已經刷屏很多了,我們就簡單概括幾點↓

❶ 它能看圖說話啦

GPT的前序版本,隻是NLP(自然語言處理)模型,隻能處理文本資訊。

而GPT-4是一個多模态模型(multimodal model),不僅可以接受文本,現在也可以接受圖檔輸入了,然後輸出文本結果。

比如,我們可以甩一張圖給它,讓它叨逼一下這個圖的梗兒在哪兒。

因為目前還沒有實測的入口,是以隻能看官方的例子↓

GPT-4,你若安好 ,那還得了!

看懂沒?使用者給了一張“VGA蘋果手機充電線”的組合圖,讓GPT-4逐條指出“笑點”,很明顯GPT-4回答的不錯,它真看懂了。

如果是我做測試demo,我就讓GPT-4來玩「找不同」,那豈不是更加直覺。

GPT-4,你若安好 ,那還得了!

其實這還沒什麼,更牛啤的是官方釋出的開發者Demo視訊↓

你可以在紙上畫一個非常簡陋的網站UI草圖,就像下面這樣。

GPT-4,你若安好 ,那還得了!

然後,用手機拍照,上傳給GPT-4,要求它根據這個草圖,生成詳細的HTML和JS代碼。

Demo中的指令是:。

GPT-4,你若安好 ,那還得了!

然後,GPT-4就像一個熟練的前端工程師,瞬間把代碼給寫了出來,看到這裡,我都有點方了。

GPT-4,你若安好 ,那還得了!

之前,ChatGPT能幫助碼農寫代碼,幫助網工敲CLI我們已經見怪不怪,畢竟代碼也好,網絡配置指令也好,本身複用率就比較高,隻要訓練到位,幫你寫點示例沒啥困難。

比如,這是某次我無聊讓ChatGPT幹的事,其實并沒有啥技術含量↓

GPT-4,你若安好 ,那還得了!

在這種狀況下,如果我們需要讓ChatGPT輔助我們真正完成一件工作,需要非常詳細的一步步寫出“Prompt”,其實這很考量提問者的專業能力和技巧。

可是現在,如果GPT-4真正具備了識圖、讀圖能力,那真是太可怕了↓

雖然GPT-4的識圖能力還有待檢驗,但這一天看起來并不遙遠。

GPT-4,你若安好 ,那還得了!

❷ 它是加州小鎮做題家

官方給了一組GPT-4刷題的成績,雖然說它是超級學霸還為時尚早,但某些科目的成績已經相當逆天了。

GPT-4,你若安好 ,那還得了!

看這成績,最牛掰的是生物奧林匹克競賽考試和GRE考試,都擊敗了99%的參考者。

律考也很厲害(Uniform Bar Exam),排位能達到前10%。而GPT-3.5參加律考,隻能排到倒數10%。

刷其他題也不含糊,比如SAT數學,可以考到700分(相當于92%分位),而GPT-3.5的水準是590分(大約相當于70%分位)。

GPT-4,你若安好 ,那還得了!

結合上一項識圖能力,我覺得更加終極的考試場景是↓

你拍一張“黃岡密卷”給它,它就直接把答案給你寫出來了

GPT-4,你若安好 ,那還得了!

❸ 它比以前更難忽悠了

以前在使用ChatGPT(基于GPT-3.5)的時候,經常會得到一些讓人啼笑皆非的答案,甚至是與事實相悖的。

或者你可以通過給它“洗腦”,讓他給出錯誤的答案。

比如下面這個問題,第一次回答就有明顯錯誤,你可以進一步忽悠它。

GPT-4,你若安好 ,那還得了!

接下來,我把ChatGPT的模型換成GPT-4,再問同樣的問題,這次答案看着靠譜了許多,看來做了不少功課。

GPT-4,你若安好 ,那還得了!

但是如你繼續忽悠它,還是能把它忽悠瘸。

根據官方的介紹,GPT-4相比GPT-3.5,針對9個大類的問題,事實準确率還是有了極大的提升。

以前的版本,普遍低于60%。

GPT-4,你若安好 ,那還得了!

當然,目前的缺陷仍然比較明顯,也就是說,我們針對ChatGPT/GPT給出的答案,還需要進行細緻的人工稽核。

比如下面這個,就非常荒唐了。我信你個鬼!

GPT-4,你若安好 ,那還得了!

❹ 它比以前更貴了

GPT-3.5版本,API的價格是0.2美分/1000字(token),而到了4.0版本,價格暴漲,變成:6美分/1000字(token)

可能訓練個模型成本太高吧,而推理的成本也不會滴,不過相信這個價格後面會逐漸降低的。

另外,GPT-4支援的輸入文本長度大大提升了,最高可以到32000(token)。

這個還是很有用的,你想讓它幫忙校對一篇文章,或者幫你檢查一段代碼中的bug,以前可能要分成很多段來輸入輸出。

現在,誇張一點,Ctrl+A/Ctrl+C/Ctrl+V,就可以等結果了。

❺ ChatGPT Plus使用者有福利

這一次,對于ChatGPT Plus使用者來說,每月20刀的訂閱費沒有白花。可以搶先試用GPT-4模型,登入以後,可以在3種模型之間靈活選擇切換。

GPT-4,你若安好 ,那還得了!

而且,官方也非常直覺地給出了三種模型的差别:

預設的付費版GPT-3.5,響應速度5星,推理邏輯性3星,簡潔性2星

免費版的GPT-3.5,響應速度2星,推理邏輯性3星,簡潔性1星

GPT-4體驗版,響應速度2星,推理邏輯性5星,簡潔性4星

GPT-4,你若安好 ,那還得了!
GPT-4,你若安好 ,那還得了!
GPT-4,你若安好 ,那還得了!

我在ChatGPT裡試了一下GPT-4模式,确實有點卡,而為了防止廣大熱心吃瓜群衆過多請求,官方還做了限制:每四個小時,最多響應100條資訊。

而且因為圖檔輸入的模式隻是預覽,是以ChatGPT的GPT-4模式也隻能輸入文本。

GPT-4模式還有個問題:它的訓練資料集跟GPT-3.5一樣,還是截止到2021年9月。

也就是說,GPT-4有個更聰明的腦子,腦回路更清晰,但是它的知識結構還是跟以前一樣的。書讀的不多,還是那些陳芝麻爛谷子。

GPT-4,你若安好 ,那還得了!

好了GPT-4的瓜,我們就先吃到這裡吧。

總體感受是,現在說人工智能的奇點已到,還為時尚早,但大家太需要一個突破口了,是以才會“”。

但我們真的需要那麼多大模型嗎?

大模型太多,客戶場景有點不夠用了