天天看點

除了模型,GPT 們還在卷什麼?

作者:人人都是産品經理
ChatGPT的問世讓大模型成為了業内關注焦點,無論是大廠還是中小企業,或者獨立開發的開源程式員,都在大模型上鉚足了力。除了關注模型本身,關于AI,他們還關注在哪些領域?本文作者對此進行了分析,希望對你有幫助。
除了模型,GPT 們還在卷什麼?

ChatGPT 問世後,各大公司都在「大模型」上下了苦功,模型能力也成為大家最關注的話題。ChatGPT 雖直接定義了基于大模型的生成式對話機器人這個産品類型,其模型的強大也導緻大家都忽略了它在産品使用上的問題。

其實不管是底層模型開發的大廠還是專注于應用層的小廠,又或者是開源的獨立開發者,都在模型能力之外的産品體驗上暗自較勁,以不同的姿态參與到這場能夠定義新的人機互動方式的對話革命中來。

那除了模型,他們還在「卷」些什麼?

一、大廠:專注模型,體驗略顯「簡陋」,主打一個 less is more

1. ChatGPT:三件套架構定義極簡

ChatGPT 作為行業标杆,直接定義了生成式對話機器人行業标準。免費版本的 ChatGPT 早期隻有對話、對話管理以及簡單的主題設定功能,靠着模型能力席卷全球。随着使用者的增多和抱怨,ChatGPT 的産品經理也坐不住了開始逐漸增加一些功能。

最令人深刻的當屬 Upgrade to Plus,牢牢霸占左下角的設定頁,一眼望過去隻有兩個字,「充錢」。除此之外,ChatGPT 也逐漸增加了主題設定、隐私管理等功能,但仍然突出一個克制,頗有小龍哥真傳。

除了模型,GPT 們還在卷什麼?

付費版 ChatGPT 主要的差別在于增加了模型切換的按鈕,以及在設定中增加了 Beta Features 的功能,可以使用聯網搜尋功能 Browsing 或者使用其他插件。

2. Bard & Bing:非差異化競争

三巨頭的剩下兩家 Google Bard 以及 Bing Chat 也都各有各自的風格,但總體上還是維持着極簡風。

Bard 的功能設計邏輯與 ChatGPT 幾乎一緻:對話功能為主,融合必要的對話管理、賬戶管理以及界面設定功能。作為搜尋大拿,Bard 在對話的基礎上也引入了搜尋的功能,能夠自然地根據問題引入搜尋,并呈現融合處理過的結果,體驗上更加 up to date。對于天氣、實時資訊的查詢都表現良好。

大模型在生成答案時會有多個答案并且有相應的權重,Bard 的「檢視其他答案」功能給使用者提供了更多選擇,當我詢問北京市天氣的時候,它甚至給出了文字版本、表格版本和極簡版本,非常驚豔。

值得一提的是,Bard 的回答生成在互動方面是一次性生成而非打字機模式(文字一個一個出現,有打字機效果,參考 ChatGPT),缺乏了生成過程,體驗上感覺不夠絲滑。

除了模型,GPT 們還在卷什麼?

與 ChatGPT 和 Google Bard 不同的是,Bing Chat 的定位是基于搜尋的,它的工作原理是從輸入中總結搜尋關鍵詞進行搜尋,然後對搜尋結果進行總結。每一條回複都會引用相應的來源,這同時導緻它在創造力方面更缺乏,但是來源可考、保證了準确性。

Bing 同樣也是極簡風,整體的産品界面設計與其他兩家差別不大,但色彩上明顯更活潑一些。功能上最開始甚至連對話管理的功能都沒有,聊完了您就清空,不留下一絲痕迹。後來才增加「最近活動」的功能,使用者能夠看到自己最近的對話。

Bing 唯一的特點在于設定了三種對話樣式:更有創造力、更平衡、更精确,能夠根據此參數确定模型是更精确還是更有創造性,這與 GPT 模型中的進階參數 Temperature 是對應的。然而因為無法同時對比幾個模式,在使用體驗上使用者很難感受到差别,即使是更有創造力的選項,受限于 Bing 更偏向搜尋的定位,搜出的結果依舊缺乏創造力。

對比下來,三巨頭比拼的主要還是模型能力,目前 ChatGPT 還是比較領先;Bard 比較好地融合了搜尋和生成兩種模式,體驗上是更優秀一些,Bing 則缺乏使用上的亮點,但靠着一句 GPT-4 模型就足以吸引大部分使用者。

二、中小廠:深耕體驗,能力之上體驗狂卷

不同于大廠卷模型能力,中小廠和個人開發者們更多将注意力放在了模型層上的應用層,依托各家大廠的底層模型能力,在功能和體驗方面卷的飛起。

1. Perplexity:基于搜尋的 AI 對話産品該怎麼做

首先要說的就是 Perplexity,一家對話式的搜尋引擎,體驗上可以說是完爆 Google Bard 和 Bing Chat。Perplexity 翻譯為「困惑度」,是人工智能領域用來描述語言模型效果的一個常用名額,模型困惑度越小,說明模型越強大。Perplexity 是一家隻有 14 個員工的小型跨學科團隊,但在産品力上可以說是完爆大廠,堪稱 more is more 的典範。

除了模型,GPT 們還在卷什麼?

在基本的 ChatGPT 式對話架構三件套基礎上,Perplexity 融合了垂直領域搜尋(學術、YouTube、Reddit、Wolfram 等)、搜尋曆史、搜尋熱榜、以及 Copilot(類似 AutoGPT)等功能。UI 設計采用了傳統的搜尋布局,對話框在螢幕偏上方,而非對話類架構輸入框在下方的模式,讓人一眼就知道,這個産品是更「搜尋」的産品。

從這點上來說,Perplexity 比 Google 和 Bing 更加突出了自己的搜尋定位,旗幟鮮明、定位清晰。産品的邏輯則與 Bing 類似,是對搜尋結果的總結(summerize),通過多次使用感覺對文獻的引用更加全面,比 Bing 更加具有創造性一些。在多輪對話當中,Perplexity 還增加了相關話題,預測了根據答案你可能會有的其他疑問,順利的話隻需要問一次,剩下的問題靠點選就可以解決了,體驗上很順暢。

對于「如何成為一名少數派作者」,筆者分别對 Perplexity 和 Bing Chat 做了測試,從回答的内容來說,Perplexity 的内容更加詳實,參考來源更多,同時搜尋後的界面在延伸閱讀、follow up 提問以及排版優化上,都比 Bing Chat 體驗要好。巨硬果然是拿腳做産品。

除了模型,GPT 們還在卷什麼?

2. Poe:「美國知乎」的縫合怪

Poe 是「美國知乎」Quora 推出的官方 AI 聊天應用,接入了 GPT-3.5、GPT-4、Claude、Midjourney 等多種 AI 服務,是目前最官方的「AI 縫合怪」。

其最大的營銷點:可以免費使用 GPT-4 和 Claude Instant,然而點進去你就會發現 GPT-4 每天隻能用 1 次、每個月可以使用 30 次,隻能說是聊勝于無吧。另外除了縫合之外,其單個服務的産品體驗非常簡陋,幾乎隻有對話功能,長期使用體驗較差。

其官方的 AI 對話助手 Sage 在使用體驗上沒有什麼獨特之處,應該也是用了 GPT-3.5 之類的模型。

除了模型,GPT 們還在卷什麼?

3. Forefront:ChatGPT 最佳代替品

免費 GPT-4 幾乎是所有套殼應用最有效的宣傳方式,隻要你有這個功能,哪怕是每天隻能用 1 次,你都能騙來一大波流量(鞭屍 Poe)。

而 Forefront 幾乎做到了 GPT-4 的全免費。它來自一個 GitHub 項目,通過逆向工程 Poe、Bing 等使用了 GPT-4 的大廠,為普通網友提供免費的 GPT-4 連接配接,在 GitHub 上狂砍 3.7 萬星标,幾乎是最近增長最快的項目。

Forefront 内置了豐富的人格預設,能夠滿足使用者多樣化的使用需求。人格化預設來自一個經典的 prompt 技巧:讓 ChatGPT 扮演某一種角色,這樣它的回答能夠更加準确。Forefront 可以一鍵選擇超多人格,達芬奇、喬布斯、軟體開發工程師等,提供了豐富的場景模闆,程式設計幫助、創意寫作、學術研究等場景都可以滿足。

除了模型,GPT 們還在卷什麼?

三、套殼應用:細節爆炸,深度玩家福音

說完了官方主力軍們,接下來介紹一下依托于官方 API 的各種套殼産品。它們主要是在模型能力上對前端互動進行優化并增加了一些輔助功能,使用者可以将自己的 API 填入并使用。

這類産品更适合深度體驗者以及當成生産力工具,能夠定制化的細節非常多。

1. ChatBox:多平台用戶端之王

ChatBox 是目前最成熟的多平台 AI 聊天用戶端,使用者可以自主可以接入 ChatGPT、Azure ChatGPT 服務、Claude API 等,在 GitHub 上獲得了 11.7 萬星标,橫掃用戶端界。對于對用戶端有執念的使用者,它也是 Windows 上最好的選擇。

ChatBox 的架構也是基于 ChatGPT 的三段式架構,但每個部分都增加了更多功能,滿足多樣化的效率使用體驗。它在對話管理功能中還設定了多種預設 pormpts,包括軟體開發、私人助理、誇誇機等模式。

在設定中,ChatBox 也支援進階參數和更詳細地資訊顯示:首先可以自定義 temperature 參數,調整模型答案的随機性、創造性;同時可以顯示 API 的 token 用量,可輸入輸出的 token 數量估計,以及調整文字大小、預設語言等功能。用下來應該算是 Windows 上用起來體驗最好的用戶端。

除了模型,GPT 們還在卷什麼?

2. MacGPT:如果隻能有一款 GPT 用戶端,那就是 MacGPT

至于為什麼 ChatBox 隻能是 Windows 最好用的桌面用戶端,因為 Mac 平台上有更卷的産品:MacGPT。

得益于 Mac 系統的特點,MacGPT 支援 5 種模式:Web、API、工作列模式、全局呼出以及 Intext。任何場景都能夠滿足需求。

Web 模式相當于一個簡版浏覽器視窗,整個使用體驗與 ChatGPT 一緻;API 模式體驗與 ChatBox 類似,相當于一個本地的 Mac 用戶端;工作列模式可以支援從工作列喚醒并且随時開啟對話,依托于工作列可以保證在任何場景下都可以快速啟動 ChatGPT,非常高效;全局呼出模式則支援通過熱鍵呼出置頂的對話欄并立刻展開對話,用過 Alfred 應該都能明白這種體驗是多麼流暢。

除了模型,GPT 們還在卷什麼?

Intext 模式更是 amazing,簡直是文字工作者的大殺器。當你在任何文本輸入的環境(備忘錄、Word 等)中打出 /gpt,随後的内容就會被作為 ChatGPT 的輸入,并且直接在目前文本環境中生成回答,完全無需切換應用就能使用 ChatGPT 進行問答,并且直接插入到文檔中,簡直就是 Notion AI 的全局版本,必須吹爆。

除了模型,GPT 們還在卷什麼?

3. ChatGPT-Next:每個人的雲服務 AI 助手

如果一定要選一個 Web 端 ChatGPT 的套殼用戶端,那我願稱 ChatGPT-Next 是個人助理之王。

它的作者不僅開發了這個 Web 端應用,還開發了一鍵部署到 Vercel(前端托管伺服器)的功能。也就是說隻需一個 API key 和幾次單擊,每個人都能擁有自己的專屬 ChatGPT 用戶端,自用、團隊用或者作為服務提供給其他人,都像呼吸一樣簡單。

筆者成功将自己部署的用戶端發給了爸媽和外婆,給他們帶去了一點小小的 AI 震撼,外婆甚至高興地給我做了一大碗紅燒肉。

除了模型,GPT 們還在卷什麼?

産品功能方面 ChatGPT-Next 也是集大成者,預設了 20 種人格和應用場景,且支援自定義;進階參數方面,模型選擇 model、随機性 tempeture、單次回複限制 max tokens 以及話題新鮮度 presence penalty,都可以根據需求場景精準調節。同時對話管理中的曆史消息長度壓縮也堪稱王炸級别功能,能夠在上下文數量達到一定的 token 時對上下文進行總結,并清除之前的記憶,有效減少 token 占用,讓對話更持久。最後其界面也是所有 app 中可自定義程度最高的,字型、語音、發送預覽、緊湊邊框,全部可以自定義。

論套殼類産品在功能豐富度和自定義程度方面,ChatGPT-Next 是各個方向中最強的,長期使用下來感受最好,使用 API 的速度也會比各種服務的官方速度更快,是生産力玩家的首選。

四、國内大廠:生态迅速接入,創業公司更快一步

釘釘、飛書、微信作為國内的三大辦公 IM 巨頭,截至目前都已經有了非官方的開源 AI 機器人接入。國内某創業公司通過開源社群的馬拉松項目,開發了基于釘釘、飛書的 AI 對話機器人矩陣,融合多模态(ChatGPT、DALL·E + Whisper、Midjourney)、圖檔創作、表格分析、文檔導出、多話題讨論、公式計算等等功能全部可以實作。甚至連 API 也是免費提供的,真正實作了賦能業務,讓國内打勞工成為第一批無縫使用 AI 的選手。

在 ToB 功能方面,國内創業公司應該是走在了世界前列,已經完成了産品化的開發,并且可以根據企業情況快速部署,依托 IM 實作辦公的 AI 提效。一鍵快速部署、企業級的AI權限管理、使用者導入導出使用記錄、風險詞攔截等,讓企業使用者順暢使用。

微信也有相應的開源機器人,但由于微信平台本身的限制,微信機器人的功能就限制較強了,基本也就是官方的功能移植到了微信對話框中。

據悉美團内部也在進行對話機器人的接入,幫助員工提升工作效率。其小美助手内置了多個量身定制的場景和 prompts,幫助員工能夠快速上手。整體體驗上與 ChatGPT 無異。

國内其他模型大廠的官方用戶端整體都還在狂卷模型能以趕上 GPT-3 的水準,目前也都還處在遮遮掩掩的狀态,想要獲得體驗資格的難度比成熟産品要高的多,是以暫且不做評論,但應該可以确認不會有更令人驚喜的功能。

五、ChatGPT:App Store 登頂,移動 AI 時代到來

最後聊聊 ChatGPT 本尊。

5 月 18 日,ChatGPT 上線了 App Store 并迅速登頂 iOS 下載下傳榜第一名。移動端的 ChatGPT 也是突出一個簡潔,但整體互動看得出來下了一些功夫:正常對話界面加入了回複的震動回報,感覺到對面的 AI 真的在打字,體驗爆棚;同時左滑互動可以呼出對話管理功能,右滑互動能夠新開對話,邏輯清晰;整體使用的流暢程度也非常優秀,比 Web 端的體驗好很多。

然而目前手機端的應用場景非常有限,周圍的人也大多将其當成 wiki 問答來用,沒有插件和聯網的加持,移動端目前并沒有太多應用場景,而生産力場景 Web 端效率更高,協作也更加流暢——畢竟我不能上班的時候一直扣手機吧。

但 iOS 用戶端解決了 ChatGPT 充值 plus 難的痛點,可以通過 App Store 直接訂閱,讓不少使用者終于能夠友善地用上 GPT-4。

移動端的潛力當然是巨大的,現在 ChatGPT 剛剛下場,但其戰略上的「我全都要」是可以窺探到的。在前有 Poe、Snapchat 移動端的情況下,ChatGPT 無疑讓移動端的競争格局一下子不同了起來,未來會發展成什麼樣子我們拭目以待。

六、小結

ChatGPT 帶來的 AI 變革将深刻改變社會的發展方向,現在是混沌的亂鬥局面,大家都卯着勁想做出點什麼。但模型又不是普通人能做的,是以出現了更多以場景應用為主的産品,也給創業者和開發者們提供了許多 AI 應用的思路。

另外本土化是另一個重要的課題,國内大廠在進度上明顯落後,但應用層已經先行并且有了很多好用的産品,這将來也會是競争最激烈同時機會最多的地方。乘上這波 AI 的大浪吧,不妨做一頭飛起來的豬。

最後歡迎關注 PandorAI,我們緻力于幫助 AI 創業者獲得更多洞察。

本文由 @PandorAI 原創釋出于人人都是産品經理,未經許可,禁止轉載。

題圖來自 Unsplash,基于 CC0 協定。

該文觀點僅代表作者本人,人人都是産品經理平台僅提供資訊存儲空間服務。