天天看點

甲骨文寵兒大勝GPT-4,Transformer新星閃耀,大模型創業引領風潮

作者:不秃頭程式員
甲骨文寵兒大勝GPT-4,Transformer新星閃耀,大模型創業引領風潮

近日在開源模型界,Command R+風頭正勁。

在Arena榜單上,Command R+憑借逾13000名支援者的票,一度躍升至第6位,其表現與GPT-4-0314旗鼓相當!在一衆對壘GPT-4的開放權重模型中,斬獲該榜單有史以來的首勝。

甲骨文寵兒大勝GPT-4,Transformer新星閃耀,大模型創業引領風潮

圖源:https://twitter.com/lmsysorg/status/1777630133798772766

而Arena榜單,是近日用純C語言手搓GPT-2的AI大神Andrej Karpathy提過的唯二信任的測試基準之一。

Command R+隸屬總部位于多倫多的大模型創業公司Cohere。這家AI新銳的聯合創始人兼CEO,正是Transformer最年輕作者Aidan Gomez。我們且來看一看開源模型界當紅炸子雞的幕後故事。

甲骨文寵兒大勝GPT-4,Transformer新星閃耀,大模型創業引領風潮

Command R+ 橫空出世,何以擊敗GPT-4

Command R+與前代Command R一樣,擁有128k令牌上下文視窗,而且又在此基礎上全面提高了性能。

首先,提供先進的檢索增強生成(RAG)能力。RAG技術結合了基于檢索的模型和生成性模型的優勢。前者涉及從資料庫、文章或網站等大量來源中通路和提取資訊,而後者擅長生成連貫且具有上下文意識的文本。通過結合這兩個元件,RAG在生成更具資訊性和上下文相關性的響應方面脫穎而出。

更值得一提的是,新模型針對進階RAG進行了優化,提高了響應的準确性,并提供了内嵌的源引用,以減少幻覺現象,進而更好地應對業務需求,使企業能夠借助AI擴充支援各種業務功能,如财務、人力資源、銷售、市場營銷和客戶支援等。

再者,覆寫10多種語言,支援全球業務營運。其中包括:英語、法語、西班牙語、意大利語、德語、葡萄牙語、日語、韓語、阿拉伯語和中文。

另外,Command R+還配置了多種工具使用功能,用于自動化複雜的業務流程

API接口:附帶可以通過Cohere和LangChain API通路的工具使用能力。這有助于自動化複雜的業務工作流程,如更新CRM任務、活動和記錄。

多步驟工具使用:Command R+中的一個新特性,使模型能夠結合多個工具進行多個步驟以完成複雜任務。Command R+還具有自我糾正的能力,當它嘗試使用工具失敗時(例如遇到工具的錯誤或故障),這增強了模型完成任務的可能性,并提高了成功的可能性。

在對話工具使用和單輪次函數調用能力方面,Command R+在關鍵企業AI基準測試中表現優異,超過了OpenAI的GPT-4 Turbo,以及Anthropic的Claude 3 Sonnet和Mistral Large。

甲骨文寵兒大勝GPT-4,Transformer新星閃耀,大模型創業引領風潮

圖源:https://txt.cohere.com/command-r-plus-microsoft-azure/

甲骨文寵兒大勝GPT-4,Transformer新星閃耀,大模型創業引領風潮

Cohere與Oracle,

并不是OpenAI和微軟的關系

作為一家為企業使用者進行服務的公司,Cohere并不想成為巨頭的跟班。

盡管Oracle是Cohere的主要投資者,兩者的關系十分密切,但他們并不喜歡OpenAI與Microsoft的“相處模式”。Cohere的CEO Gomez表示,Cohere獨立于任何雲服務提供商,可以在任何雲平台上部署其模型,這與僅在Microsoft Azure可以使用的OpenAI不同。

“我們認為獨立性非常重要,是以我們的服務可以在你所知道的每一家雲平台上使用——Azure、GCP、OCI、AWS,以及本地部署。你不會被鎖定在單一的技術棧或雲平台上,”Gomez在2024年達沃斯世界經濟論壇的間隙說道。這種獨立性給了Cohere開辟更多收入來源的可能。

“我們不會從單一的雲服務提供商那裡接受巨額的支票,這可能會将我們鎖定在一個生态系統或環境中。我們真的在努力保持獨立,并為世界建立一些新的東西,”他補充道,間接地對OpenAI進行批評。

該企業的COO Martin Kon也表達了類似的想法,他說模型需要與雲無關,這樣你就可以在你覺得對你的資料最舒适的地方部署它們,而不會被綁定到特定的雲或甚至是本地部署。

不過,Oracle的确是Cohere資金雄厚的金主之一,與該公司在技術方面也有着密切的關系。Cohere在Oracle雲基礎設施(OCI)上訓練和建構其生成性AI模型,該基礎設施提供了高性能和低成本的GPU叢集技術。這使得Cohere能夠加速大型語言模型(LLM)的訓練,同時降低成本。同樣的,微軟Azure雲計算平台也在為OpenAI所提供的算力支援。

“與Oracle的關系在計算方面産生了巨大的影響,為我們提供了地球上最好的超級計算機,同時在共同進入市場、共同創造新産品、改造現有産品以及将這項技術帶給企業方面也非常重要,”Gomez說道。

Gomez補充說,“OCI生成性AI服務真正展現了我們的使命,即為企業建構大型語言模型,以一種極度保護他們的資料、完全安全的方式”。

Cohere的生成性AI模型已經內建到Oracle的商業應用中,包括Oracle Fusion Cloud、Oracle NetSuite和Oracle特定行業的應用程式。

目前,Cohere 一直在努力提升自身的盈利水準。去年年底,該公司的年化收入約為 1300 萬美元,月收入僅略高于 100 萬美元。這一數字被他強大的競争對手——OpenAI遠遠地甩在了身後,去年年 12 月OpenAI的營收已突破 20 億美元大關。

不過,這家初創公司已告知投資者,其銷售漏鬥上(包括預計在 2024 年底之前完成的潛在合同)的價值超過 3 億美元,目前尚不清楚甲骨文在其中所占的份額。可以确定的是,随着Cohere的模型在多家雲平台上完成部署,他的收入曲線勢必會繼續攀升。

甲骨文寵兒大勝GPT-4,Transformer新星閃耀,大模型創業引領風潮

微軟Azure宣布接入Cohere

甲骨文寵兒大勝GPT-4,Transformer新星閃耀,大模型創業引領風潮

OpenAI之下,大模型謀求盈利之路

大模型的元年已過,AI的落地應用浪潮洶湧。傅盛預言,今年千億大模型過半将會凋零。

在OpenAI的高光之下,或是照貓畫虎,或是另辟蹊徑,大模型廠商都必須探索出自己的生财之道。

專注于企業服務的Cohere,早早便堅定了To B的決心。Cohere的首席執行官Martin Kon 說:"我們現在沒有,将來也不會有一個燒錢的消費者聊天機器人。”

4月11日晚,李彥宏在内部講話中表達了文心一言為何選擇了閉源之路,他提到,“閉源,是有真正的商業模式的,是能夠賺到錢的,能夠賺到錢才能聚集算力、聚集人才,閉源在成本上反而是有優勢的,隻要是同等能力,閉源模型的推理成本一定是更低的,響應速度一定是更快的。”

但以Llama、Mistral AI 和Command R+為代表的其他各種替代方案正在蓬勃發展,并越來越多地被雲提供商和企業采用。開源勢力亦不可小觑。以Command R+ 為例,其在可擴充市場類别中優于類似模型,定價上也更具競争力。

Cohere為Command R+設定的100萬輸入和輸出令牌成本分别為3美元和15美元,這一價格頗具競争力。相較于其他産品,其定價與Claude 3 Sonnet相當;而最新的OpenAI GPT-4 Turbo模型對100萬輸入令牌收費10美元,對100萬輸出令牌收費30美元。

随着AI創新領域新競争者的不斷湧入,在目前穩健發展的态勢下,相信關于“開源VS閉源”的辯論,也會伴随創新浪潮下探索的每一步,但這不會是“東風壓倒西風”的二選一終局,這兩種模式必然将在相當長的時期内共生共存,共同為AI産業落地創造價值。

參考連結:

1.https://analyticsindiamag.com/who-needs-openais-gpt-4/

2.https://analyticsindiamag.com/the-secret-superstar-of-llms/

3.https://k.sina.com.cn/article_1654203637_629924f5020011twi.html

繼續閱讀