天天看點

Llama 3沒能逼出GPT-5!OpenAI怒“卷”To B戰場

作者:漫威電影情報局

編譯 | 伊風

出品 | 51CTO技術棧(微信号:blog51cto)

Meta 是本周當之無愧的AI巨星!剛剛推出的 Llama 3 憑借着強大的性能和開源生态的優勢在 LLM 排行榜上迅速躍升。

按理說,Llama 3在開源的狀态下做到了 GPT-3.7 的水準,必然會顯得使用者(尤其是企業使用者,他們更具備獨立部署Llama 3的能力)花錢買來的 GPT-4 沒那麼香了。網友于是紛紛拱火,“鼓勵”OpenAI 交出 GPT-5,才能繼續穩坐大模型王位。

不單單是網友,就連 OpenAI 的研究員也有點坐不住了,跑到X上發了一條含義暧昧的推文。

Llama 3沒能逼出GPT-5!OpenAI怒“卷”To B戰場

圖檔

這下網友更加焦急地推測,性能強悍的 Llama 3 可能會擾亂 GPT-5 的釋出時間表,甚至提前到4.22日。

直到周四,OpenAI的新動作才姗姗來遲。

Llama 3沒能逼出GPT-5!OpenAI怒“卷”To B戰場

圖檔

OpenAI 重磅推出了其擴充的 API 客戶的企業級功能,進一步豐富其助手 API,并引入旨在增強安全性和行政控制以及更有效管理成本的新工具。

OpenAI對它寄予厚望:“當你與開發者和企業談論 AI 模型的有意義工作時,OpenAI 仍然領先,”OpenAI API 産品負責人 Olivier Godement說。

不過,OpenAI這一迂回作戰的政策,到底是讓很多人始料不及。“油鹽不進”的網友回複道,“你是不是把GPT-5拼錯了”?

Llama 3沒能逼出GPT-5!OpenAI怒“卷”To B戰場

圖檔

不過,就像小紮曾在采訪裡坦言,Meta會開源模型,但不會開源産品。過硬的産品才是一家企業真正的技術壁壘和現金牛。一味燒錢的時代過去了,現在的AI主旋律是探索更多的商業價值。

OpenAI在此時高調宣布更新企業級産品,足可見其在To B賽道厮殺的決心。那麼這款新更新的API的能力是否能讓企業心動到為其買單呢?

1.私有連結和加強的安全功能

在重要的安全更新中,新的API産品引入了私有連結,這種安全方法允許 Microsoft 的 Azure 雲服務和 OpenAI 之間進行直接通信,這有助于最小化通過 API 發送的客戶資料和查詢的“對開放網際網路的暴露”。

這一新增功能補充了現有的安全棧,包括 SOC 2 Type II 認證、單點登入(SSO)、靜态 AES-256 資料加密、傳輸中的 TLS 1.2 加密和基于角色的通路控制。

此外,OpenAI 引入了原生的多因素認證(MFA)以加強通路控制,以符合日益增長的合規性需求。

對于需要 HIPAA 合規性的醫療保健公司,OpenAI 繼續提供商業夥伴協定,并為符合條件的 API 客戶提供零資料保留政策。

2.更新的助手 API,可處理 500 倍更多的檔案

OpenAI 提供的一個較少宣傳但最重要的企業産品是其助手 API。它允許企業部署他們訓練的定制微調模型,并通過檢索增強生成(RAG)調用特定文檔,并提供相應的會話助手。

例如,電子商務公司 Klarna 今年早些時候誇贊其使用 OpenAI 助手 API 制作的 AI 助手,能夠完成 700 名全職人類代理的工作,重複查詢減少了 25%,解決時間幾乎減少了 82%(從 11 分鐘減少到 2 分鐘)。

OpenAI 現已更新助手 API,包括新的“file_search”功能,增強檔案檢索能力,每個助手可以處理多達 10,000 個檔案。

這代表了比以前限制的 20 個檔案增加了 50 倍,并增加了并行查詢、改進的重新排名和查詢重寫等附加功能。

此外,API 現在支援流式傳輸,以實時會話響應——這意味着像 GPT-4 Turbo 或 GPT-3.5 Turbo 這樣的 AI 模型将盡可能快地傳回輸出,而不是等待完整響應的生成。

它進一步內建了新的“vector_store”對象以更好地管理檔案,并提供更細粒度的令牌使用控制,以幫助有效管理成本。

3.新功能“項目”,可控制人員對特定任務的通路

一個名為“Projects”的新功能提供了改進的行政監督,允許組織在項目級别中管理角色和 API 密鑰。

此功能允許企業客戶限定權限、控制可用模型,并設定基于使用的限額以避免意外成本——這些增強功能承諾顯著簡化項目管理。

本質上,他們可以将一個微調版本的 AI 模型甚至一個普通的模型隔離到特定的任務或文檔集,并允許特定的人員在每個任務上工作。

是以,如果你的企業有一個團隊正在處理一組面向公衆的文檔,另一個團隊正在處理一組機密或内部文檔,你可以在 OpenAI 的 API 内為每個配置設定一個單獨的項目,兩者可以使用 AI 模型分别工作,而不會混合或危及後者。

“随着越來越多的組織甚至單獨的開發者部署 AI,他們希望在受限的盒子裡做事,”OpenAI 的産品團隊成員 Miqdad Jaffer 在昨天與 外媒 VentureBeat 進行的相同視訊電話采訪中說。“‘項目’讓你做的是将你的資源、你的成員隔離到一個小型的個性化項目中。你得到了單獨的使用報告。你有能力控制通路、安全、延遲、吞吐量和成本,一個組織确實可以以非常安全的方式建構。如果你是一個單獨的開發者,你可以毫無顧慮地部署數百個項目。”

最後一點對于同時咨詢或處理多個客戶的開發團隊特别有幫助。

4.還有一些新的更新

為了進一步幫助組織以經濟方式擴充其 AI 營運,OpenAI 引入了新的成本管理功能。

這些包括為每分鐘保持一緻水準的令牌使用量的客戶提供折扣率,并通過新的 Batch API 為異步工作負載提供成本降低 50%,該 API 還具有更高的速率限制,并承諾在 24 小時内提供結果。

然而,要使用它,客戶必須在單個請求中一起發送他們的令牌批次——他們想要 AI 模型分析的輸入,無論是提示還是檔案——并願意等待最多 24 小時以從 OpenAI 的 AI 模型接收響應。

雖然這看起來像是很長時間,但 OpenAI 的高管告訴 VentureBeat,傳回可以快至 10-20 分鐘。

它還旨在為不需要 AI 模型即時響應的客戶和企業設計,比如一個調查記者研究長篇特寫文章,想要發送一堆政府檔案讓 OpenAI 的 GPT-4 Turbo 篩選并挑選出標明的細節。

或者,一個企業準備一份報告,檢視其過去幾周的财務表現,而不是幾天或幾分鐘内到期。

随着 OpenAI 繼續增強其産品,專注于企業級安全、行政控制和成本管理,更新表明該公司有興趣為企業直接提供更“即插即用”的體驗,以應對 Llama 3 的升空和像 Mistral 這樣可能需要企業方面進行更多設定的開放模型的崛起。

參考連結:https://venturebeat.com/ai/openai-shrugs-off-metas-llama-3-ascent-with-new-enterprise-ai-features/

來源: 51CTO技術棧

繼續閱讀