天天看點

估值飙升,Mistral AI成微軟第二條“大腿”

估值飙升,Mistral AI成微軟第二條“大腿”

估值飙升,Mistral AI成微軟第二條“大腿”

出品 | 虎嗅科技組

作者 | 杜钰君

編輯 | 王一鵬

頭圖 | 視覺中國

是GPT-4的勁敵兼平替,也是微軟部署的又一利器。這家人工智能初創公司用實力讓衆人驚呼“微軟赢麻了”。

2月26日,總部位于巴黎的人工智能公司Mistral AI釋出尖端文本生成模型Mistral Large。該模型達到了頂級的推理能力,可用于複雜的多語言推理任務,包括文本了解、轉換和代碼生成。

同日,微軟宣布與Mistral AI 建立多年合作夥伴關系,表示“Mistral AI 是先鋒,它是一位創新者和開拓者。他們對培育開源社群和實作卓越性能的承諾與 Microsoft 開發值得信賴、可擴充且負責任的 AI 解決方案的承諾和諧一緻”。

一、Mistral AI的崛起之路

微軟并不是第一家在Mistral AI身上押注的巨頭。

Mistral AI于 2023 年 5 月正式注冊成立,創始人是谷歌 DeepMind 和 Meta 的校友。僅僅成立幾周後,2023年6月,Mistral AI就獲得了由Lightspeed Venture Partners(光速創投)領投的1.05億歐元(約合1.13億美元)種子輪融資,使公司估值飙升至2.4億歐元。僅半年後,Mistral AI又獲得了由Andreessen Horowitz(a16z)領投的3.85億歐元(約合4.15億美元)融資,英偉達、Salesforce、法國巴黎銀行等多家知名機構跟投。而到了2024年2月,微軟更是直接入股Mistral AI。

從初創到被巨頭青睐,Mistral AI隻用了短短幾個月。

資金加持下,這個僅20名左右員工的公司頻頻展示自己的硬實力。

9月,Mistral 7B釋出,被稱為當時“最強的70億參數開源模型”。

緊接着,12月,Mistral AI在無釋出會、無宣傳預熱的情況下默默甩出一條磁力連結,釋出了首個開源MoE大模型Mistral 8x7B。87GB的種子、8x7B的MoE架構使得Mistral AI的身價一路飙升,幾天後估值便高達20億美元,與初創時間相比翻了8倍。

估值飙升,Mistral AI成微軟第二條“大腿”

Mistral AI的開源MoE大模型Mistral 8x7B的磁力連結

而2月26日釋出的Mistral Large,則直接叫闆GPT-4,在MMLU (一個包含57個多選問答任務的英文評測資料集,是目前主流的LLM評測資料集)測試中的成績僅次于GPT-4 ,成為世界上排名第二的可通過 API 普遍使用的模型。

估值飙升,Mistral AI成微軟第二條“大腿”

GPT-4、Mistral Large(預訓練)、Claude 2、Gemini Pro 1.0、GPT 3.5 和 LLaMA 2 70B 在 MMLU 上的比較

Mistral Large 具有新的功能和優勢:

它的母語是流利的英語、法語、西班牙語、德語和意大利語,對文法和文化背景有細緻入微的了解。

其32K 标記上下文視窗允許從大型文檔中精确調用資訊。

其精确的指令遵循使開發人員能夠設計他們的稽核政策——我們用它來設定 le Chat 的系統級稽核。

它本身就能夠進行函數調用。這與在 la Plateforme 上實施的受限輸出模式一起,實作了大規模應用程式開發和技術堆棧現代化。

如今,Mistral AI的估值已超過20億歐元(約合156.2億元人民币)。

二、GPT-4的“勁敵”與“平替”

根據Mistral AI官網介紹,Mistral Large在知識推理、多語言能力、數學與編碼等多方面的性能都直逼GPT-4,成為了GPT-4不容小觑的勁敵。

(一)推理和知識

Mistral Large展現出強大的推理能力。下圖是Mistral Large預訓練模型在标準基準上的性能。

估值飙升,Mistral AI成微軟第二條“大腿”

市場上領先的 LLM 模型在廣泛常識、推理和知識基準上的表現:MMLU(測量了解中的大規模多任務語言)、HellaSwag(10-shot)、Wino Grande(5-shot)、Arc Challenge(5 次)、Arc Challenge(25 次)、TriviaQA(5 次)和 TruthfulQA。

(二)多語言能力

Mistral Large 具有本地多語言能力。它在法語、德語、西班牙語和意大利語的 HellaSwag、Arc Challenge 和 MMLU 基準測試中明顯優于 LLaMA 2 70B。

圖 5:Mistral Large、Mixtral 8x7B 和 LLaMA 2 70B 在 HellaSwag、Arc Challenge 和 MMLU 上法語、德語、西班牙語和意大利語的比較

(三)數學與編碼

Mistral Large 在編碼和數學任務中表現出頂尖的性能。在下表中,我們報告了一系列流行基準的性能,以評估一些頂級 LLM 模型的編碼和數學性能。

估值飙升,Mistral AI成微軟第二條“大腿”

市場上領先的 LLM 模型在流行編碼和數學基準上的性能:HumanEval pass@1、MBPP pass@1、Math maj@4、GSM8K maj@8和 GSM8K maj@1

在性能上叫闆GPT-4 的同時,Mistral Large的應用成本更為低廉。目前,查詢 Mistral Large 的成本為每百萬個輸入代币 8 美元,每百萬個輸出代币 24 美元。在人工語言術語中,标記代表小塊的單詞——例如,當人工智能模型處理時,單詞“TechCrunch”将被分成兩個标記,“Tech”和“Crunch”。

預設情況下,Mistral AI 支援 32k 個标記的上下文視窗(通常超過 20,000 個英語單詞)。作為比較,GPT-4 Turbo 具有 128k 代币上下文視窗,目前每百萬個輸入代币的成本為 10 美元,每百萬個輸出代币的成本為 30 美元。是以,Mistral Large 目前比 GPT-4 Turbo 便宜 1.25 倍,成為了GPT-4 Turbo的“平替”。這對于使用量巨大的企業使用者而言可以節省很大一筆開支。

估值飙升,Mistral AI成微軟第二條“大腿”

Mistral Large與GPT-4及其同源産品的成本比較

除了 Mistral Large 之外,這家初創公司還推出了自己的 ChatGPT 替代品,即 Le Chat 的新服務。該聊天助手目前處于測試階段。該公司還計劃為企業客戶推出Le Chat的付費版本。除了集中計費之外,企業客戶還能夠定義稽核機制。

不僅如此,Mistral AI 的商業模式看起來也越來越像 OpenAI 的商業模式。目前,該公司的模型不再像成立初時完全開源,而是通過付費 API 提供 Mistral Large,并根據使用情況進行定價。Mistral Large可通過 la Platform 擷取,也可以在 Azure AI 上使用。其中,La Plateforme這一接入點安全托管在歐洲的 Mistral 基礎設施上,使開發人員能夠在模型範圍内建立應用程式和服務;同時該模型也可通過Azure AI Studio 和 Azure 機器學習使用。

三、與微軟的雙向賦能

Mistral的先進模型資源将安放在微軟雲中,使其成為全球第二家在微軟Azure上提供商業AI模型的公司。

Mistral AI與微軟的合作重點關注三個核心領域:

超級計算基礎設施:微軟将通過 Azure AI 超級計算基礎設施來支援 Mistral AI,為 Mistral AI 旗艦模型的 AI 訓練和推理工作負載提供一流的性能和規模。

擴充到市場:微軟和 Mistral AI 将通過Azure AI Studio和Azure 機器學習模型目錄中的模型即服務 (MaaS) 向客戶提供 Mistral AI 的進階模型。除了 OpenAI 模型之外,模型目錄還提供開源和商業模型的多種選擇。使用者可以使用Microsoft Azure 消費承諾 (MACC)來購買 Mistral AI 的模型。Azure 的 AI 優化基礎設施和企業級功能為 Mistral AI 提供了向全球 Microsoft 客戶推廣、銷售和分發其模型的額外機會。

人工智能研究和開發:微軟和 Mistral AI 将探索圍繞為特定客戶(包括歐洲公共部門工作負載)教育訓練特定目的模型的合作。

對此,Mistral AI 首席執行官Arthur Mensch表示,與微軟的合作使 Mistral AI 能夠通路Azure ,推動其創新研究和實際應用程式向世界各地的新客戶發展,加速下一代大型語言模型 (LLM) 的開發和部署,為 Mistral AI 提供了釋放新商業機會、擴充到全球市場的機會,并促進持續的研究合作。

這不僅是Mistral AI邁向商業化的重要一步,同時也是微軟在AI領域深化布局的又一力證。對于微軟而言,和Mistral AI的開放合作夥伴關系政策是讓 Azure 客戶留在其産品生态系統中的好方法。此外,微軟與OpenAI多年的關系已經吸引了美國和歐洲反壟斷監管機構的審查,與Mistral AI等大模型公司的合作無疑可以“分散火力”。目前,微軟正積極探索在其雲計算平台上與其他人工智能模型點合作可能。例如,Microsoft 和 Meta合作在 Azure 上提供 Llama 大型語言模型。

事實上,Mistral AI的在研産品不止于Mistral Large。

Mistral AI 的模型産品主要分為Mistral Small、Mistral Large、Mistral Embed三類。其中,Mistral Small受益于與 Mistral Large 在 RAG 啟用和函數調用方面相同的創新,主要提供針對低延遲工作負載的經濟高效推理;Mistral Large主要用于處理高複雜性任務的頂級推理;Mistral Embed則主要用于提取文本摘錄表中最先進的語義。

繼續閱讀