專注于推理的OpenAI“草莓”模型兩周内釋出？是人工智能下一重大突破

本文作者：杜玉

來源：硬AI

9月10日周二，據知名科技商業類媒體The Information援引多位測試過該模型的人士透露，站在時代風口浪尖的“AI寵兒”OpenAI計劃在未來兩周内釋出名為“草莓”的最新人工智能産品，作為ChatGPT所提供服務的一部分。這比兩周前傳聞的“秋季釋出”（9月至11月）要更早。

上述報道稱，專注于推理能力的人工智能“草莓”釋出前後還有一些亟待解決的問題，但看似“倉促上馬”似乎說明OpenAI感受到了大語言模型驅動産品領域的激烈競争壓力，希望通過近幾個月被市場期待已久的草莓項目，來恢複ChatGPT首發以來兩年裡大部分時間的勢頭。

何為“草莓”模型？專注于推理能力，是人工智能下一個重大突破

兩周前曾有消息稱，OpenAI加速推出“草莓”推理人工智能模型，以推動聊天機器人業務。四周前的消息稱，著名AI搜尋公司perplexity CEO暗示已經提前用上了OpenAI的最新模型“草莓”。

華爾街見聞曾提到，早在5月時就有傳聞稱OpenAI正在神秘開發代号為“草莓”的項目。兩個月前的7月13日，又有消息确認“草莓”是OpenAI正在開發新的人工智能模型，希望提供更進階推理能力以形成邁向通用人工智能（AGI）的重大突破。

具體來說，“草莓”模型憑借增強的推理能力，能夠更好地處理令以往AI模型“撓頭”的複雜科學和數學問題，不僅能讓大語言模型（LLM）根據使用者的複雜查詢生成答案，甚至還能提前規劃，以便自主、可靠地浏覽網際網路，進行OpenAI 定義的“深度研究”（deep research）。

評論普遍認為，OpenAI的“草莓計劃”有望成為人工智能下一個重大突破。更先進的推理能力意味着該技術可以“自主”執行更複雜任務，而不僅僅是依靠使用者的逐漸提示行事。推理一直是AI在類人智能追求中最棘手的問題之一，而具有推理能力的人工智能模型不僅能改善數學和程式設計能力，還可以徹底改變科學研究，增強醫療保健和金融等複雜領域的決策力，并加速技術創新。

會顯著更貴嗎？“草莓”模型具體的提供形式和定價模式尚不确定

據悉，“草莓”釋出後雖然整體作為ChatGPT的一部分，但也是一項獨立産品，可能會納入客戶選擇以支援ChatGPT運作的AI模型下拉菜單中，但具體的提供形式和定價模式都尚不确定。

與正常的對話式人工智能不同，“草莓”在回應使用者的提示語之前會“思考”10到20秒，而不是立即給出答案。對于複雜或包含多個執行步驟要求的查詢語，“草莓”将比現有的GPT-4o版本更易于使用，不需要使用者明确告知ChatGPT“完成中間推理步驟以得出最終答案”等額外舉動。

有分析稱，這意味着“草莓”将成為更加智能的助手，不僅在解決數學問題和編碼方面表現更佳，在更“主觀”的商業任務方面也更優秀，比如集思廣益制定産品營銷政策等。而且在這類偏創意的任務中，該模型将提供更針對使用者公司需求、更詳細的建議，比如生成每周執行計劃。

不過，假設釋出一切順利，在初始版本“草莓”隻能接收和生成文本資訊，而不能接收和生成圖像，這代表不像其他OpenAI模型那樣具備“多模态”功能，算是“缺點”之一。

同時，盡管“思考”階段有助于避免AI犯錯、且能預測如何全面回答使用者問題，但有測試過該模型的人士稱，一些簡單問題也會令草莓“思考”而無法迅速給出答案；答案品質僅略佳，不值得額外等待；而且有時無法在回答新問題之前記住并整合與使用者的先前聊天記錄。

在定價方面，上周曾有消息稱，ChatGPT Plus目前付費價格是每月20美元，但OpenAI考慮将“草莓”和被外界譽為“ChatGPT 5”的“獵戶座”（Orion）等全新大模型拟定在月付2000美元，等于定價提升100倍。分析認為，OpenAI能考慮如此高的價格跨度，主要是因為缺錢、新産品足夠強以及手握數億使用者。

“草莓”模型為何重要？或重新定義AI能力邊界，為GPT 5提供高品質合成訓練資料

OpenAI首席執行官奧特曼（Sam Altman）曾在今年早些時候表示，人工智能領域“最重要的進步方向将是推理能力”。

而“草莓”項目被認為就是去年披露出的OpenAI“Q*”計劃，該項目在公司内部已被視為一項突破。觀看過示範的人稱能夠回答目前商用AI模型無法解決的棘手科學和數學問題。

奧特曼8月初發帖被外界認為給“草莓”項目預熱

OpenAI曾在8月11日給出了未來AI發展的五個階段路線圖，第一階段便是現在具有對話語言的AI聊天機器人，第二階段是具有人類水準問題解決能力的“推理者”，第三階段是可以采取自主行動的“代理人”（AI agent），随後是可協助發明的“創新者”和可完成組織工作的“組織者”。

而“草莓”極可能是幫助OpenAI實作第二級AI的關鍵，一旦成功将重新定義AI的能力邊界，自主執行複雜任務、獨立解決複雜問題并驗證輸出内容，代表人類離通用人工智能AGI又進一步。專注于推理的“草莓”可能也是為下一代AI模型“獵戶座”或者說ChatGPT 5奠基的必經之路。

軟體開發機構Technology Rivers創始人兼CEO Ghazenfer Mansoor指出，借助“草莓”項目，OpenAI對人類推理水準的追求不僅是技術奇迹，更能突破界限、激發每個領域新的可能性。比如在商業領域，人工智能将能極大地改變供應鍊的管理方式，非常準确地預測市場趨勢，并在很大程度上使客戶體驗非常個性化。

而在普通使用者的層面，其使用體驗也會有所改進，例如具有推理能力的AI模型不僅能提供更優化的旅行計劃和健康建議，甚至可以分析使用者的消費習慣并建立完全定制化的預算方案，做更智能的助手。

總而言之，在理想化的情況下，“草莓”将能夠解決超出目前人工智能模型能力範圍的問題和任務，并進行“深入研究”，“比任何現有的聊天機器人都更勝一籌”。

還有分析指出，“草莓”計劃旨在籌集更多資金，OpenAI需要這筆錢來支援代号為“獵戶座”的下一代前沿模型開發。而且，為“獵戶座”模型生成高品質的合成訓練資料被認為是“草莓”的關鍵應用之一，“這一點意義重大，因為網際網路上的大部分訓練資料都已被使用殆盡”：

人工智能模型所依賴的大型資料集可能容易出現偏差和錯誤，或者包含不完整或不準确的資訊。草莓計劃生成的高品質合成資料可以填補現實世界資料集的空白，并提供更全面、更包容、更平衡的訓練集。

許多人認為，使用合成資料可以幫助未來的人工智能模型更加中立和公平，并減少噪音、幻覺和不相關的資訊，進而提高訓練的效率和模型的準确性。

根據已知的資訊，草莓計劃改進了推理、邏輯以及規劃和開展研究的能力，可以讓模型自主進行實驗、分析資料并提出新的假設。這可能會帶來科學突破，包括發現新藥。這些模型還可以提供個性化教育，建立教育内容和互動課程。

據知情人士透露，“草莓”項目包括一種專門的“後訓練”方法，即生成式AI模型已經過大量資料集上進行預訓練後，進一步調整模型以提高其在特定任務上的表現。這類似于斯坦福大學在2022年開發的“自學推理者”（Self-Taught Reasoner，簡稱STaR）方法。

STaR創造者之一、斯坦福大學教授Noah Goodman曾表示，STaR可以讓AI模型通過疊代建立自有訓練資料，“引導 ”自己進入更高的智能水準，理論上可用來讓語言模型實作超越人類的智能。但他也承認，“這既令人興奮又令人恐懼，人類（應就自身處境）需要認真思考一些問題了。”

本文來自華爾街見聞，歡迎下載下傳APP檢視更多

專注于推理的OpenAI“草莓”模型兩周内釋出？是人工智能下一重大突破

何為“草莓”模型？專注于推理能力，是人工智能下一個重大突破

會顯著更貴嗎？“草莓”模型具體的提供形式和定價模式尚不确定

“草莓”模型為何重要？或重新定義AI能力邊界，為GPT 5提供高品質合成訓練資料

繼續閱讀

全市近千名青少年齊聚中海博，在航海、航空、建築三大模型競賽中一展身手

DeepMind聯合MIT開發Fluid，讓自回歸模型實作文生圖的大規模擴充

張藝謀透露《三體》進度：隻拍一部、大幅删改、引入人工智能

AI周報 | 位元組跳動大模型訓練被“投毒”；微軟将終止中國個人Azure OpenAI服務

法蘭克福書展聚焦人工智能發展與監管

位元組跳動回應大模型訓練被實習生攻擊：已被辭退，不影響線上業務

人工智能未來十大趨勢

研學報道|“探索科技前沿引領未來創新”人工智能創新應用博覽會研學之旅啟航

論壇直擊|人工智能創新應用發展領航交流會圓滿舉辦

中醫藥領域卷出多個大模型，“AI老中醫”來了？

出手即王炸？照片級真實度生成式世界模型，還獲得皮克斯投資

數字科技、人工智能拯救春晚收視率

DeepSeek出世，人工智能厲害，教師會被取代嗎？讀書還有意義嗎？

騰訊、華為等接入DeepSeek每月虧損超4億，MaaS模型即服務将要被颠覆了？｜钛媒體AGI

一邊大量失業一邊搞人工智能，發展搶了幾億人飯碗，未來怎麼辦？

性趣機器人意外獲大模型賦能，成人用品概念股集體上漲，逆天了？