天天看點

ChatGPT沒有做的AI搜尋,是不是下一個戰場

作者:娛樂資本論

作者|James

上周,ChatGPT正在測試一個獨立于其大模型對話框之外的AI搜尋功能,将使用專屬網址 search.chatgpt.com ,據說支援以圖搜圖,還可能包括天氣、電腦等小工具。

作為AI領頭羊,OpenAI的幾乎每一個行動都能激發業界的熱烈讨論。不過中原標準時間周二淩晨的釋出會上沒有公布和搜尋相關的資訊,這次開放的GPT-4o模型主要增強了語音、圖像方面的多模态能力。

有多樣的證據顯示ChatGPT搜尋确實在做,還有人号稱刷到了灰階測試資格。與此同時,在AI搜尋這條戰線上,國外有Perplexity,國内有天工、秘塔;“傳統”搜尋引擎如谷歌、必應、百度、360也紛紛入場。

視智未來發現,不管公司是否正在開發基礎大模型,要推出一個AI搜尋界面并不困難,甚至最短隻需要一位個人開發者忙碌3天。

不過,秘塔科技的COO王益為對視智未來表示,想入場做搜尋也沒有那麼容易。做AI搜尋的技術力和産品力都同樣重要,也必須想清楚市場定位、商業化和覆寫算力成本的問題。

“我有個理論,一個工具的合理定價,大約是它所替代的工作價值的1/10。”王益為說,“秘塔AI搜尋現在産品大概是80分水準。如果要達到90分或更高,就是說使用者有強烈的付費意願。”

多模态“搶鏡”已久,單純的語言模型似乎有點寂寞,而AI搜尋似乎重新點燃了這方面的熱情。它會是繼視訊和音樂創作之後的下一個AIGC熱點領域嗎?是不是很快就會進入激烈的“千搜大戰”了?

在秘塔AI搜尋剛上線時,視智未來在秘塔科技的辦公室,與王益為進行了深入的交談。這期訪談節目的完整版,已經釋出在視智未來《對話AI創業者》播客上,歡迎長按或掃描下面的二維碼收聽:

ChatGPT沒有做的AI搜尋,是不是下一個戰場

VOL.1

AI搜尋,怎麼這麼像是大模型

在ChatGPT的搜尋功能正式亮相之前,外界充滿了傳聞和猜測。X(Twitter)使用者 @btibor91 根據洩露的部分前端代碼,繪制了ChatGPT搜尋界面的假想效果圖:

ChatGPT沒有做的AI搜尋,是不是下一個戰場
ChatGPT沒有做的AI搜尋,是不是下一個戰場

然而,我們可能很難看出新的搜尋界面與之前傳統的GPT聊天框之間有什麼差別。

與此同時,自媒體“賽博禅心”刷到了灰階測試中的 ChatGPT搜尋,下面是他嘗試搜尋的結果頁面:

ChatGPT沒有做的AI搜尋,是不是下一個戰場

這是視智未來使用ChatGPT Plus早就有的聯網功能,輸入的提示詞以及獲得的結果頁面:

ChatGPT沒有做的AI搜尋,是不是下一個戰場

——不能說非常相似,就是一模一樣嘛!

如果你感覺AI搜尋跟能聯網的ChatGPT沒啥本質差別,你的感覺是對的。

目前結合AI大模型與搜尋的方式,其背後的核心原理都是RAG(檢索增強生成,Retrieval-Augmented Generation)。

2020年,初創公司Cohere的帕特裡克·劉易斯(Patrick Lewis)在一篇論文中發明了這個術語,他因為縮寫“不太讨人喜歡”而道歉,“早知道我們的工作會變得如此出名,我們肯定會好好想一個更好聽的名字。”

簡單來說,RAG就是将輸入的提示詞轉換為搜尋關鍵字,根據網上搜尋到的頁面内容進行閱讀了解,然後限定大模型需要基于這些内容生成答案,而不是依賴模型自身的知識庫。

市面上的大模型聊天産品,除了ChatGPT等少數,大多數模型都将聯網搜尋功能免費提供,像文心一言甚至不支援取消聯網功能。

ChatGPT沒有做的AI搜尋,是不是下一個戰場

這實際上已經就是一種形式的“AI搜尋”了。此時,調用大模型API生成的結果,跟在大模型官網對話的結果,就會産生一定的差異。

除了上面的ChatGPT和搜尋結果對比,視智未來還對比了文心一言的輸出和百度“簡單搜尋”App的AI搜尋結果,以及谷歌Gemini的輸出和谷歌搜尋增強的結論。

結果是,同一廠家的大模型聯網結果和AI搜尋結果,很大程度上是可以互相替代的,盡管每次生成的結果都不完全相同。

ChatGPT沒有做的AI搜尋,是不是下一個戰場
ChatGPT沒有做的AI搜尋,是不是下一個戰場

王益為覺得RAG就是最大限度減少幻覺的最優解。他認為,讓大模型基于自己訓練的知識庫回答問題類似于閉卷考試,而使用搜尋引擎則相當于開卷考試,将準确率大大提升。

秘塔的拳頭産品“寫作貓”還開辟了基于搜尋的“事實驗證”功能,在一篇生成的或人類寫作的文章中,挑出可能有事實錯誤的地方,并提供網上相關資訊的連結。

ChatGPT沒有做的AI搜尋,是不是下一個戰場

當然,因為也不能100%依賴AI的判斷,這個功能将報警門檻值調得比較低,有時會有誤報,但“甯可殺錯,不可放過”,主要是友善作者人工二次檢查。

然而,針對RAG也存在不少質疑的聲音。例如,盡管RAG能夠提供更有用的參考資料,但生成内容的邏輯仍是一個黑箱,是以可控性并不強。有時候,即使指定了必須依據的材料,模型仍可能會“任性”地給出與材料不相關的答案。

另外,特别是在涉及推理能力的搜尋任務中,模型本身的局限性可能無法僅通過引入高品質的材料得到解決。例如,當要求直接提供網上文章能摘抄的具體段落時,模型可能能夠處理;但如果需要對搜到的曆年資料進行篩選、求平均值或極值等結構化操作時,出錯的機率依然很高。

既然是用了搜尋增強,那麼搜尋結果是哪裡來的呢?

有的團隊會像自己做大模型一樣,連搜尋爬蟲也是自己做。比如視智未來此前采訪昆侖萬維的董事長兼CEO方漢,他就解釋說,昆侖萬維的團隊從海外産品Opera News起算,在搜尋領域有6-7年的經驗積累。天工AI搜尋對重點網站的抓取頻率已經提升到每分鐘一次。

方漢還提到,昆侖萬維積累了豐富的預訓練資料收集、清洗、深度加工等能力。他們也在研究如何確定資訊的真實性,比如對各種資訊源網站進行打分;以及如何調整内容以适應國内使用者、如何避免資訊繭房等問題。

但可能更簡單的方法,就是套用現成的搜尋引擎。ChatGPT不用問,用的是必應搜尋。而根據The Information等報道,想做“谷歌殺手”的Perplexity 其實使用自動化系統來通路來自必應和谷歌的資料。它采用必應的 API 對結果中的信号進行排名,以确定網頁的相關性、品質和權威性。

在Perplexity們的界面當中都可以指定限定來源搜尋,而要想做到這一點,最簡單的方式就是用一個site文法來實作;用提示詞也是一樣的。

ChatGPT沒有做的AI搜尋,是不是下一個戰場

秘塔科技的王益為告訴視智未來,在寫作貓當中可以引用學術文獻作為文章内容的來源說明,這有助于AI幫學生們自動生成一篇論文的底稿。不過截至目前,學術搜尋依然是檢索一些公開的資源,比如知網的網頁版等等。系統隻能抓取标題和摘要等公網能通路的資訊,暫時還不能通路正文等需要付費的内容。

ChatGPT沒有做的AI搜尋,是不是下一個戰場

秘塔AI搜尋也有一個專門的學術搜尋分區,其檢索範圍和寫作貓的學術文獻檢索是一樣的。是以,如果真的有人想“量産”論文,一定要記得親自做好事實核查工作。

其實,AI産品缺内容的問題,不管是在訓練大模型的時候,還是在用大模型去搜尋的時候,同樣都是不能繞開的,如果要強行輸出它原本通路不了的内容,那就會出現幻覺和編造了。

在國内外,都有衆多優質的資訊來源是不開放對外搜尋的,例如購物網站,抖音、小紅書等社交網絡,都是禁止搜尋引擎爬蟲。還有一些社群的法務部門,會在檢測到你使用了他們的資訊之後開始行動。

是以,這些問題既不能在搜尋引擎層面來解決,也不能用訓練大模型來解決,那麼将“搜尋引擎+大模型”結合在一起,肯定也不要指望它能解決。在“圍牆花園”之外,也是巧婦難為無米之炊。

跟全網AI搜尋相比,将收費的新聞産品站内搜尋替換成大模型驅動,可以說有更高的成本效益。這不僅可以改善搜尋品質,也可以成為付費牆的另一個吸引人之處,提高讀者的參與度和付費意願。

在過去的幾個月裡,《福布斯》和《金融時報》推出了自己的對話式文章資料庫搜尋框。Snopes、《衛報》、《商業内幕》等出版商也在考慮使用生成式AI改進其站内搜尋功能。有媒體站方表示,“網站搜尋不是一個廣泛使用的功能,這給了我們一個在低風險環境測試AI的機會。”

VOL.2

AI搜尋,拿什麼抓住使用者

除了你很熟悉的大模型對話框,加入聯網能力之外,還有其它不同的AI搜尋界面形态百花齊放。究其本質,可以說是一樣的原理,換了不同的皮膚。

現有搜尋引擎巨頭會選擇在搜尋結果的最頂部,插入一小段由AI生成的總結,可以參看上文展示的谷歌搜尋的例子。

而早在文心一言上線之前,百度已經推出了名為“AI搜尋智能增強”的能力,現在這一功能已經在越來越多的不同關鍵字的搜尋結果頁面上顯示。

ChatGPT沒有做的AI搜尋,是不是下一個戰場

百度主打一個夠用就行,倒也沒完全追求一定要用大模型來生成。它始終沒有将文心一言跟搜尋結果頁整合,而是停留在“簡單搜尋”等外圍嘗試。

另一種展示方式是類似于微軟必應內建的Copilot。在使用者沒有主動調用Copilot時,輸入關鍵詞的搜尋結果将顯示在頁面的左側,而Copilot生成的内容則顯示在右側。360搜尋的展示方式與必應相同。

ChatGPT沒有做的AI搜尋,是不是下一個戰場

與之相比,并不是由“傳統”搜尋引擎做的AI搜尋,則會使用一種重新設計過的,專門的三欄式AI搜尋界面。這種設計的開創者是AI領域的“當紅炸子雞”Perplexity,這個名稱在英語中意為“困惑”。

ChatGPT沒有做的AI搜尋,是不是下一個戰場

Perplexity的創始人Aravind Srinivas對自己公司開創的這種新型搜尋界面非常敏感,他甚至在X(Twitter)上發文稱Meta AI的首頁設計模仿了他們,引發了一場小規模的争論。

在國内,采用這種界面的包括昆侖萬維的天工和秘塔等。

ChatGPT沒有做的AI搜尋,是不是下一個戰場
ChatGPT沒有做的AI搜尋,是不是下一個戰場

風頭正勁的Arc浏覽器的iOS版本,對AI搜尋采用了一種更簡潔明了的“變體”界面,隐藏了其它競品中一些可能幹擾使用者的可選項。

ChatGPT沒有做的AI搜尋,是不是下一個戰場

因為開源社群的幫助,做一個AI搜尋的“開發成本”現在已經做到很低,甚至出現了可以同時選擇搜尋API和大模型API切換的開源界面方案,就是搜尋引擎+大模型的“雙重套殼”。

據說這款名叫ThinkAny的外殼由一位獨立的開發者用了3天時間開發完畢。選擇搜尋範圍、生成思維導圖,切換大模型引擎,這些功能一個不落。

ChatGPT沒有做的AI搜尋,是不是下一個戰場

這樣一看,AI搜尋實際上是給大模型又套上了一層新的皮膚,找到了一個新的使用場景,也在解決人們對ChatGPT式聊天界面的“審美疲勞”。

如果這真的有用,那就像在去年年中來了一場“百模大戰”一樣,在接下來的一兩個月,很有可能也會出現“千搜大戰”的局面。

當ChatGPT最初引發轟動時,許多人都将對話框視為一種新形式的搜尋,新的“網際網路入口”。當時,視智未來還釋出了一份關于如何生成有效提示詞的《ChatGPT内容行業實用白皮書》,這些内容至今仍具有參考價值。

實際上在“傳統”搜尋引擎時代,早有人困惑,為什麼在搜尋相同内容時,有些人能迅速找到答案,而其他人卻一無所獲?這可能涉及到所謂的“搜尋引擎情商”。

當人們的輸入從幾個關鍵詞擴充為更完整的提示詞後,這個問題不但沒有緩解,反而更嚴重了。人們不得不研究各種“咒語”或繁複的輸入形式,甚至有專門的“提示詞工程師”職位。大模型聊天産品的易用性對普通人來說,其實是下降的。

根據報道,谷歌正在研究新的工具,能讓使用者在查詢時先經過一次提示詞基礎優化,然後再将優化後的提示詞送給大模型,以期得到更優的答案,但效果尚待觀察。

人們通常不願意從舊産品遷移到新産品。是以,習慣了傳統搜尋的使用者,至少可以在原有的服務中無縫體驗AI的新功能。相反,全新的服務可能會利用傳統的搜尋結果管道來吸引使用者。

視智未來注意到,位元組跳動旗下的大模型聊天App“豆包”,通過在傳統搜尋引擎中大量推廣,吸引了不少“神秘”的新使用者。有的使用者默默使用豆包,卻不知道其他國内類似産品,如文心一言、通義千問、智譜清言或Kimi都沒聽說過。這一點非常奇怪。

實際上,豆包的政策是首先通過搜尋引擎推廣(SEO)戰術,使用更精确的關鍵詞吸引使用者,然後将這些關鍵詞通過豆包的回答,把引流連結貼到搜尋結果頁面。在推廣抖音的時候,位元組已經熟練運用了這種方法。

ChatGPT沒有做的AI搜尋,是不是下一個戰場

可以預見,如果有人通過某種方式,将自己的搜尋請求從傳統搜尋引擎完全轉移到豆包,并形成了新的習慣,這就意味着哪怕是本來不需要大模型的搜尋請求,他們也是用AI搜尋,因為他們更不願意混搭使用多個不同的工具。

VOL.3

AI搜尋,怎麼才能不虧本

當所有人都湧入AI搜尋賽道,是“學有餘力”的大廠能赢,還是小但更專注的初創團隊勝出?在不同的視角肯定有不同的答案,秘塔的COO王益為就從“小廠”角度出發,說了他自己的看法。

如何在其它家都做搜尋的時候,展現差異化的競争力?王益為說,“沒有廣告,直達結果”是秘塔AI搜尋希望反複提及建立的使用者心智。

因為年輕人是寫作貓産品最大的使用者群,在産品剛一開始設計時,秘塔就決定放棄直接的廣告形式。“沒有廣告,主要是考慮要吸引什麼樣的人。我們釋出的第一條推廣視訊就是在也沒有廣告的B站釋出的。”

對于百度和微軟都提到過會研究“軟性植入”結果中的付費廣告位,王益為也态度謹慎,他說底線是推廣結果不能影響答案的準确和公正。

“我認為一開始他們可能會選擇簡單粗暴的方式,就像谷歌那樣直接在頁面上展示廣告。但随着時間的推移,可能會變得更加微妙,例如提供服務連結。你搜尋‘家裡漏水怎麼辦’,下面可能直接出現相關服務商的聯系方式。但這需要考慮周全,你需要確定推薦的服務有一定程度的可靠性和背書,如果推薦的服務不靠譜,會直接影響到搜尋引擎的聲譽。這件事情的風險很大。”

秘塔AI搜尋的目的是直接給出使用者需要的結果,而不是讓使用者在大量資訊中篩選。王益為提到,“直達結果”是他們的目标。它的“研究”模式動辄一次生成3000字,在一大堆文本湧現出來的時候,确實令人印象深刻。

盡管這些字數很大程度上不能一字不改直接使用,但它一次給你3000字,你自己縮成五六百字能用的,也不失為一個解決之道。

在這方面,不同産品的表現差異,更主要展現在基底大模型的差異上。秘塔的多款産品共用一個自研大模型,王益為表示,因為他們的模型在語料方面積累更深,是以參數也不必一味求大,100億(10B)對完成寫作文章的任務優化來說已經足夠。

秘塔AI搜尋還能提供更深入的服務,比如轉換成思維導圖、以及“一鍵生成PPT”用于業務彙報。當然,也有其它家的産品提供将結果“一鍵生成資訊圖表”等類似的功能。

放棄廣告位,也意味着秘塔AI搜尋對C端商業化的規劃,仍将以會員訂閱為主。

“從内部來看,我們會在産品達到一定品質标準時才釋出。通常,如果有人願意為此付費,就說明産品達到了我們自己認為的‘80分’水準,是真正有用的,而不僅是玩具。”

王益為表示,“秘塔AI搜尋現在産品大概是80分水準。如果要達到90分或更高,使用者有強烈的付費意願,我們不排除将來收費,或者隻對‘研究’模式收費。但我們還沒有确定。”

收多少錢合适呢?文心的進階版一個月收費40元,360也在收費。“目前天工它們還沒有收費,但它們有能力收。”

“我認為這是一個核心問題,你是否敢于收費?如果你不敢收費,就不能驗證自己的産品是否有價值。無論你怎樣誇大其詞,最重要的是,是否有人願意為之付費。如果有,那就很了不起。如果沒有,就說明問題了。”

寫作貓仍是秘塔目前的主力業務,大約占了收入的80%。寫作貓現在有大約120萬注冊使用者,付費使用者大概隻占3-4%。主要客戶仍然是公務員和學校的個人使用者。

此外,法律翻譯服務仍在穩定地提供現金流。“今年剛開始銷售的MetaLaw也表現不錯,我認為今年能賣出幾百萬(元的銷售額)是沒有問題的。”

這種收入結構讓王益為有點隐憂,因為通用大模型已經在改寫、糾錯等方面做得很好,

“我們提供的API服務,比如錯别字檢查、改寫等,都比大模型的服務貴。不是因為他們能降成本,而是被GPT卷得價格非常低,實際上都是虧本的。而且使用我們API的人同樣可以使用GPT。是以這部分簡單任務的收入隻要能保持穩定就不錯了。”

對話中,王益為還向視智未來分享了另一個經驗之談。

“我有個理論,(在國内)一個工具的合理定價,大約是它所替代的工作價值的1/10。例如,MetaLaw的産品定價是499元/年。這個價格對許多律師來說是可接受的。否則,他們可能認為是有點用途,但是不值這個價。最開始我們嘗試了一個1599元的價格,但一個都沒賣出去。後來我們降到499元,付費意願就上來了。”

ChatGPT沒有做的AI搜尋,是不是下一個戰場

秘塔因為創始人的背景因素,可以對法律AI創業輕車熟路,也見證了不少其它貿然進入法律AI的開發者碰壁。盡管如此,他們仍然深刻感受到追求盈利在國内的艱難。

“要知道,全國總共隻有70萬名律師。在這70萬人中,可能隻有10萬人會使用AI産品。即使其中一半人購買了這個産品,按照我們現在的定價,也隻是2500萬的收入。要實作1億的營收,就需要再找到3個類似的場景。”

如果今天正是“千模大戰”的前夜,那麼上面這些資訊可以讓我們窺探AI搜尋的實際發展空間有多大。

AI搜尋工具肯定會越來越多樣和強大,但單純的将大模型聯網再改個形式,恐怕并沒有真正了解搜尋引擎的本質,也不了解使用者如何使用搜尋。

搜尋引擎不僅僅是用來尋找資訊的工具,更是一個多功能平台,能夠直接回答問題,提供電腦、轉換器等小工具,以及各種其他内置功能。

目前的AI搜尋雖然在某些方面比傳統搜尋更有優勢,但它們的生成速度慢、結果呈現少、選擇偏向不明确等問題,影響了結果準确性這一根本名額。

同時,改成搜尋框後的使用者體驗也并沒有産生本質上的飛躍。從這個意義上講,OpenAI這次是用GPT-4o做語音助手,确實可能比推出搜尋産品更有趣一些。

未來搜尋引擎的發展,将更多取決于産品創新而非技術進步。要超越谷歌、百度、必應們,恐怕需要的不是先做一個聯網的大模型再說,而是始終關注如何才能解決使用者的實際問題。

歡迎長按或掃描二維碼收聽《對話AI創業者》播客采訪王益為的完整版:

ChatGPT沒有做的AI搜尋,是不是下一個戰場

繼續閱讀