天天看點

決勝AI時代,搜尋超越搜尋

作者:Tech星球
決勝AI時代,搜尋超越搜尋

來源 | Tech星球

文 | 賈甯宇

要說AI圈最近的新頂流,非ChatGPT莫屬。

它似乎無所不能,可以寫詩,做高數題,寫代碼,回答法律、經濟等專業領域的問題。一時間,“ChatGPT能取代搜尋嗎”成為了最熱議的話題。

沒過多久,ChatGPT自己回答了争議,他态度謙遜,稱“我是一個大型語言模型,無法與 Google 或任何其他搜尋引擎進行比較”。

ChatGPT的火爆順勢将其背後采用的技術“AIGC”推向高潮,這是一種通過AI自動或輔助生成内容的生産方式,比如AI作畫、AI聊天、AI語音合成等等。

對于許多人而言,AIGC還是一個新鮮詞,但對于百度的工程師來講則不然。百度是國内最早布局AIGC的大廠之一,用李彥宏的話講,“這是百度天天在琢磨的技術方向”。就在去年年初,百度還精準預言了AIGC的爆發。

更重要的是,技術不止停留在紙面上,而是有了現實的應用。去年4月,利用AIGC,百度的程式員們用李彥宏約300句公開語音資料生成了20萬字的語音書。8月,在AI繪畫模型普遍英文輸入的情況下,早早實作了中文版文生圖模型文心·一格。

在百度看來,AIGC與搜尋引擎是互補關系而非取代關系。在1月10日的Create大會上,百度表示,将推進AIGC與搜尋結合的速度,提升搜尋體驗,對“生成式搜尋”産品進行更新,産品預計近期上線。

這是搜尋産品的一次巨大更新。

和20年前相比,如今的搜尋市場發生了諸多變化,資訊的來源不僅是文字,還包括圖檔、音頻和視訊;對話方式也在改變,使用者有了更多口語化的,模糊的表達。如何更快、更全、更準得給出使用者想要的答案,是搜尋引擎一直努力的方向。

使用者好奇的是,當人類進入第四次工業革命,已經23歲的百度搜尋還能怎麼變?

搜尋成為最大的AI

如果抛開技術的限制,你希望未來的搜尋是什麼樣子?是一把萬能鑰匙,可以解開你心中所有的疑惑?是一個無所不知的AI,以易于了解的問答形式,提供準确的答案?

在形式上,它可能不再是一個搜尋框,而是一個虛拟數字人。可以通過語音與它直接交流讓搜尋變得更簡單,也能俘獲更多使用者。

這似乎更符合搜尋的初衷。因為搜尋引擎誕生至今,一直希望幫助人們更平等便捷地擷取資訊。

暫且不管未來的搜尋。現在,打開最大的中文搜尋引擎百度,你會更清楚得感覺到搜尋的變化。比如當你搜尋“南韓有部電影野獸輪船在空中漂着叫什麼名字”,這種模糊的表達在過去可能沒辦法給出答案。

現在,百度建構了搜尋領域全球最大的語義推理叢集、中文領先超大語義模型,以及基于全網内容的深度問答技術。基于此,針對使用者的模糊表達,百度搜尋可以迅速給出答案。

決勝AI時代,搜尋超越搜尋

再比如,當一個孩子提問媽媽“揚子鳄有多長”時,媽媽搜尋出一段揚子鳄的視訊後,可以根據搜尋提示直接定位到視訊中介紹揚子鳄身長的那一段。這時候,視訊是更為妥帖的解決辦法。

這些搜尋體驗的更新是過去百度在人工智能領域摸爬滾打10年的成果。他們打造了人工智能産品的研發基石:飛槳和昆侖晶片。這10年,百度累計研發投入超過1000億,每年研發占比都超過15%,2021年更是達到23%,AI專利申請量、授予量均連續5年蟬聯國内榜首。

百度重金投入的原因不難了解。

因為,搜尋引擎始終在做一件事情:“如何了解并解答一個人的提問,并給出精準回答”。它的核心技術是自然語言處理,天生具備人工智能基因。換句話說,搜尋公司本身就是AI公司,AI技術的進步才能帶來搜尋的進步。

2020年,百度推出首個智能可互動數字人度曉曉。度曉曉可以對每個使用者形成獨特的記憶,進行個性化對話。這背後是超大規模智能聊天模型、虛拟人動作語音實時合成等多項超前的AI技術。

不止如此。在百度,幾乎所有的AI技術都會優先應用到搜尋,比如跨模态大模型技術、AIGC等等。

技術的投入也确實讓百度在搜尋保持巨大的領先性。這些年來,搜尋引擎的挑戰者不斷,但依然沒有任何人可以撼動百度在中文搜尋引擎領域的領先地位,甚至百度的市場佔有率還提升了——過去一年,規模年同比增長17%。

依托飛槳平台和昆侖晶片,百度建構了搜尋領域全球最大的異構計算叢集,每天可以進行超萬億次的線上深度語義推理,滿足使用者每天數十億次的搜尋需求。這樣的運算規模遠超任何一個人工智能項目,可以毫不誇張得說,搜尋已經成為了最大的人工智能項目。搜尋也是AI規模最大的應用場景。

“知一”、“千流”:搜尋進化的又一次雙向奔赴

任何産品的進化都是一個“雙向奔赴”的過程,需求的誕生催生了技術的發展,而技術的發展又會刺激需求進一步的釋放,進而形成一個良性循環。

網際網路領域的拳頭産品搜尋亦是如此。

百度搜尋每天響應幾十億次真實的使用者使用需求,每天進行1萬億次深度語義推理與比對, 使用者的最真實、最及時的回報倒逼了搜尋技術的進一步發展。

2022年,百度搜尋在技術端最大的回報創新便是“知一”和“千流”。

“知一”是百度在去年萬象大會推出的跨模态大模型。在此之前,百度搜尋背後采用的是語言了解的大模型。

但網際網路發展至今,資訊本身早已不純粹是語言了解的方式,它更多的融合圖像、視訊和各種各樣模态的資訊。使用者的需求表達也已經從單純的一個關鍵詞到現在口語化、冷門的表達;表達方式從單純的文字到語音、圖檔。

想要搜尋服務更新,就必須了解多種模态的資訊。而跨模态大模型“知一”恰好可以更好了解各種各樣的媒介,以及媒介之間的資訊互通産生的資訊,最終可以把更滿足使用者需求的結果呈現出來。

比如,當使用者在百度搜尋“智能鎖哪個品牌比較好”時,百度可以對全網智能鎖的商品資訊進行智能聚合,生成商品榜單,來輔助決策。當使用者搜尋“附近的酒店”時,百度不僅可以找到酒店相關資訊,還能進行多平台比價,完成⼀站式閉環交易。

現在,“知一”能夠完成日均萬億次的超大規模線上預估,能夠處理千億綜合語料和百億視訊語料,每天要進行萬億次的推理。超強的計算能力和了解能力是搜尋準确度和完整度的保證。

事實上,使用者對搜尋的要求一直是更全、更快、更準。這也是搜尋引擎技術提升的關鍵名額。

搜尋技術本身是一個索引技術。

為了迅速找到滿足使用者需求的内容,傳統搜尋引擎依據内容品質橫向分層,基于不同的需求去進行一個定向的觸發。

但當下的問題是,資料規模超前巨大,搜尋引擎又要在毫秒級将檢索結果回報給使用者,同時要使得結果盡可能精确。為此,百度搜尋推出了新的索引技術:千流。

千流能夠把不同次元的資訊進行智能有序的組織,将傳統索引更新成多領域、多元度表達的立體栅格索引。通過模型對每一個請求進行分析,智能判斷檢索路徑,進行栅格化激活。可以說,“千流”是對搜尋引擎後端架構的徹底改造。

這就好像,當你去超市買東西,詢問服務員,在哪裡可以買到中華牙膏時,原本她隻會告訴你哪片區域有牙膏。而千流則可以告訴你在第幾排第幾列的第幾個。千流要做的是,直達使用者心中所想。

據百度透露,千流上線後,索引的機關成本降低了50%,索引計算速度提升了1倍以上,實作了效能的大幅飛躍。

事實上,對于C端使用者而言,後端技術的一次改變可能無法在短時間内有明确的體驗。在一次又一次技術的疊加,足以讓搜尋體驗發生巨大的變化,吸引更多的使用者,也讓百度的基本盤更加紮實。

在百度内部,李彥宏曾多次強調,永遠不要以任何方式遏制使用者的需求表達,在百度20周年的紀錄片上,李彥宏的這句話占了很重要的位置。而知一和千流的推出也表明,百度搜尋一直在想辦法用技術更好地服務使用者的需求。

資料也在證明使用者的選擇。過去一年,百度搜尋的規模年同比實作了17%的增長。去年9月,百度App 月活達到6.34億,同比增長5%,在移動網際網路流量見頂的當下,這樣的成績絕非偶然。

23歲的搜尋将迎來重大更新

當下,搜尋市場規模依然增速穩定,前赴後繼的湧入者都證明了市場的潛力,也證明搜尋的故事還遠未結束。

在Create大會上,百度介紹,基于國内頂尖的中文生成式大模型“文心大模型”,百度正在更新生成式搜尋。百度希望将過去的檢索系統更新成為“檢索+生成”。

現在,搜尋引擎的主流邏輯是找到使用者需要的資訊回報給使用者。而在“檢索+生成”,系統會把搜尋中的資訊通過自己的組織,将規整後的答案提供給使用者,将給使用者帶來産品體驗的全方位更新。

目前,當使用者想了解“北京GDP和上海GDP誰高”時,百度可以直接基于權威資料自動生成近年兩地GDP的走勢圖,直覺呈現高低對比、高多少,而無需使用者分别搜尋兩地GDP再自行計算。

決勝AI時代,搜尋超越搜尋

當你希望用搜尋創造出水墨畫風格的頭像或者情侶頭像時,搜尋可以通過AIGC來生成。生成技術讓搜尋具備了創造力的同時,還可以更具個性化。比如,同樣是搜尋“天空為什麼是藍色的”,小朋友、高中生、大學生搜出來的答案可能會有差别。

2022年,被國際研究機構 Gartner 評定為「本年度五大影響力技術之一」的AIGC也會和搜尋深度融合。在AIGC的加持下,搜尋可以給使用者帶來更加趣味性的體驗,比如上傳一個頭像可以定制自己的兔年版本頭像;輸入關鍵詞可以定制祝福語等等。

搜尋誕生20多年,已經成為了網際網路一項最核心的基礎應用,使用者們希望找到最滿意的答案。可以毫不誇張地講,搜尋已經是網際網路的‘水電煤’。

但它遠未定型。從PC時代到移動網際網路時代,再到如今的Web 3 時代,百度一直保持着在中文搜尋領域的絕對領先地位。過去10年,更是不遺餘力得投入AI技術研發中。

現在,搜尋正迎來AI技術創新的紅利期,一個簡單的搜尋框背後有跨模态超大模型、有超大規模智能語音聊天模型、有檢索+生成等多項AI前沿技術。

沒人可以确切得知道未來的搜尋是什麼樣,但可以确定的是,他一定是滿足使用者新需求的,搭載AI新技術的産物。站在百度的角度講,搜尋引擎的持續領先可以為其不斷夯實基本盤。站在搜尋引擎的角度,百度的對手隻有自己。