天天看點

十年百度,一直在尋找成長答案

作者:中國戰略新興産業

中國戰略新興産業融媒體記者 蔔文娟

“有問題找百度”,當你有資訊擷取需求時,百度可以告知答案;然而對于百度而言,也一直在尋找成長的答案。

10年前,也就是2013年,在那個行業對AI認知幾乎為零的時代裡,百度率先意識到随着人工智能技術的發展,無人駕駛将有可能實作,開始了對自動駕駛技術十年如一日的壓強投入。過去十年,“ALL IN AI”的聲音依然在耳畔回響,AI帶來的變革,也實實在在地在百度内部發生着。

新一波AI熱潮下,OpenAI、谷歌、微軟等科技公司都在不斷發力AI,百度頂住壓力,戰略初見成效,充分展現了一家網際網路科技企業的核心創新能力。

All in AI

百度轉型人工智能之前,對其他網際網路細分領域的嘗試算不上成功。在移動網際網路的浪潮中,百度雖然推出包括百度空間、百度視訊、百度地圖、百度殺毒、百度hi等二十多個産品,卻“成績平平”。一方面,今日頭條等大流量入口的App蠶食其核心業務;另一方面,一系列負面輿論也壓得百度喘不過來氣。

内憂外患之下,百度把賭注押在了人工智能上。從2013年起,百度先後建立了深度學習實驗室、大資料實驗室、矽谷的百度人工智能實驗室,以及增強現實實驗室,建立起百度大腦。

時間回到2017年初,百度創始人李彥宏請來陸奇來擔任百度COO,負責産品、技術、銷售、營運。陸奇的加入就像一劑強心針,把百度從迷茫中拉回興奮。同年,在百度首屆AI開發者大會上,百度喊出了“All in AI”口号。

在陸奇帶領下,百度顯露出全力押注AI的架勢。經過一輪大刀闊斧的業務架構調整,百度原有的深度學習研究院、自然語言處理、知識圖譜、語音識别、大資料部門等核心技術部門,被整合成AI技術平台體系(AIG),自動駕駛事業部則更新為智能駕駛事業群(IDG)。

陸奇幫助百度成功從依賴搜尋業務的網際網路公司轉型成為AI公司。在合并百度研究院的同時,陸奇砍掉了百度醫療事業部、百度外賣、移動遊戲等多個業務或部門,讓百度放棄了“賺快錢”的管道,并且被推上“決勝AI時代”的舞台。在陸奇離開的4年多時間裡,百度依然在AI賽道持續投入。

2020年,百度宣布全面更新AI體系,對原有的AIG、TG以及ACG進行重新整合。整合之後的系統稱之為百度人工智能體系,包括TPG和ACG兩大群。同時,對原有的四大業務闆塊進行更新,更新為四大事業部。并加大對視訊、工業網際網路以及工業質檢等方面的投入。

從去年開始,元宇宙、數字人、AIGC等關鍵詞基本可以囊括百度所有動作,無論是語言大模型、自動駕駛,還是Web3.0技術産品(百度希壤、百度曦靈數字人平台等),也可以看到,更多的是百度在不斷追逐熱點,尋找業務增量的過程。

例如飛槳是百度在深度學習技術領域深耕多年的核心成果,更是中國首個自主研發、功能豐富、開源開放的産業級深度學習平台。目前,飛槳凝聚了535萬開發者,服務20萬家企事業機關,基于飛槳建立了67萬個模型,已經建構起一個繁榮的深度學習生态。

“讓每一個人都感受到技術帶來的改變,這就是技術的價值。”李彥宏在2021百度世界大會上,用一系列人工智能技術成果展示了百度的AI技術正在出行、生活、産業、自主創新等領域改善着社會民生。總的說來,百度人工智能研究的一個主要目标是讓機器勝任一些一般需要人類智能化才能完成的繁瑣工作,落實于民生,AI才有未來。

文心一言更适合中國市場

“洛陽城裡春光好,陽豔無雙不負賞。紙貴漫天詩詞賦,貴比樂未央”。這是今年3月16日的百度釋出會現場,文心一言即興作的一首“藏頭詩”,不僅如此,它還能準确講出“洛陽紙貴 ”這一成語典故以及對應的經濟學原理。

李彥宏認為,與海外開發的模型相比,文心一言更适合中國市場。首先,生成式AI産品承載着搜尋引擎從“模糊搜尋”到“精準推送”的目标,但是由于中英文的語言結構和文法規則有所不同,且中文語料學習庫少,ChatGPT在同一套機器學習技術和算法下,進行中英文時表現有所差異。其次,百度搜尋的互動方式将發生變革。通過文心一言的加持,百度搜尋可以提供全新的互動方式,使用者可以進行聊天式的持續對話方式,實作對問題的求解。

其實,文心一言并非“橫空出世”。

2019年,百度推出了文心大模型ERNIE 1.0。經過近4年研發和疊代,文心大模型如今已經形成了産業級知識增強大模型技術體系,包括自然語言處理、視覺、跨模态、生物計算、行業大模型,以及支撐大模型應用的工具平台,蘊含了大量自主創新并且在大規模産業應用中得到驗證的技術。目前,ERNIE 3.0每天接受數十億次使用者的搜尋請求,已經擁有千億級參數,并具備智能創作等各類自然語言了解和生成任務。

李彥宏表示,“我們之是以能夠在Google、Meta、Amazon等大廠之前先做出來,是因為我們在晶片、架構、模型、應用四個層面做到全球唯一全棧布局、層層領先,我們在進行聯合優化的時候,多數友商還躺在上個時代的晶片、作業系統和應用這樣的三層架構上。”

百度集團執行副總裁、百度智能雲事業群總裁沈抖表示,“文心一言”内測以來,一個多月的時間裡完成了4次大的技術更新,大模型推理性能提升了近10倍。目前已有15萬企業申請參與内測,其中有超過300家生态夥伴在400多個具體場景已取得測試成效。

百度智能雲雲計算産品解決方案和營運部總經理宋飛表示:“大家可能會覺得堆積算力、寫好代碼、然後進行模型訓練,把它跑起來就行了。實際上在訓練過程中會遇到各種各樣的挑戰,很少有人能夠使得一個大模型訓練過程能夠在連續一兩天内不出問題。百度AI大底座可以為大模型提供高效、穩定的訓練和有效的收斂,千卡加速比達到 90%,資源使用率達到70%,開發效率提升100%,這是AI大底座為大模型的開發和應用帶來的價值。”

據了解,百度計劃逐漸将文心一言融入所有業務,為産品及服務賦能。

Apollo面臨商業化難題

百度的AI戰略另一個有兩大核心,即DuerOS和Apollo。

前者是百度人工智能綜合能力的開放輸出,後者是百度無人駕駛技術的輸出。2021百度世界大會上百度“汽車機器人”Apollo的亮相,意味着埋頭研發8年之久的無人駕駛技術已經從驗證階段進入到規模化商業營運階段。配合無人車出行服務平台“蘿蔔快跑”,其核心創新和服務化新進展也得到全面展現。

據了解,最新一代Apollo RT6,全車共搭載了38個傳感器,包括8個雷射雷達、6個毫米波雷達、12個超音波雷達,以及12個攝像頭。其中車身周圍采用了4顆一徑科技新一代補盲雷射雷達,賦予自動駕駛應用可靠穩定、寬視角、遠距離及高分辨率的三維深度感覺能力。RT6深度融合AI技術和車輛工程,具備高安全、高品質、低成本等優勢,可實作城市複雜道路的無人駕駛能力,成本為25萬元。

《無人之境旅途:2022百度自動駕駛出行服務年度報告》中,百度公布了“蘿蔔快跑”的最新營運成績,2022年蘿蔔快跑平台活躍使用者數量較2021年增長了将近2倍,訂單量也實作了多倍數增長。截至2023年一季度,蘿蔔快跑全國訂單量已超200萬,APP使用者滿意度評價達4.9分,其中5分滿分好評占比最新資料高達97.12%。

“蘿蔔快跑”先後簽約北京、上海、廣州、深圳、重慶、武漢多地,其中武漢等地還實作全無人商業化運作,連安全員都不用。當地乘客在武漢市經開區範圍内的無人車等候點,打開“蘿蔔快跑”APP下單,車子就會自動停靠等候,全程“自助”。

目前,百度Apollo自動駕駛落地新城市技術傳遞時間僅需20天。按照百度方面的規劃,“蘿蔔快跑”的目标是在2025年将業務擴充到65個城市,到2030年擴充到100個城市。

此外,根據全球知識産權解決方案提供商Questel釋出的《2022年自動駕駛和智能交通專利全景分析報告》顯示,百度以1193項進階别自動駕駛專利組數量占據全球第一的寶座。目前,百度Apollo的汽車智能化解決方案已在31個汽車品牌的134個車型上實作量産,累計搭載超700萬輛。

但是,Apollo業務仍然面臨商業化難題,政策示範性的意味還是濃了一些。目前,營運車輛限定固定區域内完成訂單,使用者大多還是以體驗為主,而非真正意義上能夠盈利的商業化營運。

以武漢為例,雖然營運區域内實作了核心商業區、居住區、産業園及高校的覆寫,但測試路線相對固定,隻能滿足部分出行場景的需求。而武漢經開區的“蘿蔔快跑”無人車僅有100多輛,雖然初具規模,但仍然很難支撐起龐大的營運成本。雖然部分地區内無安全員的自動駕駛車輛已經開始投入營運,但離真正的“全區域、全無人營運”還有是較大差距。

李彥宏此前預測,蘿蔔快跑會随着經營規模的進一步擴大,在2024年便開始貢獻利潤。

創新是買不來的

人工智能這條道路一定通向未來,但有多少公司能夠克服種種困難,實作真正的商業化落地,還未為可知。就目前而言,成本問題依然是橫亘在前的難題。

根據國盛證券報告《ChatGPT需要多少算力》顯示,GPT-3訓練一次的成本約為140萬美元,對于一些更大的LLM(大型語言模型),訓練成本介于200萬美元至1200萬美元之間。

這種耗資巨大的投入,并非每一個企業都能支撐得起。

過去十年,百度在AI上進行了巨大的投入。李彥宏曾說:“有1塊錢的時候,我們會投進技術裡;有1個億,我們會投進技術裡;有100個億,我們還是會投進技術裡。”過去幾年百度對重點業務的探索,證明了他對于創新的執着是一貫的,對于技術的投入是長期的、從未動搖的。

2019年,僅僅為推廣一站式開發平台AI Studio ,百度就拿出總價值1億元的免費算力開放;2020年,為培養高校AI人才,飛槳啟航計劃投入總價值5億元的資金與資源;2021年,飛槳再釋出“大航海”計劃,3年投入15億元資金和資源。

2022年世界人工智能大會上,李彥宏表示,百度在AI領域的累計研發投入已經超過1000億元,僅2021年的核心研發占比就達到23%。此外,财報顯示,2022年百度核心研發費用214.16 億元,占百度核心收入比例達到22.4%。

創新是買不來的,百度一直在努力。持續的研發投入也為百度帶來技術水準的成長,這在其專利數量上有所展現。《百度人工智能創新與專利白皮書2023》顯示,僅2022年,百度就獲得5項中國專利獎;在當下的IT技術棧四層模式中,百度在架構層、模型層、應用層三層專利儲備國内第一。

百度首席技術官王海峰認為,專利本身意味着技術是自主研發、行業領先,期待與産業界一起,加快科技自立自強步伐。當下,人工智能正在深刻改變着全球格局和人們生活,引發颠覆性的科技革命,生成式AI的“智能湧現”更助推人工智能産業的加速成長。随着人工智能技術的不斷創新和專利積累的不斷提升,亟待通過專利的推廣、應用和共享,賦能人工智能産業高品質發展。

圍繞AI,百度用十年時間,深耕相關技術領域,從底層的高端晶片昆侖芯,到飛槳深度學習架構,再到文心預訓練大模型,到搜尋、智能雲、自動駕駛、小度等應用,如今百度搭建起了一個由晶片層、架構層、模型層以及應用層組合起來的技術架構,每一層之間,都可以通過不斷互相回報,實作端到端優化。