天天看點

李彥宏最新内部講話:開源大模型不如閉源,後者會持續領先

作者:酒死了

界面新聞記者 | 李如嘉

界面新聞編輯 | 宋佳楠

4月11日,界面新聞獲悉,百度創始人、董事長兼首席執行官李彥宏在一場内部講話中首次談及文心大模型為何不開源,以及對于大模型開源與閉源的路線選擇的看法。

此外,他還提到了關于AI創業者應該專注模型還是應用、創業公司既做模型又做應用的“雙輪驅動”是否是一個好模式等業界焦點話題。

大模型開源意義不大

在大模型領域,目前有開源和閉源兩種技術路線。

例如馬斯克旗下的人工智能初創公司“xAI”選擇了開源路線,此前其正式開源了全球最大參數的大語言模型Grok-1。Meta的大語言模型Llama系列,以及在開源社群備受關注的Mistral AI等,國内的智源“悟道”大模型、百川智能大模型、阿裡的通義千問模型也都是開源大模型。

掀起大模型熱潮的OpenAI開發的GPT-3.5、GPT-4選擇了閉源,百度文心大模型也是如此。

李彥宏在内部講話中提到,關于文心是否需要開源,百度内部有過非常激烈的讨論,最終決定不開源。當時的判斷是,市場上一定會有開源的模型,而且不止一家會開源。在這種情況下,多百度一家開源不多,少百度一家開源也不少。

“這個市場上不缺我們這一家開源的模型。我們要開源還得自己去維護一套開源的版本,這是不劃算的。”他認為,模型開源的意義其實不是很大,這些開源模型在外零散、小規模地去做各種驗證應用,卻沒有經過大算力的驗證。

在他看來,與傳統的軟體開源不同,大模型開源并非衆人拾柴火焰高。反而是閉源模型在能力上會持續領先,而不是一時的領先。

有行業人士同樣對界面新聞表示,此前開源軟體的優勢在于大家共享代碼,可以做到多人共同修複bug,使得軟體不斷更新。然而大模型本身是一個黑盒,在有人送出修改後就有重新訓練的可能,每次訓練都會消耗大量的算力和資金,并不像從前開源軟體一樣在多人共同開發方面有如此大的受益。

上述人士判斷,長期來看,閉源更能集中智力、算力等資源對大模型進行疊代,比起開源效率更高。

李彥宏也強調,閉源的優勢還在于有真正的商業模式,能賺到錢去聚集算力、聚集人才。在成本上,同等能力下,閉源模型的推理成本更低、響應速度更快。同等參數的情況下,閉源模型的能力也更強。

“今天不管是在中國也好、在美國也好,最強的基礎模型都是閉源的,而各種各樣的小模型、最好的小模型,都是通過大模型蒸餾來的。通過大模型降維做出來的模型就是更好的,這樣也會導緻閉源在成本上、在效率上會有優勢。”他說。

關于大模型的開源閉源之争,百川智能首席執行官王小川此前接受界面新聞采訪時也有所提及。他的觀點是,大模型本身不代表消費端,不像安卓、IOS需要二選一,今天從企業端的角度,開源閉源都很需要。

王小川很看重開源帶來的價值,他認為,未來80%的企業會用到開源模型,因為開源模型小巧,而閉源沒法對很多場景做出上佳适配。

AI創業者的核心競争力并非模型本身

除對開、閉源路線表态外,李彥宏還對AI創業者和創業公司提出了自己的看法。

他認為,一些做模型的創業公司所謂的“雙輪驅動”不是一個好模式,既做模型又做應用,勢必會分散精力。創業公司的精力和資源都是有限的,當資源有限時更應該專注,而不是去搞所謂的“雙輪驅動”。

而對AI創業者來說,核心競争力不應該是模型本身,這是非常耗資源的,而且需要很長時間的堅持才能跑出來。創業者真正的優勢應該是在某一個領域的知識、資料。

“假如你今天想找一個‘黃色的無兜的男士泳褲’,你在任何一個電商平台上都找不到,這種需求目前的技術是解決不了的。大模型如果有領域知識就可以解決,這就是靠領域知識能夠提供獨特價值的例子。”他說。

在他看來,市面上有大量模型,大的、小的、開源的、閉源的,在特定應用當中如何使用這些模型的組合是有技巧的,這是創業者可以幹的事兒,是可以提供價值增益的。

而關于外界所擔心的如果用了文心或者閉源模型,做得好就會被抄襲、被搶飯碗,李彥宏也回應稱,在移動時代,微信沒有去吃掉拼多多,滴滴也沒有變成騰訊的一部分。它們都各自提供了自己獨特的價值,有自己非常不一樣的競争力。它們的興起都是依賴移動生态裡的一個封閉平台——微信,但它們并不怕微信去搶它的飯碗,是以沒有必要擔心基礎模型通吃AI的應用。

中信建投研報指出,目前國内大模型能力逐漸提升,中文領域處理和部分特性如長文本處理等有對齊和領先優勢。随着Kimi熱度提升,國内多家大模型廠商加入長文本能力競争,産業消費端落地加速。國内大模型應用元年已至。

在模型逐漸成熟後,未來大模型将在産品和應用層上展開新一輪比拼和争奪。李彥宏這番講話也是在吸引更多應用層開發者選擇文心大模型。

在此前的百度2023年第四季度及全年财報電話會上,李彥宏透露,百度智能雲四季度總營收84億元,其中大模型為雲業務帶來約6.6億元增量收入。

目前,文心大模型的日調用量已超過5000萬次,季度環比增長190%。去年12月,約有2.6萬家企業調用文心大模型,季度環比增長150%。三星、榮耀、汽車之家等企業均與百度達成合作。

自釋出以來,百度不斷降低文心大模型的推理成本,目前已降低至去年3月版本的1%。

李彥宏還表示,未來,多模态或多模态的融合,比如文字到視訊,是非常重要的基礎模型開發的方向,也是AGI(通用人工智能)的一個必要方向。百度已經在這些領域進行投資,并會在未來繼續進行投資。

繼續閱讀