天天看點

百川智能推出參數量130億通用大語言模型 今年内追上ChatGPT?

作者:中國經營報

本報記者 李昆昆 李正豪 北京報道

近日,搜狗公司原CEO王小川創辦的百川智能正式釋出參數量130億的通用大語言模型Baichuan-13B-Base、對話模型Baichuan-13B-Chat及其INT4/INT8兩個量化版本。

王小川表示:“我們期待國内大模型行業以及垂直領域能夠在此基礎上開發出更多優秀産品及行業應用,讓技術在真實、豐富的應用場景中快速疊代創新,我們願與衆多企業、開發者一道為國内開源社群的生态繁榮貢獻自己的力量。”

優勢和劣勢

“現在做大模型的公司很多,但做大模型尤其是通用人工智能大模型很燒錢。”一位人工智能從業者向《中國經營報》記者說,目前大模型賽道很熱,但是最後跑出來估計也就3~4家,其他估計是圍繞這幾家做相關的生态和應用落地。

上述人士稱,對于大模型創業公司而言,資料是個大問題,還有算力問題,訓練成本也很高。OpenAI有特殊性,其前期獲得好幾個巨頭的支援,現在很少有巨頭這樣支援創業公司了,很多都得自己做。

2023年4月10日,王小川官宣創辦百川智能——一家研發并提供AGI(通用人工智能)服務的中國公司,旨在打造中國版的OpenAI基礎大模型及颠覆性上層應用。百川智能宣稱将借助語言AI的突破,建構“中國最好的大模型底座”,并在搜尋、多模态、教育、醫療等方面增強,幫助大衆輕松、普惠地擷取世界知識和專業服務。

談及公司名稱的來源,王小川解釋道:“百川本意是衆多的河流彙集奔赴海洋,象征着衆多資料、行業知識彙聚成為一個強大的智能體系,生生不息。百川也象征着集百家智慧,更多人與其一道共赴山海。”

王小川的邏輯是“知識密集型”領域是他核心要突破的點,教育和醫療就是他眼中的知識密集型方向。他一直在追求“生命的意義”。

據了解,通用大語言模型Baichuan-13B-Base是百川智能釋出的第二款通用大語言模型,而在前不久的6月15日,百川智能就已經推出了首款70億參數量的中英文語言模型Baichuan-7B,并一舉拿下多個世界權威Benchmark榜單同量級測試榜首。

談及百川智能的優劣勢,愛分析首席分析師李喆向本報記者說:“百川智能目前做的是基礎大模型,未來應該是要做通用大模型和B端/C端應用。我們目前是按照算力資源、資料集、AI工程化和生态四個次元對大模型廠商進行評估,百川智能的優勢是資料集和AI工程化能力,資料集是有中文場景語料資料積累,AI工程化方面主要展現在其算法架構層和模型層的優勢,算力資源和生态相比其他廠商存在劣勢,百川‘屯卡’(指GPU闆卡)時間太晚,推出基礎模型的時間也落後于其他大模型廠商。”

李喆稱,C端受限于監管等因素,短期發展不會特别快,重點肯定是B端。B端一般會從大模型廠商未來商業模式出發,去思考大模型市場的未來競争格局。大模型廠商未來商業模式包括:一是API調用、二是大模型license/一體機、三是行業應用(應用産品、解決方案)。API調用未來肯定都是雲廠商的市場機會,百川智能的機會在于大模型license/一體機和行業應用,比較看好百川在行業應用方面的市場機會。

機遇和挑戰

此前,王小川曾向媒體說:“追上ChatGPT水準,我覺得今年内就可能實作,但對于GPT-4或者GPT-5,我認為可能需要三年左右的時間,應該不會低于兩年。”

王小川坦言,當下國内大廠産品和ChatGPT有較大差距,我們就要不斷追OpenAI。“現在首先百川智能要做的,就是中國最好的大模型,然後去美國挖人才再追它(OpenAI)。這比較現實一點,人家做‘長生不老丸’,我們先做個‘延年益壽丸’。”

百川智能的對手很多,國産大模型“軍備競賽”以“天”為計不斷更新,阿裡巴巴、華為、京東、商湯都在争奪這趟通用人工智能(AGI)列車席位。

掌櫃智庫進階顧問沈陽告訴本報記者,對比其他AI公司,百川智能的優勢有:一是技術理想,公司具有優勢,王小川目前是最好的狀态,也是國内在AGI領域認知最深刻、最有資本和人才、最有國際視野的人,他的認知超越同行,至少是當下最領先。特别是他的技術潔癖,可以遠離商業,追求AGI的突破。二是中華傳統文化的浸潤較多,目前的領先公司多是海外公司,王小川具備傳統中華文化的底蘊。三是對AGI的認知深刻,這是王小川的百川智能最大的亮點,也可能是其他AI公司無法觸及的高度,百川智能是目前國内能看見的最有可能突破AGI的公司。

沈陽認為,謹慎看好的原因則是:一方面王小川一直比較順利,沒有經曆太大的磨難,可能在自我的修煉和提升上,還沒有遇見大的障礙和瓶頸,這樣可能不太具備巨大的突破能力,這個确實是個人修為的問題;另一方面目前醫療和教育領域可能是最好的AGI的突破領域,但是解決的路徑太“物化”,更多在看資本、人才、算力、資源等這些領域,沒有太關注“意識”和“認知”這些高次元能量的領域,這可能是一個缺陷。

王小川表示:“Baichuan-13B是百川智能為科技強國送上的一份禮物。”

(編輯:吳清 校對:顔京甯)

繼續閱讀