天天看點

大模型時代,創業廠商或中小型企業如何把握風口?

作者:你的沉默吵到我了

Meta旗下備受矚目的Llama 3大模型本周正式亮相,其超4000億的最大參數規模和15萬億的訓練token規模震撼業界。與GPT-3.5對比,Llama 3在人類評估測評中勝率超六成,被譽為“地表最強開源模型”。

目前,大模型發展正處關鍵轉折點,摩根士丹利報告指出,我們正迎來由軟硬體共同推動的大模型能力快速增長新時代。然而,大模型訓練所需算力前所未有,開發成本劇增,對科技巨頭而言也是巨大挑戰,創業廠商或中小企業更難涉足。

此外,晶片電力供應和AI技術壁壘的增加也構成大模型領域的進入障礙,中小企業恐難與巨頭競争。是以,摩根士丹利看好谷歌、Meta、亞馬遜和微軟等大型科技公司,它們在大模型發展中有望占據主導。同時,創業廠商或可通過發展成本更低的小模型尋找新機遇。

大模型時代,創業廠商或中小型企業如何把握風口?

大模型時代,創業廠商或中小型企業如何把握風口?

未來算力需求迅猛增長,英偉達Blackwell晶片或成關鍵引擎?

摩根士丹利報告揭示,大模型技術飛速發展,算力需求呈指數級躍升。英偉達Blackwell晶片以其卓越性能,成為引領這一增長的關鍵引擎。

GPT系列模型算力需求逐年攀升,GPT-4已消耗大量時間、資源,使用數萬GPU處理龐大token資料。随着GPT-5等後續模型亮相,算力需求将進一步飙升。

超級計算機成為大模型訓練重要工具。摩根士丹利預測,未來十年内,超級計算機為大模型開發提供的算力将比目前高出千倍。Blackwell晶片以其強大性能,助力實作這一飛躍。

采用Blackwell晶片的超級計算機能大幅縮短大模型訓練時間,提升算力效率。這一變革将加速大模型技術發展,推動人工智能領域整體進步。

随着GPT系列模型不斷演進,其算力需求将持續增長,占據英偉達晶片年銷售額顯著份額。英偉達将加大晶片研發和創新投入,滿足未來算力需求。

未來算力增長将為大模型技術發展提供強大支援。英偉達Blackwell晶片作為關鍵引擎,将推動大模型訓練效率提升,加速人工智能領域進步。期待英偉達未來推出更多創新産品,引領算力增長新時代。

大模型時代,創業廠商或中小型企業如何把握風口?

大模型時代,創業廠商或中小型企業如何把握風口?

科技巨頭成大模型時代最大赢家?

大模型時代正蓬勃興起,但背後的開發與訓練卻充滿挑戰,如資本投入、晶片供應、電力需求及軟體開發能力等。這些挑戰形成高門檻,讓科技巨頭獨占鳌頭。

摩根士丹利深入剖析了谷歌、Meta、亞馬遜和微軟在2024年的資料中心資本支出。超級計算機投入巨大,僅1吉瓦的設施就需300億美元,更大規模的更是高達千億。

預測顯示,這四家超大規模計算公司将在未來兩年迎來資本支出的爆發式增長,預計2024年和2025年分别達約1550億美元和超過1750億美元。小企業難以望其項背。

是以,摩根士丹利看好這四家公司的前景,認為它們将直接受益于算力增長。憑借雄厚的資本和技術實力,它們能克服大模型開發和超級計算機訓練的挑戰。機構給予它們增持評級,預示着它們将在大模型時代中繼續領先,成為真正的赢家。

創業廠商的機會在哪裡?

大模型時代,科技巨頭雖占主導,但小公司亦有機可乘。摩根士丹利指出,小模型開發成本較低,為創業廠商提供了發展機會。小模型在特定行業領域能發揮重要作用,實作顯著效益。

創業廠商可關注行業需求,開發符合特點的模型,提供定制化解決方案。其靈活性和專注力使中小企業能迅速響應市場變化。此外,随着大模型技術的普及和算力成本降低,創業廠商可利用先進技術提升産品和服務,與科技巨頭合作,進行資料分析、預測和優化,提升競争力。

比如作為AI準獨角獸和超自動化頭部企業,實在智能自研的垂直大模型TARS(塔斯)在國内大模型各類榜單名列前茅,具備“效果可用、成本可控、定制化訓練、私有化部署”等差異化優勢;在全行業首發可“一句話生成數字員工”的實在 AI Agent智能體産品,既是個人使用者的AI助理,也是政企員工的辦公助手,實作“你說PC做,所說即所得”

在實際應用中,實在Agent能夠模拟并超越人工操作,不僅執行基于規則的重複任務,而且能夠處理更複雜的決策過程,例如在銀行貸款稽核流程中識别潛在風險、解讀非結構化資料,以及跨系統跨平台的資料同步整合。

大模型時代,創業廠商或中小型企業如何把握風口?

大模型時代,創業廠商或中小型企業如何把握風口?

是以,中小企業不必因科技巨頭的主導地位而氣餒。相反,應積極尋找發展機會,利用小模型優勢,在特定行業中實作突破和創新。隻有如此,創業廠商才能在這個充滿挑戰與機遇的時代中立足。

軟體加持下,未來的大模型能做什麼?

在晶片等硬體不斷革新的同時,軟體架構的創新也成為推動大模型能力飛躍的關鍵。其中,Tree of Thoughts架構備受矚目。

2023年12月,谷歌DeepMind與普林斯頓大學的研究人員聯手推出了這一創新架構,其靈感源于人類意識的運作機制,特别是“系統2”思維。與快速、無意識的“系統1”思維不同,“系統2”是一種深度、長期的認知過程,需要更多的思考和規劃。

引入Tree of Thoughts架構後,大模型将能夠更貼近人類的思考方式,展現出更強的創造力、戰略思維以及處理複雜、多元任務的能力。這意味着未來的大模型将不再僅僅是簡單的資料處理器,而是能夠像人類一樣進行深度思考、制定戰略、甚至解決前所未有的複雜問題。

這一變革不僅将大幅提升大模型的能力邊界,更将加速AI技術的普及和應用,為各行各業帶來前所未有的機遇和挑戰。我們期待着這一創新架構在未來能夠發揮出更大的潛力,推動AI技術的持續發展。

計算成本大幅下降,大模型算力飙升

摩根士丹利最新預測顯示,大模型算力的增長正推動計算成本顯著下降。從英偉達Hopper到Blackwell的晶片更新,計算成本已降低約50%。OpenAI的CEO Sam Altman強調,算力未來或成關鍵資源,重要性堪比貨币。

随着成本降低,大模型應用将更廣泛,推動AI技術快速發展。此外,報告預測将建造少數超大型超級計算機,可能選址于核電站附近以滿足能源需求。在美國,摩根士丹利看好賓夕法尼亞州和伊利諾伊州,因其核電站衆多,能穩定供應多千兆瓦電力。

計算成本的下降與超級計算機的建設,将為大模型算力飙升提供強大支援,促進AI技術在各領域的創新應用。我們期待這一趨勢帶來更多突破,推動人工智能發展。

繼續閱讀