GPT強大的表達能力和優秀的性能,使得其在大模型領域廣受好評。近日,Meta開源了性能更強的Llama-2,也提供了更加寬松的商用許可。而作為對手的微軟,日前竟然和Meta 宣布将在 Azure 和 Windows 上支援 Llama 2 大型語言模型系列。
即便MT-Bench上前三名的位置,依然被GPT-4、GPT-3.5、Claude-1牢牢把控。(MT-Bench是一個經過精心設計的基準測試,包含80個高品質的多輪問題。這些問題可以評估模型在多輪對話中的對話流程和指令遵循能力,其中包含了常見的使用情景,以及富有挑戰性的指令。)但Meta 副總裁、人工智能部門負責人楊立昆(Yann LeCun)表示,Llama 2 将改變大語言模型市場的格局。随着Llama2免費開源商用,支援者越來越多,開源力量可能重新塑造AI市場的格局。
Llama 2 , 支援者甚蕃
Llama 2基于優化的 Transformer 架構,是來自Meta的第二代開源大型語言模型。據悉,相較于此前版本,Llama 2訓練所用的token翻了一倍至2萬億,而對于使用大模型最重要的上下文長度限制,Llama 2也翻了一倍。該模型提供了一系列參數規模,70 億、130 億和 700 億,以及預訓練和微調的變量。
紮克伯格表示,Llama 1已經可以與OpenAI的ChatGPT和谷歌的Bard聊天機器人的模型競争,而Llama 2的訓練資料比前一代多了40%,有超過100萬的人類注釋來微調其輸出的品質。
Meta 指出,微調的版本采用監督微調 (SFT) 和基于人類回報的強化學習 (RLHF),與人類喜好保持一緻,進而確定實用性和安全性。Llama 2 使用來自公開來源的 2 萬億個位元組資料進行了預訓練。微調的模型用于輔助式聊天,而預訓練的模型可适用于各種自然語言生成任務。無論開發人員使用哪個版本的模型,Meta 的負責使用指南都可以幫助指導通過适當的安全緩解措施定制和優化模型可能需要的額外微調。
衆所周知,微軟幾乎已經和OpenAI唇齒相依,如今與Meta合作,并将Llama 2應用在Azure和Windows産品上,其對于Llama 2的态度可見一斑。據了解,Llama 2使開發人員能夠根據客戶需求在Windows平台上建構人工智能體驗。同時,Llama 2是開源模型,使得開發人員可以更輕松地微調和部署各種參數的Llama 2模型,而Azure作為開放模型生态系統的支援者,為開發人員提供了更廣闊的操作平台。
作為Meta宣布的首批合作夥伴之一,亞馬遜雲科技宣布,客戶可通過Amazon SageMaker JumpStart使用由Meta開發的Llama 2基礎模型。高通則計劃從2024年起,在旗艦智能手機和PC上支援基于Llama 2的AI部署,賦能開發者使用骁龍平台的AI能力,推出全新生成式AI應用。
昨日,阿裡雲在國内推出針對Llama2全系列版本的訓練和部署方案,便于開發者進行再訓練,搭建專屬大模型,用實際行動表明了對Llama 2的支援。阿裡雲PAI的預置環境支援開發者在雲上進行模型微調,并通過通過Web UI及API的方式部署Llama2。
開源大模型另起爐竈
GPT是目前閉源大模型的典型代表,但是閉源也對其産生了一定的影響。比如閉源使得GPT的訓練過程和參數調整不夠透明,難以被外界監督和驗證,可能會引發一些安全性和道德問題。其次閉源的模型缺乏靈活性和可定制性,可能無法滿足特定領域或任務的需求,因為外部使用者無法對模型進行自定義修改或調整。還可能會限制競争和創新,因為其他研究人員和開發者無法對模型進行獨立的驗證和改進,也可能無法将他們的創新和新想法應用于模型。
另一方面,開源大模型的開發成本可能比閉源的更低。這是因為開源大模型的開發可以通過社群的力量進行分散和協作,使得開發速度更快,并且可以節省大量的研發成本。此外,開源大模型可以接受社群的審查和貢獻,這可以確定模型的品質和可靠性。
相比之下,閉源大模型的開發需要更多的資金和人力資源,因為企業需要獨自承擔所有的開發和維護成本,這可能會使開發速度變慢,并且可能導緻模型的品質和可靠性不如開源大模型。Meta 稱,第一版不支援商用的模型開源後,他們收到了超過 10 萬個研究人員的使用申請。如果商用後,其迸發的能量更不敢想象。
值得一提的是,Llama 2開發的可靠性和安全性或将比GPT更強。這是因為Llama 2經過了嚴格的微調過程,以符合人類的偏好和價值觀,這個過程包括了人類評審員對模型輸出的評估和打分,確定它随着時間變得更加可用和安全。相比之下,GPT雖然也經過了一定的安全性測試和過濾機制,但仍然可能産生一些不恰當或有害的回複。是以,Llama 2在安全性方面表現出了較低的不恰當回複率,但也可能導緻對使用者查詢的誤解或過度敏感。
經過對OpenCompass中的中英文資料集分别分析,Llama-2在英語語言能力、知識水準和了解能力上已經較為接近ChatGPT。在中文能力和推理能力上,則與ChatGPT仍然存在較大差距。
英偉達資深人工智能科學家 Jim Fan 坦言,就算現在 Llama 2 程式設計能力不行,開源後很快就會追上來。“大公司的人工智能研究人員因為開源許可問題對第一版 Llama 持謹慎态度,現在我認為他們中的許多人會跳上這艘船(Llama 2)并貢獻他們的火力。”
毫無疑問,Meta希望能借助Llama-2松動 Google 和 OpenAI 的城牆,吸引更多的使用者。同時,用開源換口碑,通過更多的開發者自發傳播,未來或将打造自己的雲服務進一步盈利。