天天看點

亞馬遜雲科技生成式AI産品研究院院長:不能依賴單一、萬能的大型語言模型應對各種任務

作者:酒死了

界面新聞記者 | 彭新

界面新聞編輯 |

“絕大多數的客戶并不需要自己從零開始來訓練模型。我們認為不能依賴一個萬能的、單一的大型語言模型來應對各種任務,我們認為正确的做法應該是,客戶可以通路多個模型,然後根據自己的需求和資料來定制自己的模型。”在2023世界人工智能大會(WAIC)期間,亞馬遜雲科技生成式AI産品研究院院長Sherry Marcus發表上述觀點稱,她認為,合理的做法是,應該在大模型的基礎之上,確定以私密和安全的方式讓使用者能夠定制自己的模型。”

Sherry Marcus稱,自己訓練大語言模型或大型多模态模型的話消耗時間和金錢巨大。可行的降低成本的方案是基于一些基礎模型進行建構自有模型,“客戶可以根據自身需求,在大語言模型的基礎之上,進行專業化或者專門化模型的建構,并且使用自己的資料。這樣的話,一方面客戶可以有大模型的豐富度,同時也可以有小模型能夠帶來的快速疊代。”她同意,中國擁有豐富的資料資源,同時在許多垂直領域都存在進行大型語言模型訓練的潛力。

Sherry Marcus介紹,亞馬遜雲科技目前針對生成式AI的各層面均有布局:在底算力層,其推出了Amazon EC2 Inf2執行個體,以亞馬遜雲科技 Inferentia2晶片算力支援,使生成式人工智能具有成本效益的最佳基礎設施。Inf2執行個體在亞馬遜雲科技上規模化運作要求高的生成式人工智能推理工作負載時,提供最高性能、最高能效和最低成本。

與前一代相比,Inf2執行個體的吞吐量高達4倍,延遲低至10倍。這些功能可以帶來比任何其他EC2執行個體高達40%的推理價格性能。此外,由亞馬遜雲科技 Trainium提供支援的Amazon EC2 Trn1n執行個體将很快面向客戶正式提供。Trn1n執行個體提供1600 Gbps的網絡帶寬,為大型、網絡密集型模型提供高達20%的性能提升。

在中間層,亞馬遜雲科技釋出了新服務Amazon Bedrock的預覽版,使生成式人工智能應用程式開發更加簡便。Amazon Bedrock是一項托管服務,通過API輕松通路預訓練的基礎模型(FM)。亞馬遜雲科技同時釋出了自研大模型Titan,包括了Text和Embeddings兩個大語言模型(LLM),分别負責文字處理和用于機器學習的表征向量轉化,亞馬遜雲科技并未公布這兩個大語言模型參數規模。而AI雲服務Amazon Bedrock使得使用者可以通過API來調用Titan和第三方模型,包括了創業公司AI21 Labs、Anthropic、Stability Ai的基礎模型。

此外,亞馬遜雲科技還宣布全面開放AI代碼輔助工具CodeWhisperer,作為生成式人工智能棧的頂層,對個人開發者免費,AI可以幫助程式員生成大量的無差異代碼,進而提高開發效率。亞馬遜雲科技稱,使用該服務的開發者效率提高了57%,成功完成任務的可能性高了27%。該服務目前支援包括了Python、Java和C+等10種以上計算機語言。

目前,亞馬遜雲科技的AIGC解決方案已經有多種應用案例,Sherry Marcus告訴界面新聞,德勤就利用亞馬遜雲科技的Amazon Bedrock發展生成式人工智能(AI)能力,借助該服務,德勤可以為幫助查驗大量資料并定制模型,并将自然語言應用于各種用例。

談到在雲端訓練部署AI模型的安全問題,Sherry Marcus稱,如果客戶使用第三方的模型,這些資料是存儲在亞馬遜雲科技的EC2的伺服器上面的,是以資料是比較安全的。而關于責任劃分的問題,第三方的模型提供商所負責確定準确性和訓練結果的品質,而亞馬遜雲科技所負責的是基礎架構和模型相關的資料方面,是以,我們與第三方共同承擔模型的責任,即安全責任共擔模型。

在AI行業中,一個受到熱議的話題即參數多少,被認為是簡單評價大語言模型品質好壞的簡單标準,部分廠商的大語言模型追求大規模參數名額,并以此宣傳。對此,Sherry Marcus分析稱,當使用大語言模型對這些資料進行訓練時,更關鍵的要素在于資料品質,“如果隻是使用了網絡上的一些資料,那麼即便是使用了非常大的模型,可能最後的準确度并不會很理想。相比來說,如果使用的是相對比較小的模型,但使用的是高品質資料,可能結果未必會輸給前者。”她舉例稱,一些高品質資料,如課本資料、科學資料等,以此訓練的小模型也能夠獲得比較高的準确度。

事實上,針對生成式AI發展相關能力和業務,已經是主要雲廠商無法回避的競争熱點。自ChatGPT爆火出圈後,百度、阿裡、微軟、亞馬遜雲科技将大模型用在企業端,開辟了雲計算新戰場。阿裡雲則在2022年11月提出MaaS(模型即服務)。在5月28日中關村論壇上,周靖人稱,阿裡雲已形成IaaS(基礎設施即服務)、PaaS(平台即服務)、MaaS三層架構,為企業的大模型訓練及推理提供算力資源和機器學習服務。騰訊也在6月19日公布騰訊雲MaaS解決方案,宣布将推出行業精選模型商店,面向金融、文旅、政務、傳媒、教育等十大行業提供超過50個解決方案。在WAIC期間,騰訊雲宣布對MaaS服務進行更新,在基礎架構層面提升GPU使用率、通信性能等。

繼續閱讀