天天看點

大模型競争突然更新!亞馬遜 CEO 親自監督、組建新的核心技術團隊

作者:InfoQ

作者 | 淩敏、核子可樂

亞馬遜“最具野心”的大語言模型,将會是什麼樣?

亞馬遜被曝組建新團隊研發大語言模型

據外媒 Insider 近日報道,亞馬遜 CEO Andy Jassy 目前正直接上司一支新團隊,負責開發該公司最具野心的 AI 項目。

Jassy 告知亞馬遜的 S-team(由 20 多名高管組成的亞馬遜最高決策團隊),他将提拔 Alexa 首席科學家兼進階副總裁 Rohit Prasad 作為自己的直接下屬,向他直接彙報。目前 Jassy 共有 16 名直接下屬,包括 Devices and Services 進階副總裁 Dave Limp、零售業務負責人 Doug Herrington、雲計算 CEO Adam Selipsky 以及 CFO Brian Olsavsky 等。

根據 Insider 獲得的一封内部郵件,Prasad 将在新位置上組織建立新的技術小組,緻力于為亞馬遜打造“最具野心”的大語言模型。

大語言模型是 AI 工具中的底層技術,能夠從巨大的訓練資料集中學會生成與人類相似的響應結果。OpenAI、谷歌和 Meta 等企業都已建立起規模龐大、功能強勁的大語言模型,并在全球範圍起掀起熱潮。亞馬遜之前也有相關布局,成果包括 Alexa Techer Model 和 Titan。

在 6 月末發出的這封郵件中,Jassy 稱 Prasad 将上司一支“中央小組”,負責建構亞馬遜“最具泛用性”的大語言模型。

“簡單說一下,Prasad 将調任新崗位,負責上司一支中央小組并建構我們最具泛用性的大語言模型。雖然我們已經在公司内部建構起多個大語言模型,還有另外幾個項目也在推進,但這次我們将集中優勢資源打造最具野心的大語言模型,并由 Prasad 上司這支隊伍。在新崗位上,Prasad 将向我直接報告。”

資料顯示,Prasad 統領 Alexa 團隊已經超過十年,同時他也是 Dave Limp 上司的亞馬遜 Devices and Services 團隊中的一員,并将繼續承擔這方面工作。

根據 Insider 看到的另一封郵件,就在 Jassy 于 6 月宣布上述決定後不久,Limp 在團隊内部發出通告,稱 Prasad 仍将是“Alexa 的關鍵合作夥伴與支援者,并将在我們的未來業務中發揮重要作用。”這封郵件稱,亞馬遜 Devices 副總裁 Daniel Rausch 将接掌 Alexa 産品與業務組織,包括各娛樂、合作夥伴參與及跨國團隊。

Limp 在郵件中強調,“我們在 Alexa 的使命和願景上沒有動搖,對于我們向客戶傳遞新發明、新成果的能力,我也比以往任何時候都更加樂觀。”有消息顯示,亞馬遜最近還啟動另一個新項目,希望利用類似 ChatGPT 的技術讓 Alexa 變得更智能、更富個性化。

目前關于 Prasad 上司的新團隊并未有更多消息流出,但可以看到,亞馬遜在這場大模型競賽中已經準備好了,至于未來能帶來什麼樣的驚喜,還需要交給時間。

亞馬遜入局“大模型之戰”

根據 Insider 之前的報道,亞馬遜正急于應對生成式 AI 的迅速崛起。盡管亞馬遜過去數十年間一直緻力于 AI 技術研究,但微軟、OpenAI 和谷歌等競争對手明顯取得了一定優勢,Meta 最新的 Llama 2 模型也在整個科技行業内掀起了波瀾。為此,亞馬遜決定在新計劃中立足亞馬遜雲科技事業部組建新團隊,專注于幫助客戶使用生成式 AI 産品。

亞馬遜的 AI 産品布局

在這場大模型競賽中,亞馬遜雲科技已經交出過不少答卷。今年 4 月,亞馬遜推出了 Amazon Bedrock 服務、Amazon Titan 大語言模型,以及 AI 編碼助手 Amazon CodeWhisperer。

其中,Amazon Bedrock 既提供自研的大語言基礎模型—— Amazon Titan Text 、Amazon Titan Embeddings,也與 AI21 Labs、Anthropic、Stability AI 等基礎模型提供商廣泛合作,助力企業輕松靈活建構生成式 AI 應用,降低所有開發者的使用門檻。

Andy Jassy 在此前接受 CNBC 采訪時表示,“大多數企業都想要用上大語言模型,但頂尖 AI 模型需要幾十億美元和長達數年的訓練成本和周期,使用者肯定不想親自動手。是以,他們希望能在規模夠大、性能更好的基礎模型之上工作,再根據自身需求對其做出定制。而這,就是 Bedrock 的基本定位。”

Amazon Titan 基礎模型可以識别和删除客戶送出給定制模型的資料中的有害内容,拒絕使用者輸入不當内容,過濾模型中不當内容的輸出結果。Titan 系列模型分為兩種,一種是用于内容生成的文本模型,另一種是可建立矢量嵌入的嵌入模型,用于建立高效搜尋功能等。

AI 模型經常會出現“一本正經地胡說八道”現象,盡管輸出内容看似有理有據、令人信服,但實際上并沒有相關訓練資料可以支撐。針對 AI “幻覺”問題,亞馬遜雲科技副總裁 Bratin Saha 此前在接受外媒采訪時表示,亞馬遜非常關心準确性,并努力確定 Titan 模型能夠生成高品質的響應結果。

據外媒報道,十幾年前起就一直在亞馬遜工作的 Sivasubramanian 表示,亞馬遜在 AI 領域已經持續投入二十多年,亞馬遜雲科技目前擁有超過 10 萬家 AI 相關客戶。他同時補充稱,亞馬遜也一直在使用 Titan 的微調版本傳遞首頁上的搜尋結果。

Amazon CodeWhisperer 則是一款面向個人開發者免費使用的輔助代碼編寫工具,是一種人工智能代碼生成擴充,目标是提高軟體開發者的工作效率。CodeWhisperer 可以更快地完成更多工作,避免軟體開發人員花費大量時間編寫非常簡單且無差别的代碼,CodeWhisperer 作為 AI 編碼伴侶,它能根據開發人員的自然語言評論和內建開發環境 ( IDE ) 中的先前代碼實時生成代碼建議,從根本上提高開發人員的工作效率。

“大型語言模型和生成式 AI 對亞馬遜意義重大”

在釋出上述 AI 服務/産品的同一天,亞馬遜還釋出了 2022 年度股東信,Jassy 在信中提到,公司正大力投資大型語言模型和生成式 AI。

Jassy 表示,LLM 和生成式 AI 是能讓“亞馬遜未來幾十年可以在每個業務領域都進行創新的核心”,将顯著加速亞馬遜已經深耕了 25 年的機器學習的應用,他稱生成式 AI 具有變革性,對客戶、股東和亞馬遜來說都意義重大:

“亞馬遜研發自己的 LLM 已有一段時間了,相信它将改變并改善幾乎每一種客戶體驗,并将繼續在所有我們的消費者、賣家、品牌和創作者體驗中大量投資這些模型。

與多年來亞馬遜雲科技的發展路徑一樣,我們正在推動各種規模的公司都可以利用生成式人工智能。亞馬遜雲科技提供了最具成本效益的機器學習晶片 Trainium 和 Inferentia,使得小型和大型公司都可以負擔得起在生産中訓練和運作他們的 LLMs。

亞馬遜的商業客戶可以從各種 LLMs 中進行選擇,并使用客戶喜好的所有 AWS 安全、隐私和其他功能建構應用程式。此外,我們正在提供像 AWS CodeWhisperer 這樣的應用程式,它通過實時生成代碼建議來革命性地提高開發者的生産力。”

Jassy 最後提到,他本可以用生成式人工智能寫一整封信,但他要把這封信留到未來。大型語言模型和生成式人工智能對客戶、股東和亞馬遜來說都将是一件大事。

參考連結:

https://www.businessinsider.com/amazon-ceo-andy-jassy-oversees-group-most-ambitious-ai-models-2023-7

https://www.infoq.cn/article/j3qbSPiG9Hmapal2exir

https://www.cnbc.com/2023/04/13/aws-launches-bedrock-generative-ai-service-titan-llms.html

活動推薦:

2023年9月3-5日,「QCon全球軟體開發大會·北京站」 将在北京•富力萬麗酒店舉辦。此次大會以「啟航·AIGC軟體工程變革」為主題,策劃了大前端融合提效、大模型應用落地、面向 AI 的存儲、AIGC 浪潮下的研發效能提升、LLMOps、異構算力、微服務架構治理、業務安全技術、建構未來軟體的程式設計語言、FinOps 等近30個精彩專題。咨詢購票可聯系票務經理 18514549229(微信同手機号)。

繼續閱讀