亞馬遜雲科技AIGC全家桶Bedrock炸裂登場，開放定制，隐私拉滿

新智元報道

編輯：編輯部

【新智元導讀】模型不open？沒關系，亞馬遜雲科技幫你open。官宣Bedrock平台，定制晶片打下訓練推理成本，生成式AI競賽，越來越精彩了。

如火如荼的AI競賽，亞馬遜雲科技也下場了。

有些不同的是，除了自己建構的AI模型，他們還招募第三方在亞馬遜雲科技上托管模型。

憑借這個叫Amazon Bedrock的平台，亞馬遜雲科技正式進軍生成式AI賽道。

在極優性能的雲基礎設施上，大規模運作生成式AI應用，毫無疑問，亞馬遜雲科技在掀起一場颠覆性變革。

AIGC的「基石」：基礎模型

過去的十多年裡，人工智能領域大部分研究集中在訓練神經網絡來完成一項特定的任務。

比如在CV中，圖像分類、分割、或者識别圖中是否是一隻貓；在NLP中，語義檢索、翻譯等等。

直到ChatGPT的橫空出世，甚至可以說最早從Stable Diffusion開始，生成式AI的能力逐漸打破人們原有的認知。

在大模型加持下的AI工具，不僅能創造新穎的内容，還能夠生成圖檔、視訊、音樂，以往它從未見過的東西。

研究者發現，當參數量足夠多，或者達到一定規模時，大模型就會出現一種不可預測現象，也就是「湧現」能力。

随着機器學習進步，特别是基于Transformer的神經網絡架構，使得開發數十億參數規模的FMs成為可能。

正是GPT-3、DELL-E、GPT-4等超大模型興起，讓語言模型的訓練範式發生了重大變化。

模型訓練過程不再過度依賴顯性标注，能夠根據句子中已有單詞，預測一下詞，實作了智能體的認知能力進步。

其實，這些大模型就是李飛飛等人在2021年提出的「基礎模型」（Foundation Models）。

因為在大量的資料上進行了預訓練，基礎模型已具有了高度适應性，能夠完成一系列下遊任務。

基礎模型的優勢就在于，可以被用于微調的特定領域，或者建立一個業務模型的起點。在了解數行為方面，FM當然是最好的。

微調模型，就需要在特定資料集（有标注）進一步訓練而來的模型。

而這種資料集是解決特定任務所需的，因為大模型隻能做到「很懂」，但不能做到「很專」。

微調後的模型結合了2點優勢：一是對資料結構的了解，再一個是通過标注資料的形式了解業務問題的背景。

這樣一來，微調後的模型同樣能夠實作，在特定領域生成類人的文本或圖像。

就比如，彭博推出了金融領域專用的500億參數大模型BloombergGPT。

由此可見，基礎模型是生成式AI的關鍵，是AIGC的基石。

大模型雖好，但一般人并用不起

當下，整個業界呼聲最高的便是，哪裡有大模型可用。

我們都知道，訓練一個超大規模的語言模型，同樣離不開三駕馬車：算法、算力、資料。

而且還需要的是超強算法、超大算力和資料。

就拿訓練ChatGPT來說，微軟曾揭秘了為OpenAI斥資數十億美元，用了3萬多個英偉達A100打造超算。

為了擺脫這一困境，報道稱微軟早在2019年開始，就投入300人團隊自研晶片Athena。

資料方面，雖然現在僅依靠少樣本資料來訓練模型，但資料可用性也是一大難題。

最近，紐約時報稱，Reddit便開始計劃向使用平台資料訓練模型的公司收費，其中就包括微軟、谷歌、OpenAI等公司。

而要訓練出真正優秀的大語言模型，不僅需要耗費資本，還需要足夠多的時間。2022年，GPT-4模型訓練完成後，還用了6個月的時間，進行了微調和測試。

這也恰恰解釋了為什麼大多數公司都想用大型語言模型，但又不想投入太多成本。隻想借用基礎模型泛化能力，用自己特定領域的資料，去微調模型。

對此，亞馬遜雲科技做了大量的使用者調研後，發現客戶的主要需求是——

1. 需要一個簡單的方法來查找和通路高性能基礎大模型，既要提供出色的結果，也要符合自己的目标。

2. 需要模型能夠無縫地內建到應用程式中，而不必管理龐大的基礎設施叢集或産生大量成本。

3. 希望能夠輕松獲得基礎大模型，并使用自己的資料（少量或大量資料）建構差異化應用。

由于客戶希望用于定制的資料是非常寶貴的IP，是以他們需要在此過程中保持完全的保護、安全和隐私，并且他們希望控制其資料的共享和使用方式。

Bedrock：主打的就是一個模型定制+資料隐私

為了解決這些問題，亞馬遜雲科技認為，應該讓生成式AI技術變得普惠起來。

也就是說，AIGC并不獨屬于少數初創公司和資金雄厚的大廠，而是要讓更多公司從中受益。

于是，一個名為Bedrock的基礎大模型雲服務，便應運而生了。

而Bedrock也是亞馬遜雲科技在生成式AI市場上最大的一次嘗試，根據Grand View Research的估計，到2030年，該市場的價值可能接近1100億美元。

值得一提的是，Bedrock最重要的特色，就是讓開發者能夠輕松定制模型，并建構屬于自己的生成式AI應用程式。

在訓練時，Bedrock會為開發者建立一個基礎模型的副本，并對此私有副本進行訓練。其中，所有的資料都經過加密的，并且不會離開虛拟專用雲（VPC）。此外，這些資料也不會被用來訓練底層大模型。

此外，開發者還可以通過在Amazon S3中提供一些标注示例來為特定任務微調模型，無需大量個人資料就能産生比較滿意的結果。

更重要的是，Bedrock可以與平台上其他的工具和功能配合使用，這意味着開發者無需管理任何額外的基礎設施。

自研「泰坦」+第三方SOTA模型

具體來說，Bedrock主要包含兩部分，一個是亞馬遜雲科技自己的模型Titan，另一個是來自初創公司AI21 Labs、Anthropic，以及Stability AI的基礎模型。

基礎模型具體包括：

Amazon自研Titan

Claude（Anthropic）

Jurassic-2（AI21 Labs ）

Stable Diffusion（Stability.AI）

Titan基礎模型的建構是基于亞馬遜雲科技在機器學習領域20多年的經驗。

Titan包含了兩個大語言模型，一個是用于生成文本的Titan text，一個是讓網絡搜尋個性化的Titan Embeddings。

Titan text針對的是總結、文本生成、分類、開放式問答和資訊提取等任務。

文本嵌入Titan Embeddings模型，能夠将文本輸入（字詞、短語、大篇幅文章）翻譯成包含語義的數字表達（embeddings嵌入編碼）。

使用者可以通過自己的資料定制Titan模型。并且，亞馬遜雲科技非常保護使用者資料隐私，不會将使用者資料拿來再訓練Titan模型。

而且，不同于其他大模型時常會出現的「幻覺」，Titan在訓練時非常關注精度，就是為了保證産生的響應一定是高品質的。

除了亞馬遜雲科技的Titan模型，開發者們還可以利用其他的基礎模型。

其中包括AI21 Labs開發的Jurassic-2多語種大語言模型系列，能夠根據自然語言指令生成文本内容，目前支援西班牙語、法語、德語、葡萄牙語、意大利語和荷蘭語。

還有Anthropic開發的大語言模型Claude，能夠執行多輪對話和文本處理任務。

第三個基礎模型便是Stability AI的文本圖像生成模型Stable Diffusion。

通過這些模型，開發者隻用20個樣本，就能一鍵定制自己的模型。

舉個例子，一位營銷經理想為手提包新品開發廣告創意，他隻需向Bedrock提供标注過的最佳廣告，以及新品描述，Bedrock就能自動生成媒體推文、展示廣告和産品網頁。

同樣的，所有資料都進行了加密，任何客戶資料都不會被用于訓練底層模型。

目前，Coda AI、Deloitte、埃森哲、Infosys等合作夥伴已經用上了Bedrock。

AIGC爆發，雲服務供應商需求猛增

随着相關技術的演進，各行各業對于AIGC内容的需求也在不斷增加，從營銷到客服，再到新聞和娛樂等等。

這對于那些提供基礎設施服務的供應商來說，是一個非常好的機會。

根據Gartner的預測，到2025年，AIGC資料将占到所有資料的10%，而目前這一比例還不到 1%。

為了在這個領域占據一席之地，微軟和谷歌相繼推出了基于自家模型的雲服務——前者高調宣布将ChatGPT整合進Azure OpenAI Service，而後者也在Google Cloud上推出了企業級生成式AI工具。

相比之下，亞馬遜雲科技在Bedrock中搭載的模型則更加豐富，不僅有自研的泰坦，還有來自其他初創公司的開源模型。而且，據稱還會有更多的模型加入其中。

憑借其靈活性和定制選項、以及對隐私的承諾，Bedrock更能迎合不同行業的獨特需求。

自研晶片：訓練推理成本被打下來了

現在模型雖然有了，但為了能讓更多人用上，其訓練和推理的成本還需要進一步降低。

亞馬遜雲科技的自研晶片，無疑為其帶來巨大的優勢。

其中，包括Inferentia2和Trainium，可以讓客戶在進行機器學習工作時，将成本降到很低。

與其它EC2執行個體相比，由Trainium支援的Trn1計算執行個體可以節省高達50%的訓練成本。

并且經過優化，可以在與高達800Gbps的第二代EFA（彈性結構擴充卡）網絡相連的多個伺服器上分發訓練任務。

800 Gbps是一個很大的帶寬，但亞馬遜雲科技還宣布新的網絡優化Trn1n執行個體的普遍可用性。

它提供1600 Gbps的網絡帶寬，旨在為大型網絡密集型模型提供比Trn1高20%的性能。

除了訓練需要大量算力，當基礎模型進行大規模部署時，每小時進行數百萬次推理請求也需要大量成本。

亞馬遜雲科技曾在2018年釋出了首款推理專用晶片Inferentia，已經運作數萬億次推理，并節省數億美元成本。

與上一代相比，Inf2執行個體不僅吞吐量提高了4倍，延遲降低了10倍，還可實作加速器之間的超高速連接配接以支援大規模分布式推理。

前段時間釋出的最新文本生成視訊模型Gen-2的公司Runway，有望利用Inf2将部分模型的吞吐量提升至原來的2倍。

20年，刻在DNA裡的AI

20多年來，人工智能和機器學習一直是亞馬遜雲科技關注的焦點。

可以說，在機器學習領域的發明創新已經深深刻在亞馬遜雲科技的DNA裡。

目前，使用者在亞馬遜雲科技上使用的許多功能都是由其機器學習驅動的，比如電子商務推薦引擎、優化機器人揀選路線、無人機Prime Air。

還有語音助手Alexa，由30多個不同的機器學習系統驅動，每周回應客戶數十億次管理智能家居、購物、擷取資訊和娛樂的請求。

截至目前，已經有10萬客戶在使用亞馬遜雲科技機器學習的能力進行創新。

亞馬遜雲科技在人工智能和機器學習堆棧的三個層級都擁有至深至廣的産品組合。

通過不斷投入、持續創新，亞馬遜雲科技為機器學習提供高性能、可伸縮的基礎設施，和極具成本效益的機器學習訓練和推理；

另外，Amazon SageMaker為所有開發人員建構、訓練和部署模型提供最大的便利；

亞馬遜雲科技還推出大量的服務，使用者可以通過簡單的API調用就可添加AI功能到應用程式中，如圖像識别、預測和智能搜尋。

同樣，在生成式AI技術上，亞馬遜雲科技也要邁出重要的一步，讓這項技術也要賦能千行百業。

亞馬遜雲科技所做的就是，将基礎模型的能力讓許多客戶能夠通路、為機器學習推理和訓練提供基礎設施、讓所有開發人員提高編碼效率。

此前，亞馬遜雲科技曾與Hugging Face和Stability AI等公司合作，但從未透露釋出本土大語言模型的計劃。

但亞馬遜雲科技資料庫、機器學習和分析副總裁Swami Sivasubramanian表示，公司長期以來一直緻力于大語言模型，而LLM早就被用來幫助購物者在亞馬遜雲科技的零售網站上搜尋産品，以及支援Alexa語音助手等應用。

亞馬遜雲科技在生成式AI上的幾項創新隻是一個開始。這是一場技術革命的早期階段，并将持續幾十年。

在這個最新的節點上，亞馬遜雲科技将通過自身創新降低AI的門檻，進而賦能千行百業。

據可靠消息：5月25日将舉辦亞馬遜雲科技大模型及生成式AI釋出深度解讀大會，敬請期待。

亞馬遜雲科技AIGC全家桶Bedrock炸裂登場，開放定制，隐私拉滿

繼續閱讀

手把手教你選基金 AI成增長新動能人工智能ETF、雲計算ETF有機會？

數字法治|鄭志峰：人工智能立法的一般範疇

警告人工智能就像核武器,認為中國公司許多被低估! 巴菲特股東大會釋放多個信号

首次公開！美軍AI戰鬥機亮相，人工智能在軍事領域掀起新浪潮！

人工智能，步步逼近奧數天才

大模型+教育見成效，訊飛星火入選教育部“人工智能+高等教育”首批典型應用場景案例

全市具備條件的住宅小區地下車庫今年将實作移動通信網絡全覆寫！人工智能已賦能這些民生領域

人工智能對齊問題的路徑分析和風險防範

從自動化到人工智能，馬來西亞制造業的未來何時到來

國際資訊 | [美]白宮與州地方上司就人工智能治理開展首次公開會議/聖何塞市利用人工智能識别無家可歸者(2024.5)

人工智能如何應用于媒體？BBC做了示範

數字法治|張淩寒、賈斯瑤：人工智能生成内容辨別制度的邏輯更新與制度優化

機器人炫酷比拼！賀蘭縣人工智能創新挑戰賽激發青少年創新力

巴菲特2024年股東大會：回應減持蘋果、透露接班人并預警人工智能

挺牛？美國空軍部長坐進人工智能控制的飛機駕駛艙

馬斯克：人工智能目前在太空探索領域表現不佳