ChatGPT is not all you need，一文綜述6大公司9類生成式AI模型

作者：機器之心Pro 2023-01-31 15:35:00

選自arXiv

作者：Roberto Gozalo-Brizuela、Eduardo C. Garrido-Merch´an

機器之心編譯

編輯：rome rome

生成模型領域裡，ChatGPT 并不是一切。

過去兩年，AI 領域裡已經出現大量大型生成模型，如 ChatGPT 或 Stable Diffusion。具體而言，這些模型能夠執行像通用問答系統或自動建立藝術圖像等任務，這些任務正在徹底改變很多領域。

從目前的發展來看，這些生成模型對行業和社會的影響是巨大的，因為一些工作崗位可能會發生改變。例如，Generative AI 能夠有效且創造性地将文本轉換為圖像，如 DALLE-2 模型；把文本轉成 3D 圖像，如 Dreamfusion 模型；把圖像轉成文本，如 Flamingo 模型；把文本轉成視訊，如 Phenaki 模型；把文本轉成音頻，如 AudioLM 模型；把文本轉成代碼，如 Codex 模型；把文本轉成科學論文，如 Galactica 模型；甚至建立算法的模型，如 AlphaTensor。

在近日由西班牙 Comillas Pontifical University 研究人員送出的綜述論文中，作者試圖以簡潔的方式描述生成式 AI 對目前很多模型的影響，并對最近釋出的主要生成式 AI 模型進行分類。

論文《ChatGPT is not all you need. A State of the Art Review of large Generative AI models》：

ChatGPT is not all you need，一文綜述6大公司9類生成式AI模型

連結：https://arxiv.org/abs/2301.04655

為向可能因使用這些模型而受益的專業人士提供有效資訊，作者按如下結構組織文章。首先，作者提供行業中出現的主要生成式模型的分類。接着對每個類别進行分析。最後，本文會給出相關結論和未來要做的工作。文章中作者沒有詳細介紹每個模型的技術細節，如 Transformer，因為文章的目的是研究模型的應用，而不是研究它們的工作原理。

生成式 AI 模型的分類

在詳細分析每個模型之前，首先将目前的生成式 AI 進行分類，類别代表輸入資料和輸出資料類型之間的映射。如圖 1 所示。作者總共總結 9 個類别，其中每個出現在圖 1 中的模型将在之後較長的描述。由于文章主要關注點是描述生成式 AI 模型的最新進展，為讓讀者能有整體認識，在圖 2 中給出了所有已釋出的模型。

有趣的是，所有這些模型僅由 6 個公司釋出，如圖 3 所示。背後的主要原因是為能夠估計這些模型的參數，必須擁有巨大的計算能力以及在資料科學和資料工程方面技術精湛、經驗豐富的團隊。是以，隻有圖 3 所示的公司，在收購的初創公司的努力下以及與學術界的合作，才能夠成功釋出生成式 AI 模型。

到此已經介紹了最新的生成式 AI 模型，接下來的部分将詳細介紹圖 1 中所示每個類别。

随着技術的進步，我們已經在文本到圖像或文本到音頻等任務中看到了大量的創造力和個性化。它們在文本到科學或文本到代碼的任務中也很準确。這可以在很大程度上提升我們的自動化水準，因為它可以幫助優化創造性和非創造性任務。

然而，由于目前建構它們的方式，這些模型面臨着許多限制。在資料集方面，找到一些模型的資料，如文本到科學或文本到音頻非常困難，使得訓練模型非常耗時。特别需要提到的是，資料集和參數必須非常龐大，這使得訓練變得更加困難。模型最大的問題之一是從資料集中的問題中嘗試獲得解決方案，而模型在解決這些問題時遇到了更多麻煩。同樣，在計算方面，運作它們需要大量的時間和算力。

我們應該意識到這些模型的局限性，以便在接下來的幾年中嘗試和改進它們。

更多細節請參見原論文。

ChatGPT is not all you need，一文綜述6大公司9類生成式AI模型

繼續閱讀

中國是否錯過了第四次工業革命？ChatGPT的出現是否代表中國又錯過了百度和阿裡的AI？确實跟ChatGPT有點差距，但

公告精選丨國光電器：公司研發的能搭載ChatGPT的智能音箱于本月推出；世紀天鴻：未向一筆兩劃提供“筆神作文”AI模型訓練所需資料

Meta大動作！開源多感官AI模型，不僅能看會聽，還能“感覺溫度”

用AI做遊戲？開發者基于ChatGPT建立《BeatSaber》克隆版本。新聞速報：2023.05.11開發人員：使用C

讓ChatGPT調用10萬+開源AI模型！HuggingFace新功能爆火

百度首頁上線AI對話的入口了，所有獲得文心一言内測資格的使用者應該都能看到這個入口了，PC端和手機端的百度APP應用都有。

一鍵控制10萬多個AI模型，HuggingFace做了個「APP Store」

Meta首次公開自研AI晶片的進展，預計該晶片将于2025年正式問世。該晶片名為MetaTrainingandInfer

國外人工智能研究：一種可以通過文本描述直接生成視訊的AI模型

為企業提供AI模型生産力工具，MLOps服務商「星鲸科技」獲數千萬元天使輪融資

晶片戰再起之AMD打破英偉達壟斷？今天半導體行業大事件，無疑是AMD重磅釋出AIGPUMI300X正式向英偉達發起挑戰。

中國科技一旦抱團發展，那進步真的是肉眼可見的！跟英文大模型比起來，現階段，中文大模型多數隻能完成單一任務。如果讓一家企業

好久不關注Ai繪圖了，今天看到一個由日本人開發的名為Bra的AI模型，用于生成逼真的亞洲美女圖。效果杆杠的，要不我也不會

ChatGPT品質下降，AI模型可靠性受質疑

華為再次創造曆史，盤古AI大模型太強了！華為再次創造曆史，推出的盤古AI大模型備受矚目。據報道，最近，華為在世界頂尖科學

妙鴨産品負責人：不與天真藍、海馬體争利，自研AI模型“提香”