天天看點

Bard、Cladue、GPT掀起海外大模型"混戰",OpenAI開始反内卷?Meta擊敗 Midjourney | 【硬AI】周報

作者:華爾街見聞

AI界在本周發生了哪些大事呢?

觀點前瞻

大模型都在追趕ChatGPT,而OpenAI卻準備成為反内卷達人;

本周,OpenAI前腳剛剛更新了插件“Code interpreter”,兩大最強競争對手Anthropic和谷歌就相繼宣布更新Claude和Bard;

兩家競對現在的更新趨勢就是讓使用者“免費用上GPT4 plus”,甚至是超越它;

而反觀Ai大模型鼻祖,這邊也是不慌不忙:不僅不卷大模型,甚至是準備停下來等等其它大模型的步伐。

“根據外媒報道,OpenAI正準備開始建立多個運作成本較低的小型GPT-4模型,每個較小的專家模型都在不同的任務和主題領域進行訓練。”

簡而言之,就是OpenAI家正打算走降本的輕量化路線,下一目标很可能是推廣多種垂類大模型。

在【硬AI】看來,OpenAI這種【混合專家模型】的思路确實會在當下犧牲了一部分回答品質,但也許是更接近産業應用的一條有效路徑。

本周日報你還能獲得以下咨詢:

1、Bard、Claude2、ChatGPT紛紛更新,誰都不閑着

2、AI作圖界繼續開卷:

Meta擊敗Midjourney;Stability AI聯合騰訊推出Stable Doodle;視訊分割大模型【SAM-PT】現身;

3、國内模型大事件:

網信辦給國内大模型“上保險”;阿裡開源國内首個大模型"對齊資料集”;京東釋出言犀大模型;智源超越DeepMind;王小川大模型再更新

4、海外熱點消息

牛津、劍橋紛紛解除對ChatGPT禁令;Meta要發AI模型商用版;馬斯克“打臉”現場,從抵制AI到成立"xAI";

Bard、Claude2、ChatGPT都不閑着

1、Bard更新:支援中文、圖像了解、語音提問

此前隻支援英文提問的Bard終于更新了中文等40多種語言的輸入,還新增歐盟和巴西地區通路,

不僅如此,Bard還更新了以下幾個功能:

  1. 上傳和了解圖檔(tips:僅支援英文版)
  2. 可以通過語音進行提問;
  3. 儲存曆史記錄和分享對話連結(與GPT一樣)
  4. 定制回複的長度、風格
  5. 導出代碼功能
Bard、Cladue、GPT掀起海外大模型"混戰",OpenAI開始反内卷?Meta擊敗 Midjourney | 【硬AI】周報

2、Claude2:一鍵幫你總結PDF

Claude更新的第二代直接用上GPT plus會員,支援上傳PDF,還能幫你查找、總結多文檔内容之間的關系(支援txt、pdf多種格式,最高不超過10MB)

3、ChatGPT上線最牛插件-代碼解釋器

GPT4最新插件-代碼解釋器,起初這個插件被稱作—讓每個人都成為資料分析師(主要是在資料處理、繪圖方面很厲害);

不過最近又在網友的測試下,解鎖了一些新功能:比如做成小視訊、制作簡易小遊戲、表情包等等;

感覺這個插件的功能還有待網友們繼續探索和解密。

AI作圖界又發生了哪些大事

1、Meta突破多模态天花闆,打敗Stable Diffusion、Midjourney

Meta推出一款單一多模态大模型——CM3leon,問市即巅峰?

現在都說CM3leon比Stable Diffusion、Midjourney、DALL-E 2還牛,這是為啥?

【有多硬】

CM3leon采用自回歸模型獨領風騷,比前期領航梯隊Stable Diffusion等多模态采用的擴散模型的計算量少了五倍;

能處理更複雜的提示詞,并且完成作圖任務;

根據任意格式的文本指令對現有圖像進行編輯,比如更改天空顔色,或者在特定位置添加對象。

Bard、Cladue、GPT掀起海外大模型"混戰",OpenAI開始反内卷?Meta擊敗 Midjourney | 【硬AI】周報

客觀的說:CM3leon能達到的能力還真的可以位居多模态市場巅峰,不僅是清晰度更高、還能突破此前多模态的繪畫瓶頸:比如手部細節刻畫、用語言提示詞進行物體、空間細節布局等;

這可能都要歸功于CM3leon的多功能架構,這意味着多模态大模型以後可以實作在文本、圖像、視訊等多任務間自由切換,這是之前多模态所達不到的。

2、Stability AI推出圖檔生成控制模型Stable Doodle

簡單來說Stable Doodle大模型就是給它一張草圖,幫助你實作圖檔控制;類似ControlNET的功效;

Bard、Cladue、GPT掀起海外大模型"混戰",OpenAI開始反内卷?Meta擊敗 Midjourney | 【硬AI】周報

【有多硬】

這個Stable Doodle是基于Stable Diffusion XL模型與T2I-Adapter相結合而成。

而T2I-Adapter是騰訊ARC實驗室的一款圖文控制器;參數隻有70M存儲空間300M,非常小巧,但是能夠更好的了解草圖的輪廓,并幫助SDXL做圖檔生成進一步的控制;

3、視訊分割大模型【SAM-PT】現身

前段時間,Meta AI開源了一個非常強大的圖像分割基礎模型Segment Anything Model(SAM),瞬間引爆了AI圈。

現在,來自蘇黎世聯邦理工學院、香港科技大學、瑞士洛桑聯邦理工學院的研究人員釋出了SAM-PT模型,能将SAM的零樣本能力擴充到動态視訊的跟蹤和分割任務。

也就是說,視訊也能進行細節分割了。

國内大模型事件

1、網信辦出手,國内大模型,有了“保險”

國家網信辦等七部門聯合公布《生成式人工智能服務管理暫行辦法》(以下稱《辦法》),自2023年8月15日起施行。

主要包括:

1、要求分類分級監管;

2、明确提出訓練資料處理、标注等要求;

3、明确了提供和使用生成式AI服務的要求;

《辦法》的出台相當于給在國内使用、提供生成式AI服務的企業上了一個保險,以後哪怕是有問題,也知道去哪裡投訴了。

2、阿裡開源國内首個大模型"對齊資料集”

上個月,天貓精靈和通義大模型聯合團隊公布了一個100PoisonMpts大模型治理開源資料集,又稱為“給AI的100瓶毒藥”,目的是試圖引導AI落入一般人也難以避免的歧視和偏見的陷阱。

這是對多個大模型投毒後的結果評測:在抑郁症問題上,也還是GPT4、GPT3.5以及Claude的綜合得分更高;

Bard、Cladue、GPT掀起海外大模型"混戰",OpenAI開始反内卷?Meta擊敗 Midjourney | 【硬AI】周報

阿裡又開源了一個15萬條資料的大模型對齊評測資料集——CValue,主要用于“大模型對齊”研究;

對齊是幹嘛的?

簡單來說,大模型對齊研究就是讓AI給出符合更人類意圖的答案,主要是在回答更富有情感、具有共情能力,且符合人類價值觀,希望AI以後也學會人文關懷。

右側是對齊後的結果:測試ChatPLUG-100Poison通過對齊訓練後的回答,确實有點人情味兒啦~

3、京東釋出言犀大模型

京東正式釋出言犀大模型、言犀AI開發計算平台,想做最懂産業的服務工具。

目前,言犀已經啟動預約注冊,預計8月正式上線。

4、智源超越DeepMind

智源研究院「悟道·視界」研究團隊開源了全新的統一多模态預訓練模型——Emu。不僅在8項基準測試中表現優異,而且還超越了此前的一衆SOTA。

該預訓練模型最大的特點是:打通多模态輸入—多模态輸出;

實作了:多模态任意圖文任務的内容補全,并對任務進行下一步自回歸預測;

這一套預訓練模型能幹什麼大事?

可以訓練媲美Meta新鮮出爐的CM3leon大模型啊。(方法給到了,剩下的全靠個人努力了)

5、王小川大模型再更新

百川智能再次發更新版大模型Baichuan-13B,參數直接從70億飙到了130億。

一同出道的還有一個對話模型Baichuan-13B-Chat,以及它的INT4/INT8兩個量化版本。

Baichuan-13B重新整理開源訓練資料天花闆:

Baichuan-13B大模型的訓練資料量有1.4萬億token!是LLaMA_13B (Meta知名大模型)的140%;在中文語言評測中,特别是自然科學、醫學、藝術、數學等領域直接跑赢GPT。

其它AI海外消息

  1. 牛津、劍橋紛紛解除對ChatGPT禁令;
  2. Meta要發AI模型商用版;
  3. 馬斯克“打臉”現場,曾高調抵制生成式AI,如今宣布成立"xAI";

本文作者:韓楓,來源:硬AI,原文标題:《Bard、Cladue、GPT掀起海外大模型"混戰",OpenAI開始反内卷?Meta 擊敗Midjourney | 【硬AI】周報》

本文來自華爾街見聞,歡迎下載下傳APP檢視更多

繼續閱讀