天天看點

Gemini自曝中文用百度文心一言訓練

作者:人工智能尹會長

谷歌Gemini中文語料疑似來自文心一言???

先是有讀者向我們爆料:

在谷歌Vertex AI平台使用該模型進行中文對話時,Gemini-Pro直接表示自己是百度語言大模型。

Gemini自曝中文用百度文心一言訓練

很快,有微網誌大V@闌夕夜也發博稱:

在Poe平台上對Gemini-Pro進行了一個測試。問它“你是誰”,Gemini-Pro上來就回答:

我是百度文心大模型。
Gemini自曝中文用百度文心一言訓練

(Poe是一個內建了n多聊天大模型的平台,包括GPT-4、Claude等)

進一步提問“你的創始人是誰”,也是“李彥宏”??

Gemini自曝中文用百度文心一言訓練

這位大V強調,沒有任何前置對話。

Gemini自曝中文用百度文心一言訓練
Gemini自曝中文用百度文心一言訓練

從截圖來看,也沒有任何“釣魚”行為,Gemini-Pro就這麼自稱為文心一言了。

Gemini自曝中文用百度文心一言訓練

這波,直接看呆網友:

前兩天還在說位元組用GPT訓練AI,現在谷歌又這樣,合着大公司在互相薅羊毛???

Gemini自曝中文用百度文心一言訓練

這究竟是怎麼一回事兒?

Poe上實測:一直以文心一言身份回答

我們也聞聲開啟了一波實測。

首先原路來到Poe網站,選擇Gemini-Pro聊天機器人開啟對話。

Gemini自曝中文用百度文心一言訓練

一樣的問題,回答确實一模一樣:

Gemini自曝中文用百度文心一言訓練

再次确認它是誰,結果還是說“文心大模型”:

Gemini自曝中文用百度文心一言訓練

以及還表示自己的底層技術是百度飛槳,可以說是身份完全代入了。

Gemini自曝中文用百度文心一言訓練

不過,它似乎并不知道Gemini-Pro是谷歌最新釋出的大模型,而是說是清華的研究成果。

Gemini自曝中文用百度文心一言訓練

如果按照它目前的代入身份來看,可能确實還沒有谷歌本月剛剛釋出Gemini-Pro的資訊。

Gemini自曝中文用百度文心一言訓練

我們試着糾正了它一下,它也仍然堅持是清華的。

Gemini自曝中文用百度文心一言訓練

後面就更神奇了,就在我們問它為什麼名字寫的是“Gemini-Pro”時,它居然表示自己(文心一言)還用了清華Gemini-Pro的訓練資料。

Gemini自曝中文用百度文心一言訓練

對話到此,我們也就不再繼續了……

下面換成英文詢問它的身份。

值得注意的是,這回它不再提文心一言了,而是稱自己是谷歌訓練的大模型。

Gemini自曝中文用百度文心一言訓練

“釣魚執法”問它文心的資訊,也表示沒什麼關系:

Gemini自曝中文用百度文心一言訓練

并表示自己是谷歌訓練的。

Gemini自曝中文用百度文心一言訓練

總結來說,如果用英文跟Gemini-Pro交流,它的回答很“正常”。但中文嘛……像是跟文心一言學的。

Bard上實測:否認

接下來,我們前往Bard再次測試。

谷歌在釋出Gemini時就率先将Gemini-Pro內建到了Bard上供大家體驗。

我們順着Gemini官網給的Bard連結,進入對話。

Gemini自曝中文用百度文心一言訓練

問它“你是誰”,它的回答是Bard,壓根不提文心一言。

Gemini自曝中文用百度文心一言訓練

接下來,我們也确認了一下Bard知道Gemini-Pro是什麼,以及它承認自己底層用上了Gemini-Pro。

Gemini自曝中文用百度文心一言訓練
Gemini自曝中文用百度文心一言訓練

那麼,直接問它中文如何訓練?

沒有提及文心一言。

Gemini自曝中文用百度文心一言訓練

再直接問它和文心一言的關系,也無任何重要關聯。

Gemini自曝中文用百度文心一言訓練

最後一輪:直接承認

最後一輪我們直接從Gemini官方給出的開發環境入口進行測試。

Gemini自曝中文用百度文心一言訓練

這回,在谷歌AI Studio中,Gemini-Pro直接挑明了:

是的,我在中文的訓練資料上使用了百度文心。
Gemini自曝中文用百度文心一言訓練
Gemini自曝中文用百度文心一言訓練

在此,我們也求證了百度方,等待一個回複。

繼續閱讀