天天看點

文心一言 VS ChatGPT 實力測評,誰更勝一籌?

作者:吳言不語零一二三
文心一言 VS ChatGPT 實力測評,誰更勝一籌?

等了好幾個月,終于拿到了百度文心一言的試用資格。話不宜遲,我們就快點試用下吧,也可以與ChatGPT對比下效果。

1、有了試用資格後,在電腦上登入百度,就可以看到多個一個按鈕。測試了在手機浏覽器上通路百度網站沒有按鈕出現,看來目前隻開放了網頁版。而且通過百度手機助手下載下傳到的app版本登入相同賬号居然還要加入等待list,是以手機端的體驗隻能再等等了。

文心一言 VS ChatGPT 實力測評,誰更勝一籌?

2、點選AI按鈕後,進入文心一言的首頁。

文心一言 VS ChatGPT 實力測評,誰更勝一籌?
文心一言 VS ChatGPT 實力測評,誰更勝一籌?

作圖

3、文心一言相比于ChatGPT最大的優勢就是多模态模型,ChatGPT是基于GPT3.5的,是以隻能輸入輸出文字。文心一言卻可以輸出圖檔,這點是與ChatGPT plus(基于GPT4.0)是一樣的。還有一點,文心一言可以語音輸入和語音輸出,相當于把語音識别也做進來了。

那麼我們就來試試文心一言的出圖功能。我試了一個經常在文心一格裡使用的提示詞範本:港口、船隻、日落、美麗的光線、黃金時刻、超現實主義、聚焦的、細節豐富的,電影畫質,傑作,16:9。效果如下:

文心一言 VS ChatGPT 實力測評,誰更勝一籌?

效果還不錯,但是貌似圖檔大小被固定在了512*512像素。我們按照提示在結果加上了#創意圖#,再看看新的效果:

文心一言 VS ChatGPT 實力測評,誰更勝一籌?

感覺出圖的品質還是挺不錯的。文心一言号稱可以用更簡短的提示語,或者自然語言可以出高品質的圖,那麼我們就把提示詞再簡化一下: 黃昏,港口上有艘船#創意圖#。效果如下:

文心一言 VS ChatGPT 實力測評,誰更勝一籌?

意境貌似沒有上兩幅好,不過也還是不錯的效果,看來文心一言的出圖能力還是比較OK的。

文心一言 VS ChatGPT 實力測評,誰更勝一籌?

作詩

4、我們再來檢驗一下它的詩歌創作能力,我們知道,為了讓AI模型更好地回答我們,我們通常要遵循一定的提問形式,即:【角色定位】+【問題描述】+【期待結果】+【補充說明】,是以指定角色是第一步很關鍵,讓AI模型給出更準确地回答。我問他:我希望你扮演詩人的角色。你将創作能夠喚起情感并有力地觸動人們心靈的詩歌。可以寫任何主題或主題,但請確定你的文字以美麗而有意義的方式傳達你想要表達的感覺。你也可以想出短小精悍的詩句,這些詩句足以在讀者心中留下深刻的印象。我的第一個要求是我需要一首反映人工智能科技高速發展,促進人們的工作生活更美好的七言絕句古詩。

它的回答是:

文心一言 VS ChatGPT 實力測評,誰更勝一籌?

貌似文學性不是很強,不過整體還算押韻。我也對比了相同的問題ChatGPT的回答:

文心一言 VS ChatGPT 實力測評,誰更勝一籌?

ChatGPT貌似更願意多寫一些,古詩創作上略勝一籌。

我改了改,讓文心一言寫一首關于愛情的現代詩歌,效果如下:

文心一言 VS ChatGPT 實力測評,誰更勝一籌?

比古詩效果更好一些,也算是掰回了一局。

文心一言 VS ChatGPT 實力測評,誰更勝一籌?

代碼生成

5、接下來我們看下代碼生成的效果,我先按照文心一言推薦的樣式寫了一個要求:寫一段排查網絡安全的代碼。

文心一言 VS ChatGPT 實力測評,誰更勝一籌?

這段代碼及說明還是挺清晰的。

6、接下來我又指定了一個任務:

請幫我生成一段python代碼,可以自動找到在Windows10系統的指定目錄下 (包括目錄下的子目錄) 占用硬碟空間最大的五個檔案的所在路徑和檔案大小 (機關為GB)。

文心一言這個時候不知道是怎麼了,我嘗試了多次,其輸出的代碼都沒有寫完,寫到一半就莫名結束了。而且生成代碼的速度相對來說沒那麼快,估計要思考個5-6秒左右。

文心一言 VS ChatGPT 實力測評,誰更勝一籌?

同樣的問題我問了下ChatGPT,速度很快,2秒内,而且代碼完整:

文心一言 VS ChatGPT 實力測評,誰更勝一籌?

看來在代碼生成方面,文心一言是具備,但是還需要更多的資料訓練得更成熟些。

文心一言 VS ChatGPT 實力測評,誰更勝一籌?

回答曆史

7、文心一言的優勢應該是對中文資料的收集,是以我們還是提一個和中國有關的問題給它吧:你是一個曆史學家,請列舉中國5000多年以來每個朝代的一位傑出君主的事迹,每個朝代請列舉出一位,以及說明下他做的事迹,不要遺漏朝代。

文心一言 VS ChatGPT 實力測評,誰更勝一籌?

回答結果看來是答得不錯,從夏朝一直追溯到了清朝,主要的統一朝代都提到了,是以如果有關中國相關的問題,盡管問文心一言就好了。

文心一言 VS ChatGPT 實力測評,誰更勝一籌?

寫小說

8、出于好奇心,我還想試試它寫小說的能力,于是我設定了一個題目:我希望你扮演小說家的角色。你将構思出引人入勝的故事情節,吸引讀者長時間閱讀。你可以選擇任何流派,如奇幻、浪漫、曆史小說等,但目标是寫出具有傑出情節、引人入勝的角色和意想不到的高潮的作品。我的第一個要求是“我需要寫一部設定在未來的科幻小說,描述人類已經探索到了宇宙的邊界,并發現了穿越到另一個多元宇宙的世界。

文心一言 VS ChatGPT 實力測評,誰更勝一籌?

還是有些情節的,但是還少了些對話,我們讓它補上:

文心一言 VS ChatGPT 實力測評,誰更勝一籌?

還可以,我們再讓它擴寫些内容:

文心一言 VS ChatGPT 實力測評,誰更勝一籌?

嗯,立意還是不錯的,強調了不同文明、宇宙之間的互相學習、和平友誼。

作為對比,我們再來看看ChatGPT的回答:

文心一言 VS ChatGPT 實力測評,誰更勝一籌?

對比來看,個人感覺ChatGPT的回答細節更豐富些。文心一言更像是指導人寫作,而ChatGPT是直接給出了作品的一部分細節。在這點上,見仁見智。

文心一言 VS ChatGPT 實力測評,誰更勝一籌?

靈感中心

9、最後,如果我們不知道問什麼好的時候,我們可以打開“靈感中心”頁面,裡面有什麼預置的功能,可以快捷提問。種類十分豐富,也展現了文心一言也如其他語言大模型一樣,可以做得事情非常多,多到隻有想不到,沒有做不到。

文心一言 VS ChatGPT 實力測評,誰更勝一籌?

我随便試了一個功能:“一鍵畫出戴珍珠耳環少女的各種狀态”的繪畫功能,相比于通用的繪圖功能,這個小功能限定繪圖範圍在世界名畫《戴珍珠耳環的少女》内。

文心一言 VS ChatGPT 實力測評,誰更勝一籌?

大家可以看看效果:

(1)提示詞:帶着眼鏡看手機

文心一言 VS ChatGPT 實力測評,誰更勝一籌?

(2)提示詞:穿着阿根廷球衣喝着可樂

文心一言 VS ChatGPT 實力測評,誰更勝一籌?

(3)提示詞:穿着中國唐裝,頭戴發髻,手上拿着扇子

文心一言 VS ChatGPT 實力測評,誰更勝一籌?

還是蠻有意思的,更多功能大家可以自己探索。

文心一言 VS ChatGPT 實力測評,誰更勝一籌?

總結

最後總結下,文心一言是一個号稱有2600億參數的多模态大模型,相比于ChatGPT是1750億參數的語言大模型,但相比于GPT4.0有着8個2200億參數的多模态模型而言,還是有一定差距,我們嘗試了文心一言的出圖、詩歌創作、代碼生成、回答曆史、寫小說等功能,僅僅是冰山一角,和ChatGPT相比也互有勝負,作為國内AI界研發投入最大的科技公司,百度的努力我們還是肉眼可見的,希望我們的國貨産品能夠不斷努力,早日達到國外先進水準。我們也可以多用起來,因為大模型使用得越多,從回報學習的角度來看,其效果是會越來越好的。#AI工具##與ChatGPT的有趣對話#

更多内容,歡迎關注微信公衆号:吳言不語零一二三

繼續閱讀