天天看點

阿裡雲大模型“通義千問”上線,能寫會誇,與“文心一言”有何差別

作者:澎湃新聞

在聊天機器人ChatGPT、谷歌Bard和百度“文心一言”之後,阿裡雲也釋出人工智能大模型 “通義千問”。

4月7日,阿裡雲推出自研大模型“通義千問”,并開始邀請使用者測試體驗。阿裡雲稱,現階段該模型主要定向邀請企業使用者進行體驗測試,使用者可通過官網申請(tongyi.aliyun.com),符合條件後可參與體驗。

阿裡雲大模型“通義千問”上線,能寫會誇,與“文心一言”有何差別

來源:通義千問

在官網中,通義千問被定義為“專門響應人類指令的大模型”。使用者若想體驗測試,需要進行預約報名。填寫手機、郵箱、主體和用途等資訊。

7日下午,澎湃新聞記者成功登入并通路通義千問,其頁面正中央具有一個對話框,顯示輸入上限為1000字。對話框的下方展示了通義千問具備的部分功能,包括電影腳本、職場助理、撰寫短文、寫封郵件。

阿裡雲大模型“通義千問”上線,能寫會誇,與“文心一言”有何差別

來源:通義千問

此外,頁面的最下方還具有名為“百寶袋”的通道,展示了通義千問搭載的9種應用,這些應用被分為3類,分别為效率類、生活類和娛樂類。

阿裡雲大模型“通義千問”上線,能寫會誇,與“文心一言”有何差別

來源:通義千問

通義千問是國内第二款類ChatGPT産品。此前3月16日,百度正式釋出聊天機器人“文心一言”,并宣布其具有文學創作、商業文案創作、數理邏輯推算、中文了解、多模态生成五大能力。

為測試通義千問的能力,記者同時向它和文心一言進行提問,對比二者生成的回複有何不同。

通義千問自稱訓練資料來自2021年,難以擷取實時資訊

首先,記者向兩款聊天機器人詢問通識性問題,請它介紹作家莫言及其文學作品。

通義千問能夠準确地介紹莫言的原名、出生日期、身份等資訊,并強調莫言是第一個獲得諾貝爾文學獎的中國作家。此外,它列舉了莫言的三部代表作,不僅附上了發表時間,還對作品進行了簡要概括。

阿裡雲大模型“通義千問”上線,能寫會誇,與“文心一言”有何差別

來源:通義千問

文心一言同樣提到了莫言本人的基礎資訊和作品,此外還列出了莫言獲得的多項獎項。不過它并沒有指出莫言是首位中國籍諾貝爾文學獎獲得者。

阿裡雲大模型“通義千問”上線,能寫會誇,與“文心一言”有何差別

來源:文心一言

随後,記者嘗試向兩款機器人提問最新發生的事件。遺憾的是,它們似乎都無法擷取實時資訊。

在被問及2023年的奧斯卡獲獎影片時,通義千問表示“無法預測未來的奧斯卡獲獎影片……建議您關注官方的奧斯卡獎項公告,以擷取最新的資訊。”

阿裡雲大模型“通義千問”上線,能寫會誇,與“文心一言”有何差別

來源:通義千問

文心一言則“一本正經”地給出了錯誤的回答,稱2023年的奧斯卡獲獎影片為《寄生蟲》。但事實上,《寄生蟲》于2019年上映,并于2020年獲得奧斯卡最佳影片、最佳國際影片、最佳原創劇本和最佳導演四項大獎。

阿裡雲大模型“通義千問”上線,能寫會誇,與“文心一言”有何差別

來源:文心一言

無法擷取最新資訊,或意味着訓練資料有限。通義千問告訴記者,自己的訓練資料來自2021年,是以無法擷取有關未來的資訊。文心一言則表示,沒有明确的資料截止日期。

相比之下,聊天機器人ChatGPT的資料庫更新至2021年,上個月剛剛推出的多模态模型GPT-4的訓練資料可追蹤到2021年9月。

阿裡雲大模型“通義千問”上線,能寫會誇,與“文心一言”有何差別

來源:通義千問

可寫郵件、列提綱、提供菜單

除了允許使用者随機提問,通義千問還提供了多種應用功能。

記者首先進入“寫封郵件”應用,要求其為剛畢業的大學生撰寫一封求職郵件。通義千問所撰寫的郵件格式較為标準,在開篇進行自我介紹并說明求職目的,還表達了對公司的向往和認同。

阿裡雲大模型“通義千問”上線,能寫會誇,與“文心一言”有何差別

來源:通義千問

文心一言提供的郵件也較為标準。此外,它在回複中特别指出這是一個“符合規範的樣例,你可以參考一下進行修改和調整”,還在名字落款處提醒使用者要寫自己的名字。

阿裡雲大模型“通義千問”上線,能寫會誇,與“文心一言”有何差別

來源:文心一言

在“效率類”類應用中,通義千問具有寫提綱、SWOT、商品描述生成三種功能。

記者首先測試了商品描述生成功能,分别要求通義千問和文心一言幫手機店給最新上市的折疊手機寫一篇宣傳文案,限制字數在100字以内,希望能突出折疊手機的優勢和特點,吸引顧客購買。

這兩款機器人均抓住了關鍵詞“折疊手機”。通義千問突出了折疊手機在空間使用率方面的優勢,寫到“相比傳統的直闆手機,它可以有效地減少螢幕占用空間,友善攜帶”。文心一言則指出“它采用最新的折疊技術,可以在一款手機中實作智能手機和平闆電腦的雙重功能”。

但是,這兩款機器人都未滿足“100字以内”這一要求,字數遠遠超标。

阿裡雲大模型“通義千問”上線,能寫會誇,與“文心一言”有何差別

來源:通義千問

阿裡雲大模型“通義千問”上線,能寫會誇,與“文心一言”有何差別

來源:文心一言

随後,記者又測試了通義千問的“寫提綱”應用。在被要求撰寫一份關于“煤礦污染文章”的提綱時,它從煤礦污染的概念和影響、曆史和現狀、造成污染的原因、探讨對環境和人類的危害、治理方法和保護措施 、總結及展望等方面的内容,較為全面。

阿裡雲大模型“通義千問”上線,能寫會誇,與“文心一言”有何差別

來源:通義千問

在“效率類”類應用中,通義千問具有彩虹屁專家、寫情書、為你寫詩三種應用功能。

記者要求兩款機器人分别以“春雨、落花、傷感”為關鍵詞作一首詩。通義千問撰寫了一首七言詩,結尾較為押韻。

阿裡雲大模型“通義千問”上線,能寫會誇,與“文心一言”有何差別

來源:通義千問

文心一言所寫的詩較長,它在第一句裡直接将關鍵詞“春雨、落花、傷感”拼接在了一起,且其後的每一段中,不停地讓關鍵詞重複出現。

阿裡雲大模型“通義千問”上線,能寫會誇,與“文心一言”有何差別

來源:文心一言

通義千問寫的詩馬馬虎虎,它寫的情書靠譜嗎?記者嘗試随機輸入姓名,得到了一封略顯浮誇的情書,這樣看來情書還是本人親自撰寫更有誠意。

阿裡雲大模型“通義千問”上線,能寫會誇,與“文心一言”有何差別

來源:通義千問

不會誇人怎麼辦,通義千問具有“吹彩虹屁”的功能。記者嘗試讓它誇獎别人文章寫得好,通義千問再次浮誇了起來,“你的文章簡直是天賜之作,如同一縷春風,輕輕拂過我的心靈。”

阿裡雲大模型“通義千問”上線,能寫會誇,與“文心一言”有何差別

來源:通義千問

如果讓通義千問自誇,它更是極盡贊美之詞,“讓我們一起來贊美通義千問,贊美它所傳達的智慧之光,贊美它所傳承的文化精髓!”

阿裡雲大模型“通義千問”上線,能寫會誇,與“文心一言”有何差別

來源:通義千問

在生活類應用中,通義千問能夠提供菜單、寫國小生作文、續寫故事。記者測試了最實用的菜單功能,向其詢問蔓越莓曲奇的做法。通義千問提供了所需的材料,并詳細介紹了操作步驟。

阿裡雲大模型“通義千問”上線,能寫會誇,與“文心一言”有何差別

來源:通義千問

在測試的過程中記者注意到,通義千問的回複頁面顯示“僅展示最近10條對話”。在頁面的最下方,還有一條關于回複内容的說明,“測試生成的所有内容均由人工智能模型生成,其生成内容的準确性和完整性無法保證,不代表我們的态度或觀點。”

此外,記者發現如果離開通義千問一段時間後再次傳回,頁面會出現一條彈窗,提示使用者太久沒有操作,需要重新整理頁面重新開始。如果離開的時間更久,它還會自動傳回登入頁面,要求使用者重新登入賬号。

阿裡雲大模型“通義千問”上線,能寫會誇,與“文心一言”有何差別

來源:通義千問

在最後,記者要求通義千問和文心一言互相進行評價,并指出對方的優點和不足。

通義千問表示,百度推出的聊天機器人“文心一言”(英文名:ERNIE Bot)是一款能夠與人類進行自然語言對話的人工智能聊天機器人,其語言了解能力強、可以與使用者進行多樣化的互動、支援自然語言生成;但其對話深度有限、難以處理多義性和模糊性且可能存在bug和安全風險。

有意思的是,在此前的回複中,通義千問表示自己的訓練資料來自2021年,而文心一言于2023年才問世,它卻能夠準确地說出文心一言的英文名以及優缺點等資訊。

阿裡雲大模型“通義千問”上線,能寫會誇,與“文心一言”有何差別

來源:通義千問

文心一言則表示,阿裡推出的聊天機器人“通義千問”是一種新型的人工智能聊天助手,它可以通過自然語言處理技術和深度學習算法來了解和回答使用者的問題和提問。它指出通義千問在智能化、多語言支援和自動回答;不足之處在于其語言了解能力、知識庫有限以及技術存在限制。

阿裡雲大模型“通義千問”上線,能寫會誇,與“文心一言”有何差別

來源:文心一言

繼續閱讀