天天看點

大模型紮堆參加聯考作文,百度、訊飛、ChatGPT哪家強?

作者:第一财經

6月7日,2023年聯考正式開考。伴随考試的進行,2023年聯考作文題陸續公布。相較于往年網友熱議,今年新加了一批場外參與者——人工智能大模型企業。

記者通過嘗試發現,包括ChatGPT、百度文心一言、訊飛星火、360智腦等大模型平台均能夠順利對作文試題進行作答,且伴随體驗人數的增多,大模型每次給出的作文答卷也發生更新變化。但同時,大模型作文刻闆化的問題也較為突出。

例如全國甲卷“人·技術·時間”的試題,題面為“人們因技術發展得以更好地掌控時間,但也有人是以成了時間的仆人。這句話引發了你怎樣的聯想與思考?請寫一篇文章。要求選準角度,确定立意,明确文體,自拟标題;不要套作,不得抄襲;不得洩露個人資訊;不少于800字。”

最初嘗試時,ChatGPT似乎還無法了解作文格式,将題目要求的幾個重點分開回答。但經過訓練之後,已經能夠給出完整的作文篇章。

大模型紮堆參加聯考作文,百度、訊飛、ChatGPT哪家強?
大模型紮堆參加聯考作文,百度、訊飛、ChatGPT哪家強?

ChatGPT寫道:我們不可避免地發現,有些人似乎陷入了時間的奴役,變成了時間的仆人。他們追求技術的便利和刺激,卻失去了對時間的控制。我們不能簡單地将技術本身歸咎為時間的主人還是仆人,關鍵在于我們如何使用和對待技術。我們需要發展一種科技與時間的良好關系。科技應該成為我們的助手,而不是主宰我們的生活。是以,我們需要審視自己與科技的關系,反思自己對時間的使用方式。

除了ChatGPT,另外幾家大模型平台在聯考作文中也表現出了較為穩定的“語言”了解能力。

大模型紮堆參加聯考作文,百度、訊飛、ChatGPT哪家強?

文心一言寫道:我們應該在科技的浪潮中保持警覺,讓時間成為我們的朋友,而非仆人。技術的進步使我們的生活節奏加快,使我們在追求效率的同時,喪失了享受生活的時間。為了更好地掌控時間,我們應當回歸生活的本質,從内心尋找力量。應當培養一顆從容淡定的心。以一顆從容淡定的心去面對這個快節奏的世界。

大模型紮堆參加聯考作文,百度、訊飛、ChatGPT哪家強?

訊飛星火寫道:手機、電腦等現代科技産品讓我們可以随時随地地擷取資訊和完成任務,但也讓我們沉迷于虛拟世界,忽略了現實生活。然而,時間并不是我們的奴隸,我們才是它的主人。有些人因為工作繁忙而失去了生活的樂趣,他們整天忙碌于工作之中。還有一些人因為沉迷于遊戲、社交媒體等虛拟世界而失去了現實生活的意義。我們需要意識到,時間是我們最寶貴的财富,我們需要珍惜它。

可以看出,大模型寫出的作文文本具有邏輯性,但也有一定語病存在。

大模型紮堆參加聯考作文,百度、訊飛、ChatGPT哪家強?

360智腦寫道:随着科技的不斷發展和進步,人類的時間觀念也在不斷地發生着變化。首先,我們需要認識到時間是寶貴的資源。其次,我們應該重視時間管理技能的培養。最後,我們也要警惕成為時間的“仆人”。雖然現代科技的發展為我們的生活帶來了很多便利,但同時也給我們帶來了一定的負面影響。例如,很多人因為沉迷于手機等電子産品而忘記了自己的時間和任務,最終成為了時間的“仆人”。

可以看出,360智能在邏輯關系上混淆了時間與科技。

綜合上述各家大模型平台對該篇作文的論述,可以看出隻有ChatGPT完整充分地切題,對科技與時間的關系進行探讨。而其他家在表述過程中逐漸偏題,一味讨論如何把握人與時間的關系,做時間的主人,而忽視科技在本題中的重要性。

對于沖上熱搜的“AI寫聯考作文”話題,網友表達了各自的觀點,既有認為AI寫作非常厲害、屬于中上水準的觀點,也有認為大模型作文刻闆化,由于缺乏現實案例而空洞的建議。

針對此次大模型平台對聯考作文的評測,AGI-AIGC-GPT評測DIKWP實驗室的負責人,工學博士、海南大學三級教授段玉聰對記者表示,GPT-4的回答在認知距離方面展現了以下特點:GPT-4回答時會對問題背後的背景資料進行鋪墊,確定回答的完整性和準确性。這意味着它具備對問題所涉及領域的廣泛知識,并能從中提取相關資訊進行回答。GPT-4能夠分析問題中的概念和含義,并提供深入的解析。它不僅僅回答問題,還能夠解釋概念的背後含義,幫助提問者更好地了解和應用相關概念。GPT-4回答問題時能夠突出問題的主題意圖,確定回答與問題的關鍵點一緻。它能夠識别問題中的關鍵詞和主題,并圍繞這些要素提供相關的回答和資訊。

相比之下,段玉聰認為訊飛星火和文心一言在認知距離方面存在一些限制和不足。一方面,過多側重資料層面的直接帶入:訊飛星火和文心一言在回答中過多地依賴直接帶入資料,缺乏對資料的深度分析和綜合。這可能導緻回答的局限性和缺乏整體性。

其次,對作文互動資訊形式的結構套用:訊飛星火和文心一言在回答中可能過于套用作文互動資訊的結構,導緻回答的過渡不自然和主題意圖的分離。這可能使得回答的連貫性和完整性受到影響。以及,主題意圖的分離和過渡不自然:訊飛星火和文心一言在回答中可能沒有很好地突出主題意圖,導緻回答與問題的關鍵點不夠一緻。同時,它們在不同段落或句子之間的過渡可能顯得不夠自然和流暢。

綜上所述,段玉聰認為GPT-4在認知距離方面相比訊飛星火和文心一言表現更好,通過背景資料層面的鋪墊、概念含義資訊的解析、主題意圖的突出、知識層面的提升以及價值觀的智慧引導,能夠提供更全面、深入和符合使用者期望的回答。

但需注意的是,不論是問答對話還是作文演練,大模型平台面向C端的産品更多屬于企業技術層面的展示,目前行業更多期待大模型技術在具體場景的應用落地。國信證券研報認為,AIGC持續看好大模型、IP資料要素等底層要素,場景落地持續看好AI+文學、音樂、數字人、營銷服務、電商、視訊、遊戲等領域。