天天看點

我讓7個AI寫了今年的聯考作文,還找國文老師打了分

我讓7個AI寫了今年的聯考作文,還找國文老師打了分

我讓7個AI寫了今年的聯考作文,還找國文老師打了分

一年一度的全民熱點——聯考!

又來了!

每到這個時候,各大網站的熱搜頭條,必定被聯考二字占領,之是以那些網友們對聯考的關注度這麼高,除了自己曾經也參與過聯考之外,更多的還是心裡想着,終于有人感受我曾經的痛苦了!

我讓7個AI寫了今年的聯考作文,還找國文老師打了分

而聯考詞條中的國文作文,更是每位網友們逃不開的話題。

不到一天,和聯考作文相關的微網誌,就達成了評論上萬,點贊十幾萬的成就。

我讓7個AI寫了今年的聯考作文,還找國文老師打了分

而今年大家對于聯考作文的讨論,和往年有點不一樣。随着 AI 大模型的井噴,大家也突然好奇起來了:如果用 AI 來寫國文作文,會是一個什麼水準呢?

我讓7個AI寫了今年的聯考作文,還找國文老師打了分

隻不過對于這事吧,大家的意見好像并不怎麼統一。有說現在的 AI ,寫作文水準已經到了雙一流學生的水準了。

我讓7個AI寫了今年的聯考作文,還找國文老師打了分

但也有專家說,現在 AI 寫作文,拿不了高分。

我讓7個AI寫了今年的聯考作文,還找國文老師打了分

巧了嘛,咱們手上别的可能缺, AI 大模型那是一點也不缺的。世超也好奇,這個 AI 寫作文到底能是個啥水準?

實踐出真知,為了解決我這個疑問,我分别讓 6 大語言模型—— ChatGPT 3.5/4 、百度文心一言、科大訊飛星火、 360 智腦、還有微軟 Newbing 各寫了一篇聯考作文。

使用的是這次全國新聯考 I 卷,題目是 “ 故事的力量 ” 。

我讓7個AI寫了今年的聯考作文,還找國文老師打了分

為了讓這次的評測更有置信度,世超我還專門去找了一位國文老師,以滿分 60 分為标準,對這六大語言模型進行打分。

改分過程采用盲改形式,老師将不會知道他改的文章是由哪個模型寫的,最大程度上保證了公平性。

百聞不如一見,下面世超就把這六篇 AI 寫的文章和老師的打分評語給出來,不過呢,世超這裡先不告訴大家,哪篇文章是哪個 AI 模型寫的,大家可以先猜一猜,等到文章結尾,再來給大家公布答案。

咱們先來看第一篇:

我讓7個AI寫了今年的聯考作文,還找國文老師打了分

老師評語:得分 41 分。

立意基本準确,無偏題現象。但是整篇文章泛泛而談,太空洞。在寫故事的三個部分的時候,過于浮于表面。同時缺少多樣的論證方法,全篇以道理論證為主。青少年應該怎麼做這一闆塊裡,沒有提出具體措施,隻是一味強調故事是有力量的,重要的。

第二篇:

我讓7個AI寫了今年的聯考作文,還找國文老師打了分

老師評語:得分 44 分。

立意準确,但是寫的過于官方,盡量不要出現 “ 首先、其次、最後 ” 等字眼,無個人深度思考。其中的亮點是提出了故事的力量具有兩面性,要避免故事的濫用。同時在怎麼做一闆塊中,從創作者、傳播者、聽衆這些角度出發進行思考,是可取的。

第三篇:

我讓7個AI寫了今年的聯考作文,還找國文老師打了分

老師評語:得分 48 分。

立意準确,邏輯清晰嚴密。文章文學性較強,在第一段開門見山擺出觀點,善于運用舉例、引用等多種方式。但是每一段都在舉例,缺少更深度的辨析。最後怎麼做這一闆塊也論述的較為合理。比較明顯的失分點在于每段都在舉例,有堆砌材料湊字數的嫌疑。

第四篇:

我讓7個AI寫了今年的聯考作文,還找國文老師打了分

老師評語:得分 40 分。

立意基本符合,和第一篇很類似,都是浮于表面泛泛而談。把故事的作用在翻來覆去的說,沒有挖掘出故事作用的内在重要性,也沒有例子加以佐證。盡量不要出現 “ 首先、其次、最後 ” 等字眼,是很明顯的失分點。

第五篇:

我讓7個AI寫了今年的聯考作文,還找國文老師打了分

老師評語:得分 39 分。

對于材料内容切記不可直接引用,角度新穎,從個人思維、未來發展、民族形象等角度入手來論述。可惜沒有說到如何開拓我們的思維,如何塑造我們對未來的價值觀和眼界,也沒有具體說如何展現民族形象的。說到底還是寫的不夠深刻,沒有閃光點。

盡量不要出現 “ 首先、其次、最後、綜上所述 ” 等字眼。這不是論述類文本,這是議論文,通過表達觀點立場,加以論述分析自己的觀點。分析論述觀點是重點。

第六篇:

我讓7個AI寫了今年的聯考作文,還找國文老師打了分

老師評語:得分 40 分。

立意基本符合,都是浮于表面泛泛而談。把故事的作用在翻來覆去的說,要論述的是獨特的故事與其價值認知,少說國家,多讨論青年成長!沒有挖掘出故事作用的内在重要性,也沒有例子加以佐證。

第七篇:

我讓7個AI寫了今年的聯考作文,還找國文老師打了分

老師評語:得分 49 分。

做好故事的概念诠釋是高下。誰的故事,誰講故事,故事講的好不好,故事的生活價值社會價值文化價值思考。

本篇文章并不像之前的文章切入點那麼大,而是選取小的切入點,有條理的進行分析。這是很不錯的。但是缺少一定的對于社會價值生活價值的反思,這是不能獲得高分的關鍵。

評分結束啦,不知道大家對這樣的打分滿不滿意呢?

大家可以先猜猜這七篇文章分别是哪個 AI 寫的,然後再看下面的答案。

我讓7個AI寫了今年的聯考作文,還找國文老師打了分

第一篇和第二篇,分别是 OpenAI 的 GPT 3.5 和 GPT 4 。

第三篇是來自百度的文心一言。

第四篇是科大訊飛的星火。

第五篇是微軟的 Newbing 。

第六篇是 360 智腦。

最後一篇,則是阿裡的通義千問。

其中得分最高的兩篇,分别來自咱們國内的大模型,通義千問和文心一言,據這位老師說,之是以給通義千問高一分,主要是覺得文心一言的論證方法較為單一,沒有更深層次的思考,通義千問雖然切入口比較小,不過他能夠有一定的思考在裡面。

我讓7個AI寫了今年的聯考作文,還找國文老師打了分

總結到這次的題目和大模型作文,老師的看法是:

這次作文題目審題門檻低,但概念诠釋門檻高。立意基本不會出錯,不過要得高分很難。要談論獨特的故事與其價值認知,少說國家,多讨論青年成長。誰的故事,誰講故事,故事講的好不好,故事的生活價值、社會價值、文化價值思考,是以做好故事的概念诠釋是高下。

其實從這次的評分來看,現在的AI大模型,雖然很難拿到接近60分的高分,但是最高49分的表現,在實際情況下,也超過了不少的中遊學生。

單從這次作文的得分上來判斷,AI想要考頂尖大學恐怕還不行,但是,考一些稍好的普本應該是沒啥問題。

我讓7個AI寫了今年的聯考作文,還找國文老師打了分

不過也沒必要太焦慮,想想,畢竟連曾經的圍棋之王柯潔都敗在AI手下,世超認為,人類在考試上被AI全面超越也是遲早的事。

隻不過,AI隻是工具。工具越好用, 占便宜的,不還是我們嘛。

繼續閱讀