雲栖号資訊:【 點選檢視更多行業資訊】
在這裡您可以找到不同行業的第一手的上雲資訊,還在等什麼,快來!
我,一個科技小編,最近在跟國外大佬的郵件交流中,感到飄過六級後的自己英語寫作水準那真是日漸捉急。
從句怎麼用?時态對不對?看着對面主編犀利的目光,那一瞬間,真想問問自己為什麼不good good study, day day up。

于是,我決定了,我要好好學習英語寫作!
想要提升水準,不自己動筆寫總是差那麼點意思。
那麼,問題來了:寫的好不好,誰來幫我批改呢?
其實,打從國小開始學英語,國小、中學、四六級、雅思托福……英語作文怎麼提高從來都是一個難題。
尤其是各類考試,有嚴格的評分标準,可身邊哪能時時有經驗豐富的閱卷老師幫忙有針對性地修改提高呢?
聽聞我的煩惱,一位網易有道的胖友向我招了招手:你看我手機裡這個紅色的App,裡面最新上線了一隻AI,能幫你批改英文小作文喲。
對啊,如果AI真的能準确評分,甚至給出修改意見,那像我一樣的同學們不就能随時随地把英語作文練到飛起了嗎?
略一調研,我發現,現在有AI批改英語作文功能的産品還真不少:網易有道詞典、微軟愛寫作(小英)、批改網、Grammarly……
想到現在宅在家裡的大朋友、小朋友可能也有同樣的困擾,我決定親自測試一下這些AI們到底靠譜不靠譜。
AI批作文,到底哪家強?
初篩一番,我挑選出了幾個免費、容易上手使用的選手參與測評,分别是:網易有道詞典AI作文批改,微軟愛寫作,以及Grammarly免費版。
那麼,話不多說,讓我們直接進入比賽。
Round 1:手寫識别
像國小中學英語考試、四六級以及考研英語、雅思托福考試,實際應試時都需要在紙面上進行寫作,是以在練習時,同學們也往往會選擇手寫。
寫完一遍,再打一遍字,未免有些麻煩,如果拍張照,AI就能自己識别我到底寫了什麼,那就友善多了。
有道AI作文批改和微軟愛寫作均支援圖檔識别功能。而Grammarly……由于沒有這一功能,這位選手選擇暫時退場。
我使出洪荒之力,用非标準應試字型謄寫了一篇作文,測試兩位選手。
先來看有道AI作文批改的表現:
識别得相當準确,有塗改的地方也沒有出現誤識别的情況,為數不多的幾個需要手動修改的地方,基本上都是手寫時字母和字母之間空格太大,是以識别時成了兩個單詞。
再來看一下微軟小英的結果:
由于我沒寫标題,小英強制把第一段都識别成了标題。忽略掉這一點的話,識别準确率也很高。但對于标點符号的識别不及有道AI作文批改敏感(上圖紅色标注處)。
還有個小問題:如果你把兩個詞寫得比較開,小英會識别出多餘的空格,檢查得不仔細的話,會影響下一步評分的準确性。
另外,相比于隻有網頁版的微軟愛寫作,手機端的有道詞典可以直接拍照識别,無需再倒一手把照片傳到電腦上,還是要友善一些。
Round 2:糾錯能力
如果說OCR隻是影響使用者使用友善與否的細節,那AI批改作文的重點,當然在于能不能準确抓住作文中的bug。
有道AI作文批改、微軟小英和Grammarly都有識别文中文法錯誤并給出修改意見的功能。
這一輪,我們用一些單句來測試一下誰的Debug能力更強。
例句一:When the girl will leave, she fount an old begger in the tree and looked at angry and cold.
有時态錯誤,也有拼寫錯誤。
有道揪出了4處錯誤:
具體的判斷是:①疑似用詞不當,建議将「will leave」修正為「left」;②疑似動詞時态錯誤,建議将「fount」修正為「found」;③疑似名詞誤用,建議将「begger」修正為「beggar」;④疑似介詞「at」備援,建議删除。
把問題抛給微軟小英,它也同樣找出了這4處錯誤,并給出了一個單詞替換建議。
具體判斷是:①錯誤動詞時态,将「will leave」改為「left」;②動詞用法錯誤,将「fount」改為「found」;③單詞拼寫錯誤,将「begger」改為「beggar」;④備援,删除「at」;⑤建議将「cold」換成「bitter」、「hard」、「mean」。
最後看一下Grammarly的判斷。
Grammarly免費版指出了一處單詞拼寫錯誤,并建議我更新付費版。
同樣,在「But this stress didn’t stop me from thinking to attend the biggist activity in our school」這個句子中,有道和小英都指出了3處錯誤:
介詞「to」改「about」;動詞「attend」改「attending」;「biggist」拼寫錯誤,改為「biggest」。
而Grammarly免費版還是僅僅指出了「biggist」這個拼寫錯誤。
看來,就免費體驗來說,Grammarly的文法修改偏于簡單了。
最後,給有道AI作文批改和微軟小英出一個加試題。
例句二:On a cold morning, while I was watching a girl buy bread and milk in the fiont for me.
對于AI而言,這個句子的識别難點在于,同一個對象涉及了多個錯誤,「fiont」這個拼寫錯誤後面,緊跟着「for」這個介詞使用錯誤。
面對這一題,有道成功把「in the front of」這個整體識别了出來,既指出了拼寫錯誤,也發現詞組中介詞的錯誤。
而微軟小英的改法令人有些看不懂,難道是感應到了句子裡主人公的内心戲?
這輪比拼結束,小小總結一下。
同樣是免費,Grammarly免費版相比于兩位中文世界的選手,差距有點大。
不過,Grammarly有插件版本,直接寫郵件的時候,能夠邊寫邊糾錯。
但如果是想要在AI的幫助下提升英語寫作能力,Grammarly免費版恐怕不是上佳選擇。
而有道AI作文批改和微軟小英,都更符合國内的英語學習路徑,總體表現都還不錯。不過,在錯誤複雜度提高的時候,有道的表現略勝一籌。
Round 3:評分準确度
另一個重點,是評分的準确度。
畢竟,考試都有嚴格的評分标準,能否依據标準給出準确的打分,對于廣大有應試需求的同學們而言還是非常重要的參考名額。
有道AI作文批改和微軟愛寫作,都支援多學段英語作文批改,涵蓋國小、國中、高中、四六級、雅思托福和考研英語。
至于Grammarly,作為一款“舶來”應用,并不是很适合我考試大國的風格,沒有推出打分功能,亦無法區分學段和考試類型。
不過,使用Grammarly,也可以針對自己的情況進行一些個性化設定,包括Audience(閱聽人)、Formality(正式程度)、Domain(領域)。
問題還是,免費版選擇有限。
我在網上找了一篇 7.5 分的雅思範文,人類老師對這篇作文的評價是:詞彙豐富、文法點豐富,并且論證全面。
那麼AI會如何評價這篇作文呢?
還是先來看看有道AI作文批改的答卷。
有道給這篇作文打了8分,并且就詞彙、結構、文法和内容都給出了評級。
點選檢視點評,還能看到AI閱卷官從詞、句、篇章着手,對作文的總體評價,一些更進階詞彙的推薦,以及好詞的鞏固。
……詞彙量較為豐富……文章較為流暢……詞彙基礎紮實。
這樣的評語,與人類老師的判斷基本一緻。
同樣一篇文章,我們來看看微軟小英怎麼說。
同樣給出了8分,比較特别的是,小英會統計作文中所使用的考綱詞彙、邏輯連詞和從句數量。
與有道給出的總體評價報告不同,小英給出的是文章結構、句間關系、切題程度、展開程度4個評價名額。
需要注意的是,如果想參考文章内容中切題程度這個名額,必須填寫文章标題。而展開程度這個名額,我反複試了多篇作文,從聯考範文到雅思範文,都是穩定一星……
這輪比拼結束,同樣做個小結。
總體而言,有道和小英的評分結果都根據考試類型的不同,與考試評分标準對齊,具有參考價值。
在細節上,有道會根據字數、詞彙使用情況、語句邏輯及銜接等方面給出綜合評價,微軟小英則是分點給出建議,主要集中在文章結構和句間關系兩個方面。
不過,在測試中微軟小英出現了一些小bug。
比如六級作文的滿分是15分,但在得分界面其最高分卻是25分。
背後技術
看來有道詞典批改作文的AI,确實有兩把刷子。
出于科技小編的好奇心,我向文章開頭給我推薦軟體的胖友打聽了一下,在這背後究竟是怎樣的技術。
以有道為例,其英語作文批改分為三個核心子產品:評分子產品 + 評語子產品 + 糾錯子產品。
評分子產品負責提供總分,及詞彙、文法、結構得分,采用的是傳統方法 + 深度學習方法。
評語子產品提供全文評語、詞彙推薦、範文推薦。
糾錯子產品提供14個類别的文法錯誤識别及修正,包括淺層的拼寫錯誤、深層的文法錯誤等。
其中,拼寫糾錯運用的是基于BERT的NER實體識别技術。
文法糾錯,則被定義為序列到序列的生成問題。核心基于Transformer架構。
核心模型所做的事,其實類似于翻譯:将文法錯誤的句子翻譯成文法正确的句子。
此外,在文法糾錯中,還采用了遷移學習和對抗學習。用真實語料和基于真實使用者錯誤分布生成的海量僞語料,不斷提升模型能力。
以上是網易有道詞典的品質評估結果。P值為精确率(Precision),R值為召回率(Recall),F0.5為P值與R值的調和平均,其值越高,通常表示算法性能越好。
可以看到,有道AI作文批改的測試結果已達行業領先水準。
好啦,看罷這一篇試用報告,不知道正備考四六級、雅思托福、考研英語的你願意pick AI為你免費批改作文嗎?
【雲栖号線上課堂】每天都有産品技術專家分享!
課程位址:
https://yqh.aliyun.com/live立即加入社群,與專家面對面,及時了解課程最新動态!
【雲栖号線上課堂 社群】
https://c.tb.cn/F3.Z8gvnK
原文釋出時間:2020-04-08
本文作者:茕茕
本文來自:“
51CTO”,了解相關資訊可以關注“
”