天天看點

OpenAI官方推出AI生成内容識别器,成功率26%,不如論文查重工具

作者:機器之心Pro

機器之心報道

編輯:澤南、杜偉

識别 ChatGPT 生成的内容,OpenAI 親自上陣了。

很多人也許已經忘記,ChatGPT 正式釋出時間是去年 11 月底,到現在才剛剛兩個月,但它掀起的熱潮卻已引發科技公司紛紛跟進,催生了獨角獸創業公司,還讓學術界修改了論文接收的要求。

在 ChatGPT 引發 AI 領域「是否要禁用」大讨論之後,OpenAI 的真假鑒别工具終于來了。

1 月 31 日,OpenAI 官宣了區分人類作品和 AI 生成文本的識别工具上線,該技術旨在識别自家的 ChatGPT、GPT-3 等模型生成的内容。然而分類器目前看起來準确性堪憂:OpenAI 在部落格裡指出 AI 識别 AI 高置信度正确率約為 26%。但該機構認為,當它與其他方法結合使用時,可以有助于防止 AI 文本生成器被濫用。

「我們提出分類器的目的是幫助減少人工智能生成的文本造成的混淆。然而它仍然有一些局限性,是以它應該被用作其他确定文本來源方法的補充,而不是作為主要的決策工具,」OpenAI 發言人通過電子郵件對媒體介紹道。「我們正通過這個初始分類器擷取有關此類工具是否有用的回報,并希望在未來分享改進的方法。」

最近科技領域随着圍繞生成式 AI,尤其是文本生成 AI 的熱情正在不斷增長,但相對的是人們對于濫用的擔憂,批評者呼籲這些工具的創造者應該采取措施減輕其潛在的有害影響。

面對海量的 AI 生成内容,一些行業立刻作出了限制,美國一些最大的學區已禁止在其網絡和裝置上使用 ChatGPT,擔心會影響學生的學習和該工具生成的内容的準确性。包括 Stack Overflow 在内的網站也已禁止使用者共享 ChatGPT 生成的内容,稱人工智能會讓使用者在正常的讨論中被無用内容淹沒。

這些情況突出了 AI 識别工具的必要性。雖然效果不盡如人意,但 OpenAI AI 文本分類器(OpenAI AI Text Classifier)在架構上實作了和 GPT 系列的對标。它和 ChatGPT 一樣是一種語言模型,是根據來自網絡的許多公開文本示例進行訓練的。與 ChatGPT 不同的是,它經過微調可以預測一段文本由 AI 生成的可能性 —— 不僅來自 ChatGPT,也包括來自任何文本生成 AI 模型的内容。

具體來說,OpenAI 在來自五個不同組織(包括 OpenAI 自己)的 34 個文本生成系統的文本上訓練了 AI 文本分類器。這些内容與維基百科中相似(但不完全相同)的人工文本、從 Reddit 上共享的連結中提取的網站以及為 OpenAI 文本生成系統收集的一組「人類示範」配對。

需要注意的是,OpenAI 文本分類器不适用于所有類型的文本。被檢測的内容至少需要 1000 個字元,或大約 150 到 250 個單詞。它沒有論文檢測平台那樣的查重能力 —— 考慮到文本生成人工智能已被證明會照抄訓練集裡的「正确答案」,這是一個非常難受的限制。OpenAI 表示,由于其英語前向資料集,它更有可能在兒童或非英語語言書寫的文本上出錯。

在評估一段給定的文本是否由 AI 生成時,檢測器不會正面回答是或否。根據其置信度,它會将文本标記為「非常不可能」由 AI 生成(小于 10% 的可能性)、「不太可能」由 AI 生成(在 10% 到 45% 之間的可能性)、「不清楚它是否是」AI 生成(45% 到 90% 的機會)、「可能」由 AI 生成(90% 到 98% 的機會)或「很有可能」由 AI 生成(超過 98% 的機會)。

看起來和圖像識别的 AI 很像,除了準确程度。根據 OpenAI 的說法,分類器錯誤地将人類編寫的文本标記為 AI 編寫的文本的機率為 9%。

一番試用之後,效果的确不大行

OpenAI 宣稱其 AI 文本分類器的成功率約為 26%,一些網友上手試用之後,發現識别效果果然不行。

知名 ML 和 AI 研究人員 Sebastian Raschka 試用之後,給出了「It does not work」的評價。他使用其 2015 年初版的 Python ML 書籍作為輸入文本,結果顯示如下。

  • Randy Olson 的 foreword 部分被識别為不清楚是否由 AI 生成(unclear)
  • 他自己的 preface 部分被識别為可能由 AI 生成(possibly AI)
  • 第一章的段落部分被識别為很可能由 AI 生成(likely AI)

Sebastian Raschka 對此表示,這是一個有趣的例子,但自己已經為将來可能因離譜的論文識别結果而受到懲罰的學生感到難過了。

是以他提議,如果要部署這樣的模型,請共享一個混淆矩陣。不然如果教育者采用這一模型進行評分,則可能會對現實世界造成傷害。此外還應該增加一些有關誤報和漏報的透明度。

此外,Sebastian Raschka 輸入了莎士比亞《麥克白》第一頁的内容,OpenAI AI 文本分類器給出的結果竟然是很可能由 AI 生成。簡直離譜!

OpenAI官方推出AI生成内容識别器,成功率26%,不如論文查重工具

還有人上傳了 AI 寫作工具 Easy-Peasy.AI 創作的内容,結果 OpenAI AI 文本分類器判定為由 AI 生成的可能性非常小。

OpenAI官方推出AI生成内容識别器,成功率26%,不如論文查重工具

最後,有人用上了反複翻譯大法,把文本讓 GPT3 重寫一遍,也能騙過識别器。

總結一下的話就是正向識别不準,反向識别出錯,也無法識破一些改論文的技巧。看來,起碼在 AI 文本内容識别這一領域,OpenAI 還需努力。

參考内容:

https://techcrunch.com/2023/01/31/openai-releases-tool-to-detect-ai-generated-text-including-from-chatgpt/

https://openai.com/blog/chatgpt/

繼續閱讀