天天看點

最科幻的一集:清華教授用AI寫小說,斬獲科幻獎

最科幻的一集:清華教授用AI寫小說,斬獲科幻獎

最科幻的一集:清華教授用AI寫小說,斬獲科幻獎

【文/觀察者網 周毅,編輯 張廣凱】

清華大學教授沈陽最近又“火”了。

不久前第五屆江蘇青年科普科幻作品大賽公布獲獎名單,署名“@矽禅”的《機憶之地》獲得二等獎。

@矽禅和《機憶之地》的由來不一般:作為國内最早開始元宇宙研究的學者之一,沈陽教授指定了卡夫卡風格,經過66次對話,由AI輸出了約43061個字元,他再從中複制出5915個字元,完成了該作的參賽版本——@矽禅這個名字,也是AI起的。

這可能是最與衆不同的二等獎:第一次,AICG(生成式人工智能)作品和人類作品一起參賽并獲獎。

最科幻的一集:清華教授用AI寫小說,斬獲科幻獎

圖檔轉引自現代快報

今年科技屆最大的“攪局者”當屬大模型。

一方面,ChatGPT的大火,讓人們意識到AI技術進步帶來的颠覆性,各類通用大模型和行業大模型如雨後春筍般湧現;另外一方面,AIGC(生成式人工智能)正在成為越來越多産品的“标配”,它們正融入到資訊搜尋、處理和輸出的各個環節,走向生活的方方面面。

關于國内外大模型能力的讨論,也從來沒有停止過。

是抓模型研發的基礎能力,還是抓貼合實戰的應用落地,中國大模型行業也存在着“城市包圍農村”和“農村包圍城市”的路徑之分。不少人認為,中國大模型應該揚長不避短:大模型底座能力要奮起直追,但将大模型和智能搜尋、智能制造和特色文旅産品相結合,同樣有爆發力。

AI作者,混入人類之中

在此前的一場活動上,沈陽教授向觀察者網等媒體分享了《機憶之地》的創作曆程。

“之前,我用人工智能寫了一篇小說的開頭,發到朋友圈。有記者就留言建議我說:沈老師,可以用這個混在人類小說大賽中投稿,看看能不能拿獎——而且讓評委察覺不到?”據沈陽透露,小說甚至沒有人為設定大綱,從大綱、正文、配圖,連筆名都是AI自己生成的。

據《揚子晚報》此前報道,《機憶之地》是江蘇省科普作家協會科幻專委會主任付昌義邀請沈陽來投稿的。兩人相識,該大賽征稿通知也沒有備注不允許使用AI。付昌義回憶稱,六位評委中有三位投票同意推薦這篇小說,但還是有人發現了異樣,“有一位在評選完了之後跟我說,感覺這篇文章有點像AI寫的,讀起來感覺還是有差距”。

在付昌義看來,這篇作品還有進步的空間。“第一個版本出來的時候我就看了,感覺不像個小說,像劇本大綱,後來做了修改要比第一稿好多了,但還是有欠缺的,隻能說達到了高中生或大學一年級學生初寫作的狀态,技巧性等方面和真正的作家還是有差距的。”

最科幻的一集:清華教授用AI寫小說,斬獲科幻獎

ChatGPT剛問世時,就曾展示過小說創作的能力 2023年4月測試截圖

AI寫小說并獲獎,會帶來什麼影響?

“AI創作文學作品,我想現在隻能說是一個起點。”在付昌義看來,現在還很難說這一次AI創作作品的獲獎會對未來産生怎樣的影響。”付昌義稱,“AI的進步也是促進我們人類創新,人類相較于AI最大的優勢在于人類有着更強大的創新能力、好奇心和想象力,這也許會成為一個開端,未來會怎樣我們保持觀望狀态。”

有趣的是,人們很久以前就設想過,會有新的“執筆者”出現。

例如關于無限猴子定理(Infinite monkey theorem)的讨論——無限次在打字機上随意敲擊鍵盤,最終能打出任何作品——甚至是莎翁全集。這個想法可以追溯到1913年,法國數學家埃米爾·博雷爾關于機率學的讨論。後來有人寫了一個“猴子模拟器”,專門用來模拟這件事發生的機率。

這個機率相當小。

最科幻的一集:清華教授用AI寫小說,斬獲科幻獎

“猴子模拟器”螢幕截圖

包括小寫字母(26個),空格、逗号、句号、分号和連字元在内,“猴子模拟器”能夠随機生成31種字元。不考慮區分字母大小寫和特殊标點的情況,那麼首個生成字元比對原文的機率是1/31,頭兩個字元都比對的機率是1/961(31x31)……以此類推,莎翁全集共計約500萬個字元,那麼猴子敲出莎翁全集的機率是1/31^5000000。

《Math Plus Magazine》刊文計算過:拿中彩票做類比,中頭獎的機率約1/14000000≈10^7.1,那麼猴子敲出莎翁全集的機率,相當于連續赢得約100萬個彩票頭獎——假設每周都中彩票頭獎,差不多要連着中兩萬年;用時間來計算,如果模拟器生成字元的速度為每秒50個,且不停地生成字元,那麼預計約132億年後,人類将有99%把握讀到莎翁全集——可宇宙誕生至今也不過138億年。

不僅僅是複制和重制,現在的人工智能已經展現出了一定的創作能力。技術進步,如今似乎正在以另外一種方式,模糊着文學和技術的邊界。當ChatGPT等大模型通過圖靈測試,人類的生活将面臨真正意義上的重構。

從1到100:在應用中發展大模型

熟悉沈陽教授的人,會發現他最近越來越“宅”了。

觀察者網上一次見到沈陽教授,還是在10月的一個活動現場。沈陽最近不太喜歡跟人聊天,反倒是每天要跟AI聊4個小時——他甚至還會跟AI聊未來,聊GPT5、GPT6、GPT7未來會怎麼樣。

不過,沈陽也長期保持着一種觀點:人工智能的基本原理是機率模型,機率模型一定會犯錯誤。

在沈陽看來,現在大模型的錯誤主要分幾類:

一類是AI幻覺,“一本正經地胡說八道”;一類是學習不夠,形成了知識盲區,比如問GPT4某某藥物的功效是什麼,它沒有學習過,它就答不上來——還有一類是引用謬誤,“你問一部電影的男主角和女主角是誰?AI說男的叫小帥,女主角是小美。這個資訊哪裡來的?從大量短視訊裡來的。這些資訊誤導了大模型。”

如何降低大模型的錯誤率?在沈陽看來,和搜尋引擎的結合是一個機會。

其一搜尋引擎資料量大,天然具備各種公開資料;其二在内容安全上,它們經過了長時間的考驗;其三,搜尋引擎為使用者提供資料查詢,大量的點選和回報本身就是一種互動。大模型可以對搜到的結果進行聚合——大模型頭部玩家中,很多也都是谷歌和百度等擁有搜尋業務的公司。

今年以來,包括微軟在内,頭部企業都試圖打通搜尋和AI智能對話的連結。在沈陽看來,這也會倒逼搜尋引擎的進步,“根據我的判斷,經過5到10年以後,可能就沒有搜尋引擎的概念,隻會有大模型的概念。因為你有任何問題,會習慣于問大模型,不再用搜尋引擎。這也是我們最近關注比較多的部分。”

最科幻的一集:清華教授用AI寫小說,斬獲科幻獎

微軟将AI大模型能力加入bing浏覽器

中國大模型還有哪些可以繼續提升的地方?在沈陽看來,中國大模型要把文本、圖檔和視訊融會貫通,實作多模态能力。“從識圖到生圖完全打通,這樣能做的事情就會多很多。”

此外,搜尋引擎和大模型要深度融合,特别是要把做搜尋引擎的優勢,充分内化到大模型的研發中——這或許能讓中國人走出一條跟美國人不一樣的道路來。哪怕中國人0到1的能力創新弱一點,但1到100的能力不弱于美國人。

“在移動網際網路,中國短視訊做到世界第一;直播帶貨,中國在全世界也是第一。在大模型的廣泛應用中,我們做了研究,特别希望國産大模型能夠跟中國的智能制造和文化數字化、跟中國已有的移動網際網路全球領先産品做深度融合,這樣就能在這個過程中展現出中國特色。”

(發言由現場錄音整理,未經當事人審訂)