天天看點

為了看看AI有多強,有人帶它玩了一次“劇本殺”

你愛玩劇本殺嗎?

有一個好消息是,再也不用為湊不夠隊友而發愁了;壞消息是,你再也摸不透、看不穿你的隊友了——因為有人借助浪潮資訊推出的源1.0模型訓練出可以在劇本殺裡扮演角色的AI了。

“我第一次玩劇本殺,沒想到是和AI一起,我感覺自己不是很入戲,但是這個蔡曉(AI)比我還入戲。在劇情中我的角色是個‘牆頭草’,屬于被争取票,這個蔡曉太主動了,讓我有點招架不住。頻繁的向我示好,然後像一個小女生一樣和我談她的夢想,整得我都不好意思拒絕。”一位真人玩家“孔墨”這樣說。

以劇本殺這個設定的場景來應用“預訓練大模型”AI帶給了開發者和玩家們驚喜和意外。沒有十全十美的技術,但技術打開了通往新世界的大門。

這道門會通向未來的元宇宙麼?

劇本殺裡的訓練

教AI玩劇本殺的創意來自6位隔離在上海的程式設計愛好者,他們來自上海交通大學、華東理工大學還有從事VRAR方面的業界人士。

畢竟是訓練AI,劇本還是經過了特别改編,選擇了有五個角色的微型線上劇本殺。每場召集四個真人玩家,并在他們不知情的情況下,由AI扮演配置設定剩下的角色。

“本着細節拉滿的原則,我們也為AI準備了一個微信賬号,并精心為她設定了昵稱和頭像,甚至每場遊戲前我們還會緊扣時事,為她準備近三天的朋友圈内容,遊戲後還會繼續連發三天朋友圈内容提供延展劇情。”開發者說。

為了看看AI有多強,有人帶它玩了一次“劇本殺”

這樣的AI陪玩可謂誠意滿滿,當玩家們得知自己和AI玩了一場劇本殺時都有些錯愕。畢竟,當玩家對AI的角色進行表白時,她的表現絕對是一位忠貞的女友,毫不猶豫派發“好人卡”:我們是最好的朋友。

開發周期雖然是短短的一個月左右,疊代可是每天都要進行的。開發者使用了浪潮源1.0,是一種生成式預訓練模型,也是目前世界上最大的單體中文NLP大模型。源1.0擅長的是零樣本(Zero-Shot)和小樣本(Few-Shot)學習,而非目前更多模型所擅長的微調試學習(finetune)。

如果用一串專業性的資料來描述,源1.0開放API使用的是Language Model(LM)模型結構,參數規模高達2457億,訓練采用的中文資料集達5000GB,相比GPT-3模型1750億參數量和570GB訓練資料集,“源1.0”參數規模領先40%,訓練資料集規模領先近10倍。

小樣本的好處在于2~3個,甚至1個合适example的示範下,模型可以很好地了解開發者希望實作的“對話政策”,仿佛具有“舉一反三”的能力。開發者把AI比作天資聰慧的張無忌,但是如果他碰到的不是世外高人,而是凡夫俗子,每天示範的就是如何上班摸魚、上課溜号是絕無可能練出九陽神功的。“源1.0模型也是這樣,雖然它背了5.02TB的中文資料,差不多相當于500多萬本書了,但是它也沒玩過劇本殺,能做的就是模拟和有樣學樣。”

AI需要根據劇情對不同角色采用不同而回答政策,“example語料庫”被分裝成4個TXT檔案,程式會根據提問者去對應選擇example來源。不過,在實際遊戲中,玩家可能的提問措辭是無窮無盡的。開發者還用到了百度飛槳釋出的預訓練模型——simnet_bow ,能夠自動計算短語相似度,而且運算速度快,顯存占用低。

可見訓練一個成功的AI也需要博采所長。決定采用哪一款開源模型也要受到如模型特性、API是否足夠友善使用等諸多因素影響。“浪潮的工程支援還是很到位的,是以開發門檻其實沒那麼高。API的相關接口給的很全。我其實不是專業程式員,稍微摸索一下都能夠用起來,我覺得可以再進一步做成PaaS平台,服務更多人。”開發者告訴第一财經,團隊對浪潮針對prompt生成、request送出以及reply查詢給出的範本代碼評價極高,表示“好到了我們直接拿來用的程度”。

為元宇宙“注入靈魂”

AI玩劇本殺是一次限定場景下緊密結合自然語言生成與自然語言了解的應用,也是虛拟人在“好看的皮囊”之外生成“有趣靈魂”的一次嘗試。

NLP領域在生成式預訓練大模型方面已經取得了長足進展,但是智能客服還難言智能,陪伴型的服務機器人比如智能音箱類産品還是會愉快地和主人頂嘴。

“對話有兩種,一種是開放語境,就是完全不受限制的。這種對AI的最低要求是說人話,但是對邏輯性、對上下文的了解和所謂的目标性是沒有要求的,這種很難有現實價值,如果是目标性對話,傳統的做法就不太能滿足需求。”

AI劇本殺的開發者想要做點改變,引入了“端到端”的做法。“我們也發現AI如果不記憶自己之前的答案,後續生成的結果會比較缺乏連續性,甚至給出前後沖突的回答。這些問題迫使我們決定增加‘多輪對話記憶機制’。” 在合适的 example的引導下,甚至能夠展現出一定的情商,增加了情緒化的表達。

為了看看AI有多強,有人帶它玩了一次“劇本殺”

開發者提供示例

“也不是說是每次AI都會這樣,是有随機性的。舉這個例子說明大模型的生成機制下,它會表現的不僅說人話了,還會帶一點人味,這個都是新特性,很有意思的新特性。”開發者告訴第一财經。

此外,就如人類在日常生活中也不會記住所有事情,沒有“注意力機制”的“記憶機制”其實對于對話AI來說是弊大于利的。然而,如果要引入“注意力機制”,那就要增加更加複雜的NLU(自然語言了解)算法。好在劇本殺的實際應用場景更多關注目前輪次的對話,對于需要遙遠輪次對話内容回答的情況,AI可以托言“忘記了”。

“對于我個人來講的話,現在對AI的研究和應用完全是興趣狀态,接下來我們可能會跟高校和文娛業内的一些專業人士有一些課題上的研究合作。”AI當然可以陪人類一起玩劇本殺,但是還有更多的可能性等待探索。

繼續閱讀