天天看點

去年AI當了回電影節作品編劇,現在MIT又訓練它來預測觀衆淚點

雖然計算機在觀看悲情電影時不會哭,但它卻能預測我們的淚點。

在2016年倫敦科幻電影節上首次亮相的科幻微電影《Sunspring》(《陽春》),講述了一個全民失業的反烏托邦國度,一經放映就吸引了大票粉絲,有觀衆評價它有趣卻又怪誕,但也有很多觀衆回報它的情節設計存在諸多不合理。

其實,這部影片最大的亮點就在于:它的編劇是人工智能(AI)。

看到這裡,很多人可能又會感慨:“機器會不會取代人類編劇,就像無人駕駛汽車可能取代了人類司機一樣?!”

其實,如前面所說,如果你細看這部影片,就會發現很多“穿幫”劇情。比如,片中某個角色咳嗽時眼球竟然掉了!還有有影評家指出:“片中的對話聽起來像是不相關語句的拼湊”。不難看出,盡管科技不斷進步,但人類編劇的地位卻仍然不可動搖。

這裡,我們來設想一個不太極端的場景:機器和人類是否有可能共同完成一個劇本?即由人類編劇負責撰寫巧妙的轉折和現實對話,AI則負責提供見解、增強故事的感染力,比如識别能觸動觀衆的背景音樂或畫面。

最近,麻省理工學院(MIT)媒體實驗室對這種人機合作編劇的形式進行了研究,并從中确認機器能否識别影片中常見的情感曲線——人物命運的跌宕起伏,包括在困境中掙紮、克服困難、誤入歧途、戰勝邪惡勢力等等。我們發現,不論是對于YouTube上的業餘視訊制作者,還是電影工作室制作人,隻要涉及到劇情編寫,都會考量這些問題。

是以,如果機器能做到這些,那麼編劇是否可以借助這些資訊來預測觀衆的反應,進而調整自己的劇本?答案是肯定的。

首先,我們先來談談情感曲線。

縱觀整個文學領域,我們發現像桑達克、斯皮爾伯格、普魯斯特和皮克斯這樣的傳奇作家,就非常善于拿捏和激發觀衆的情感,并通過觀衆的喜惡,适當調整故事情節,在關鍵的時刻喚起觀衆内心的快樂、傷感或憤怒。然而,就算是最優秀的作家,也無法確定故事情節的完美無缺,就連莎士比亞的某些戲劇也可能無法讓觀衆産生共鳴(沒有多少人喜歡他的《辛白林》)。

那麼,是什麼導緻有些電影廣受好評,有些卻無人問津?對情感曲線的把握非常關鍵。

情感曲線這一概念由來已久,大師級作家都對它十分熟悉,有些人還會嘗試找出其中的通用模式。舉個例子,美國黑色幽默作家Kurt Vonnegut就認為最成功的情感曲線是《灰姑娘》的故事模式:在故事開頭主人公灰姑娘身處困境,接着在仙女教母的幫助下扭轉命運,其他難題也随之解決。

總結一下,即“苦難”的故事開頭,但最終都有圓滿的結局——王子和公主從此過上了幸福美滿的生活。

毋庸置疑,故事的情感曲線往往會影響觀衆的參與度,包括觀衆在社交網絡上的影評,以及是否将其推薦給其他朋友。據賓夕法尼亞大學對《紐約時報》的文章展開的研究發現,讀者更樂意分享那些能引起強烈情感共鳴的故事,尤其是能喚起讀者積極情緒的故事。由此可推測,電影觀衆也會有與讀者相似的回報方式。

此前,佛蒙特大學開發了一種算法,即利用計算機掃描影片台詞或劇本内容來建構情感曲線。

在此基礎上,不久前MIT社會機器實驗室又聯合麥肯錫消費技術與媒體團隊繼續進行了深入研究,研發了基于深度神經網絡的機器學習模型,用來觀看影片、電視節目和網絡短片中的細節特征,并實時評估其中包含的積極與消極情緒。

這些模型的研究範圍覆寫影片的所有元素,包括情節、角色、對話,及例如追車場景中的人臉特寫或音樂片段等其他細節。通過将各部分組成一個整體,就形成了故事的情感曲線。

也就是說,當機器檢視了未标記視訊後,就能基于所有視聽元素為故事創作出情感曲線。這是前所未見的。

以著名的3D動畫電影《飛屋環遊記》的片頭為例,影片主角Carl Fredricksen是個脾氣暴躁的小老頭,在妻子Ellie去世後,他用數千個氣球帶着自己的房子飛向南美。為了更好展現Carl的探險旅程,編劇需要想出一個快速交代複雜背景故事的方法。

影片以一個無聲的片段(隻有背景音樂)為開頭,随着Carl的生活場景徐徐展開,情感曲線也就出現了。(我們也觀察了整部影片的情感曲線,但分段考查更能以小見大。)如下圖:

▲圖1:由機器算法所展現的電影《飛屋環遊記》片頭的情感曲線

從圖中可以看到,影片中蒙太奇(在電影中指有意涵的時空人為的拼貼剪輯手法)的高低點,x軸是時間,以分鐘為機關;y軸是視覺效價,即圖像在特定時間喚起觀衆積極或消極情緒的程度。此處由機器打分,分數越高,情緒越積極。為開展全面分析,我們還用機器為完整影音建立了類似圖表。不過重點在圖像上,因為這也是接下來分析觀衆情感投入的研究重點。

在圖中,視覺效價的分值為0到1,但并非每部電影的情感曲線都會跨域整個區間。重點在于相對效價,即某個場景與其他場景相比之下的積極或消極程度,以及情感曲線的整體形狀。

和其他影片一樣,《飛屋環遊記》片頭的蒙太奇片段中也有系列情緒波動,是以其情感曲線并非連續上升或下降。例如,Carl在兒時探險時,曲線到達了峰值(carl兒時的探險經曆中有很多美好快樂的回憶);而當年輕的Ellie半夜恐吓Carl時,曲線瞬間大幅下滑。Carl受到驚吓後,曲線呈現了消極走向。另外兩處的峰值間隔較長,出現于Carl和Ellie婚後渴望孩子以及老兩口深情相擁的片段。結尾處, Carl在Ellie 病逝後獨自一人回到家中,情感效價驟降。

目前,MIT的機器學習模型已經分析了上千部影片,并為每部影片繪制了情感曲線。為檢驗其準确性,團隊還招募了志願者為各電影片段手動标注情感标簽,同時,志願者們通過注明喚起情感共鳴的影片元素,如對話、音樂或畫面,還可以不斷優化模型。

通過對影片分析資料的篩選,我們開發了一套為影片故事分類的方法,即把情感曲線相同的影片歸為一類。這個方法結合了聚類算法k-medoids與動态時間規整算法,進而檢測兩個不同情緒變化頻率的視訊序列之間的相似之處。

整個研究過程選取了兩個不同的資料集,分别由500多部好萊塢電影和Vimeo網站上的1500個短片構成,并從中歸納情感曲線的類别。

在初步分析其視覺效價時,我們發現大多數影片可歸納為幾種類别,結果與Kurt Vonnegut的猜想一緻。

▲圖2:不同類别的影片的情感曲線

從上圖中看到,Vimeo資料集中的情感曲線可分為五類。例如,标黃的曲線類型在視訊前期消極情緒激增,此後直至接近尾聲,始終維持積極情緒。(經機器對資料進行分析評分,所有影片開頭和結尾處的效價值都會偏低。)

了解影片的情感走向誠然有趣,但明确如何使用這些分析結果更為重要。

影片的情感曲線或曲線類别能否決定觀衆的觀影反應?包含特定情感曲線的影片能否激發觀衆的情緒?研究團隊嘗試通過分析Vimeo短片的資料集來回答以上問題。(相較于聲音曲線,視覺曲線與影片内容的關聯性更強,且結合兩種曲線會增加分析難度,是以決定圍繞視覺曲線展開分析。)

在保證影響線上回報的中繼資料(如影片長度和上傳日期)不變的前提下,我們運用了回歸模型分析影片的情感曲線特征。

需要說明的是,本研究的目的是預測Twitter及其他社交媒體上影片的評論數。除去評論中的負面内容,多數情況下,評論越多說明觀衆反應越強烈。但也有例外,比如像Gigli和Ishtar(《鴛鴦綁匪》和《伊斯達》)這類電影,盡管能引發大量網評,卻鮮有好評。

在分析Vimeo短片時,利用視覺曲線确實可以預測觀衆的參與度,其中幾類影片更能吸引評論(為確定準确性,每次分析都會選擇不同類别的電影)。由分析可知,圖2标紅的曲線類型走勢起起伏伏,早期充滿成功和喜悅,後期逐漸陷入不幸。在所有類别中,此類影片結局最悲慘。但盡管如此,還是會給觀衆留下深刻印象。

除此之外,在針對Vimeo短片的其他分析中,還有一類影片的評論最多,遠高于其他影片(見圖3)。這類影片多以積極的情感爆發作為故事高潮,接近曲線尾端時走勢激增。而圖中這兩類影片的主要差別在于左側圖中的故事在圓滿結局前的情緒波動更大。

▲圖3:兩類評論最多的影片類型

相較于其他悲情結局的電影,上圖這兩種影片的評論更多,這一發現或許與賓夕法尼亞大學研究表明觀衆更喜愛大團圓結局的結果正好相反。

在此基礎上,研究團隊還浏覽了Vimeo網上短片的所有評論,對情感傾向進行分類評分,然後運作程式統計了評論長度。分析結果表明,上述三類影片(即黃色、紅色和藍色線條)的評論更長,觀衆反應更強烈。評論不僅隻有“好電影”幾個字,還可見走心評論,如“太棒了……太震撼了……仿佛受到了重擊。”還有些評論也很醒目,它們不局限于個别的視覺畫面,還在意影片帶來的整體感受,或影片的情節走向。

事實上,這些分析并非要讓編劇按照特定模版撰寫劇本,就像要求George Orwell為《1984》續寫美滿結局來博觀衆歡心一樣。但它們可以激勵編劇客觀地審視劇本内容,并作出相應調整以引發觀衆共鳴,包括改變關鍵場景配樂或對情節、對話或角色等内容進行微調。

總的來看,随着AI的推廣,影片制作過程也在發生改變,編劇和作家可以借助人工智能來打磨情節,增加故事的吸引力,而導演也可以借此在影片中設定更具沖擊力的動作捕捉。越來越多的影視從業者開始逐漸意識到AI的價值,并利用其中的價值進行創作。

原文出處:科技行者

轉載請與作者聯系,同時請務必标明文章原始出處和原文連結及本聲明。

繼續閱讀