天天看點

AIGC+ChatGPT,虛拟主播進入“同人化”時代

作者:Allmetas

直播經濟的高速增長正在推動直播形态的不斷更新,經過兩年的市場沉澱,備受Z世代消費者喜愛的“虛拟主播”已經迎來爆發式“生長”階段。

在各大視訊直播平台,不同風格類型的個性化3D虛拟主播正在替代真人主播活躍于直播間。虛拟主播大幅度推動了直播業務的發展,不僅可以24小時線上,表現穩定持久;還可以随時變換風格,保持新鮮感;并且在技術有保障的情況下,無需大量團隊的接入即可維持正常營運。

AIGC+ChatGPT,虛拟主播進入“同人化”時代

快手StreamLake 為蒙牛打造的虛拟員工「奶思」

聊天娛樂、遊戲互動、産品講解、情感語聊等等。虛拟主播的應用場景層出不窮,花樣百出,不僅在文化娛樂行業全面賦能,而且在快消、教育、金融、通訊等其他行業方向也能實作高效互動。

虛拟主播不僅提升了品牌的形象力和表現力,更是能作為數字員工服務于品牌,在一些領域替代人工。是以,對以虛拟主播為典型代表的“數字員工”服務能力的要求也越來越高。

如何對使用者的提問“對答如流”?

如何提高虛拟主播的直播效果?

如何才能降低虛拟主播的設計和營運成本?

在一系列的問題之下,AIGC技術的成熟與ChatGPT的橫空出世,或許給我們提供了更多解題思路。

01

從“拟人化”到“同人化”,虛拟主播的進階之路

《2022虛拟數字人綜合評估指數報告》這樣總結虛拟數字人發展的三個階段:

第一階段:拟人化,由計算機虛拟合成的高度逼真的三維動畫人物,動作形态聲音等與真人吻合,初步基于AI實作虛拟人驅動,實時進行資訊溝通和回報。

第二階段:同人化,從外觀的形态模拟進階到情感的可互動,情感算法技術實作與人類高品質情感互動。

第三階段:超人化,虛拟人的能力超越自然人,“虛拟”實體化,機器人承載虛拟人意識回到現實世界。

AIGC+ChatGPT,虛拟主播進入“同人化”時代

圖檔源自《2022虛拟數字人綜合評估指數報告》

目前,虛拟主播驅動模式主要有兩種:一種是由動捕技術+真人驅動的虛拟人,通過捕捉幕後“中之人”的動作表情塑造虛拟形象,也是目前最為主流的虛拟主播形式;另一種,則是由AI技術驅動,可以做到24小時不間斷直播。

從功能上看,動捕+真人驅動的虛拟主播雖然可以在互動環節上實作對答如流,但是仍然需要人工扮演,無法實作24小時的全天候服務。AI技術驅動的虛拟主播可以無限時長直播,但是在互動層面是根據品牌提前設定的知識庫模版進行互動問答,同時配合相關活動做一些娛樂形式的展示,利用的範圍和領域相對有限。

虛拟主播如何實作既與人類高品質情感互動,又能全天候線上?——AIGC+ChatGPT則讓我們看到了實作這種“既能又能”的可能性。

02

AIGC+ChatGPT,“同人化”的虛拟主播表現如何?

3月15日淩晨,OpenAI 釋出了多模态預訓練大模型GPT-4。GPT-4可以接受圖像和文本輸入,輸出文本、圖檔、音視訊等多模态,在許多領域的表現都超出了人類平均水準。随後,微軟于16日宣布,将推出名為Copilot的人工智能服務,并将其嵌入Word、PowerPoint、Excel等Office辦公軟體中,實作文本編寫,資料分析并生成圖示,以及管理收件箱,合成回複草稿等功能。在同一天,中國版的ChatGPT——百度文心一言正式對外亮相。

AIGC+ChatGPT,虛拟主播進入“同人化”時代

圖源自OpenAI官網截圖

國内外網際網路科技巨頭公司紛紛加入AI大語言模型的建設與布局,這無疑将建構更加良好的人工智能生态圈,推動AI技術能力大幅提升,未來以虛拟主播為典型代表的數字員工将成為企業必不可少的“标準配置”。

ChatGPT為虛拟主播帶去了語言能力的大幅提升:

ChatGPT的嵌入,就仿佛為“拟人化”的虛拟人裝上了大腦。不僅可以實作更加準确、流暢且自然的表達,更能通過快速的學習和适應,為使用者提供更具個性化的服務。通過相關資料的針對性訓練形成個性化模型,未來虛拟人将有望應用于線下展廳的AI講解介紹數字人、線上AI主播、AIGC快速短視訊系統等多個場景。

AIGC的助力主要展現在畫面和聲音層面:

AIGC在音視訊生成領域建樹頗多。一方面,從語音模仿到變聲器等功能,大大增加了互動娛樂性;另一方面,定制化的AIGC工具可以友善創作者制作出畫面、聲音、動态效果更精确的産品,提升作品綜合品質,極大地提高了創作效率。

視訊加載中...

世優科技數字人「小倩」

在ChatGPT和AIGC技術的加持下,虛拟主播将進入“同人化”階段。通過與各行業應用場景不斷地深度融合,“同人化”的虛拟主播将變身為企業的數字員工,成為企業降本增效的重要幫手——依靠系統的企業知識庫,為使用者提供7*24小時的随時服務,協助企業完成重複性工作,并大幅提高基礎工作的準确性和服務品質。

生動具體的虛拟形象,加以靈動且人性化的情感互動能力。這是一次營運工具的數字化革命,在不遠的未來,一個低成本高效率的數字員工将成為企業的标配。錯失一個突破性的工具,或許就将錯失一個時代。

AIGC+ChatGPT,虛拟主播進入“同人化”時代

“拟人化”虛拟主播VS“同人化”虛拟主播對比圖

“虛拟數字人驅動的最終形态,是實作AI驅動,即用‘AI’替換掉‘中之人’所扮演的角色。”虛拟内容技術服務提供商世優科技創始人&CEO紀智輝認為,虛拟主播可以作為品牌的固定資産,在未來一直使用,沉澱價值是無限的。

紀智輝透露,世優科技虛拟人除了接入ChatGPT智能語言模型外,還對虛拟人動作進行了專項訓練,以提高虛拟人在應用場景中的流暢度和逼真度。未來虛拟形象的使用可能像每個企業都配備官網、直播間一樣普遍,成為不可或缺的對外宣傳視窗。

03

世優科技AI數字人慕蘭,語言模型技術在國内數字人上的首次應用落地

2023年3月1日,世優(北京)科技有限公司宣布成為百度文心一言(英文名:ERNIE Bot)首批生态合作夥伴。後續,世優科技将通過百度智能雲全面體驗并接入文心一言的能力,接入百度文心語言模型的世優科技數字人,讓虛拟人向着更加智能、智慧的方向邁出了關鍵的一步。目前,世優科技已成功推出了具有語言模型技術加持的AI虛拟主播「慕蘭」。

AIGC+ChatGPT,虛拟主播進入“同人化”時代

世優科技AI虛拟主播「慕蘭」

“慕蘭,怎樣才能發财?”

“要想發财,首先要有規劃和耐心,你需要制定一個現實的财務目标,并且不斷努力去實作它。”

筆者和觀衆在慕蘭的抖音直播間進行了一場有趣的互動,數字人慕蘭可以就觀衆提出的不同問題,提供流暢簡潔又風趣幽默的回答。從直播互動體驗效果來看,慕蘭已經在智能程度上接近“同人化”,可與觀衆進行高品質的情感互動。

視訊加載中...

「慕蘭」直播錄屏

這是對話式語言模型技術在國内數字人應用場景上的首次落地。

在世優科技看來,數字人是AI的UI。從2022年主持了百度元宇宙歌會的度曉曉,到如今可以與使用者對答如流的慕蘭,通過世優科技強大的生成式AI技術能力,與文心大規模實時生成文本能力結合,利用AIGC技術轉換成圖文、音頻、視訊等内容,如今的虛拟人已經無需大量的人力支撐内容制作,即可生成具有智能對話能力的個性化模型。

經由世優數字人與ChatGPT+AIGC的技術組合,三維世界與現實世界的隔閡将逐漸消融,取而代之的是融合、互動,技術将為現實世界帶去更加多元、極具想象力的美好未來。

這也将為數字世界帶來颠覆性變革。

結語

調研資料顯示,2022年已有近七成的企業表示其公司開展直播的頻率有進一步地提升,且有49.0%的企業客戶表示其直播頻率的提升幅度較大。

如今的企業直播,早已從早期被迫的線上營業,發展成為貫穿醫療、教育、金融、内部教育訓練、對外營銷等多種場景,推動企業數字化程序的重要杠杆。

降低營銷成本,豐富營銷手段;打破時間和空間限制,建立與使用者的廣泛溝通;打造私域流量,促進轉化;收集、留存、打通使用者資料……作為數智時代的創新應用,虛拟主播所代表的新一代技術創作能力,已經對傳統企業運作、營銷推廣模式造成了颠覆。

虛拟人早已不僅僅是一個虛拟形象,而是企業的數字資産。誰能在品牌、技術、營運和場景等方向,占據領先優勢,建構競争壁壘能力,方能在新一輪的AI技術狂潮中占領先機,立于不敗之地。