天天看點

智能圖形學的進展及應用

演講嘉賓簡介:秦昊,相芯科技CTO 預約觀看演講視訊

以下内容根據演講視訊以及PPT整理而成。

本文将站在應用角度為大家展示相芯科技聯合阿裡雲TTS開發的AI數字人應用案例。

AI數字人

AI數字人的概念起源于2017年SIGGRAPH大會上,衆多學術機構合作推出了一款AI數字人Virtual Mike。通過融合當時尖端的渲染技術與動作捕捉技術大會打造了一個惟妙惟肖的實時虛拟角色。經過兩三年的發展,網際網路行業中開始出現數字人技術應用的案例,如百度公司與浦發銀行共同打造的AI數字人“小浦”可以作為銀行的數字員工為相關使用者提供業務咨詢及簡單業務辦理的服務。

智能圖形學的進展及應用
智能圖形學的進展及應用

AI數字人技術為使用者提供了全新基于視覺通道的人機互動界面。該界面通過融合CG技術、語音技術及自然語言處理等多種技術,為使用者打造出類似人與人互動的操作體驗。企業通過切換數字人背後的知識庫或AI子產品使其可以支撐不同的業務場景,如在媒體播報領域、個人助理領域及業務咨詢等領域數字人技術均有不俗的表現。

虛拟主播雲平台

相芯科技公司基于與阿裡雲的合作在很多領域開始進行AI數字人技術的應用落地。相芯科技的AI數字人技術,隻需要輸入一段文字,就可以全自動地合成整個人的說話,包含動作、形态、情緒的視訊。公司搭建的虛拟主播雲平台如下圖所示。在平台編輯界面中,使用者可以對虛拟人物的角色、對話内容腳本及相關人物動作進行選擇,并通過阿裡雲的雲伺服器進行渲染和視訊合成,就能快速生成數字人的視訊,使用者可以自行将視訊下載下傳,并進行分發。

智能圖形學的進展及應用

虛拟主播及虛拟機器人

下圖所示為公司虛拟主持人子產品的架構。公司将相關腳本輸入,通過TTS語音技術完成人物語音的合成,在STA(Speech-to-Animation)子產品中進行動畫及視訊合成,最後生成相關的虛拟視訊。企業同時對互動助手、虛拟機器人技術架構進行了開發。在資料輸入部分,系統通過接入自然語言處理等子產品完成了機器人問答系統的搭建,以此支援數字人與使用者的實時互動功能。

智能圖形學的進展及應用

語音技術合作夥伴—阿裡雲TTS

STA業務打造的虛拟主播與虛拟客服,都離不開語音合成技術TTS的支援。企業對市面上提供TTS服務的公司進行調研對比後,選擇了阿裡雲TTS作為合作夥伴。企業通過與阿裡雲TTS的合作,為數字人角色搭建了真實自然的語音模型,并陸續在進行更深層次的技術合作。

智能圖形學的進展及應用

STA算法流程

下圖所示為STA(Speech-to-Animation)算法流程示意圖。企業将文本資料與語音資料共同作為算法資料導入算法子產品中,算法将會對語音資料中的情緒及語速等因素進行分析,以此合成出數字人說話的口型、發音及與使用者的對話情景等資料,通過分析出的資料驅動數字人表現出自然生動的畫面。

智能圖形學的進展及應用

圖形合成子產品

企業經過一系列探索,目前已擁有了完備的數字人表現及部署方案。從3D卡通形象到高精度虛拟人形象企業均可提供良好的塑造技術支援。企業可以使用不同的虛拟人物完成不同業務場景下對虛拟人物的需求,包括且不限于支援智能手機、終端及大屏上數字人的問答業務、支援雲渲染實作高品質視訊合成等業務場景。

智能圖形學的進展及應用

照片級人像合成技術

企業由SIGGRAPH大會論文成果設計實作的照片級人像合成技術效果如下圖所示。使用者在左側輸入表情時,右側的目标照片上的人物可以實時做出惟妙惟肖的表情。該技術能非常細膩地合成人物臉上每處細節(如法令紋、牙齒等),使觀看者感受到照片像現實人物一樣在做動作。

智能圖形學的進展及應用

該技術背後為企業基于生成對抗網絡所開發的技術架構。由于生成對抗網絡技術最大的難點在于它生成的結果的不可控性,考慮到數字人場景需要極其精準掌控人物的發音狀态表現,開發團隊創新性的建構了兩個階段的人像合成算法架構。算法首先通過三維的資料重建與資料了解将圖像變形到開發團隊預設的表情上,之後算法通過生成對抗網絡技術對虛拟人物在細節上進行修補與還原。在這種方案下,生成對抗網絡本身可以專注于人物細節的修補,免去了其處理圖檔形變與位移所需的精力,使算法可以良好的控制虛拟人物表情變化,真實的還原人物細節。

智能圖形學的進展及應用

下圖為企業照片級人像合成技術的效果。左上方在人在做一些表情,來控制其他照片,使這五張照片也可以合成出非常真實的表情,包括牙齒、嘴巴内部、法令紋等細節都能合成得非常真實,很難判别出真假。

智能圖形學的進展及應用

虛拟主播案例

目前AI數字人技術不僅可以在高精度虛拟人物合成場景中進行應用,同時也多樣型的數字人解決方案開始在各行各業的業務場景中落地提供相應服務。下圖所示為企業基于AI數字人技術設計開發的虛拟主播應用案例。對于報社、電視台及媒體等業務方而言,虛拟主播技術很好的滿足了業務方在自動化視訊生成、媒體内容生成方面的業務需求,成為了融媒體時代新聞媒體的傳媒利器。同時虛拟主播技術也被應用于新媒體之中,業務方通過打造公司專屬的虛拟主播形象既可以實作與觀衆的情感互動也保證了公司本身的傳媒影響力,避免了出現以往公衆影響力集中在新聞主播身上的情況。

智能圖形學的進展及應用

虛拟機器人案例

企業在具有将強的互動性虛拟機器人和互動助手在技術上也在進行相關探索。通過STA技術,企業将虛拟人物與問答系統整合。在使用者使用系統進行互動時,系統将展現出更為具象的虛拟人物進行交流互動。比如公司通過與汽車企業合作研制的車機虛拟助手目前已實作量産車上的部署。公司同時積極探索數字人技術線上下場景中的應用,通過在銀行大廳、地鐵售票處、醫院、法庭及企業展廳中部署AI數字人系統。同時公司可以實作讓智能音箱更新為具有具像化形象的智能系統。公司為不同業務的使用者群體提供了更為高效便利的咨詢服務及良好的互動體驗。

繼續閱讀