通過了解自身的行為方式、記憶、偏好等内容,複刻一個專屬于自己的虛拟化身,實作打破次元壁的互動,結識好友,獲得陪伴......如今,科幻電影中描繪的場景正走向現實。
2024年10月14日-18日, GITEX GLOBAL海灣資訊技術博覽會在迪拜舉辦。在這個全球範圍頗具影響力的科技盛會上,新型社交平台Soul App攜最新自研的多模态大模型參展,該模型具備多模态了解、真實拟人、文字對話、語音通話、多語種等特性。在活動現場,觀衆可以通過數字裝置,即時生成3D虛拟數字分身,通過實時動作捕捉與還原,體驗自然、流暢、沉浸式的多模态互動。
Soul App CTO 陶明表示,“在受全球關注的科技大會上,我們期待與來自國内外的創新企業、科技公司共同交流,展現中國企業在社交領域的最新應用實踐和數字娛樂的創新方案,共同探索社交發展的新可能。”
3D數字孿生,虛拟與現實的創新互動
GITEX GLOBAL至今已舉辦至第44屆,自誕生以來,始終聚焦于以技術為驅動的創新,吸引了來自大型科技企業、全球政府、創新初創公司、專業投資者等的廣泛關注和參與。目前,GITEX GLOBAL已發展成為中東地區規模最大、最成功的計算機通訊及消費性電子産品展,同時也是全球三大IT展之一。
自ChatGPT橫空出世,标志着人工智能發展至新階段,在世界進入全面擁抱人工智能的新時代的當下,今年,GITEX GLOBAL 2024規模再次更新,橫跨兩個大型場館 —— 迪拜世界貿易中心和迪拜港,有全球超過6700家科技巨頭和創新公司參展,展示AI領域最具突破性的科技發展、智能互聯新發現、以及來自數字娛樂、社交、教育、健康等各大領域的應用落地标杆案例,彙聚最前沿的尖端技術思潮,引領行業變革的新風向。
作為國内較早将AI引入社交關系的網際網路平台代表之一,Soul 攜最新自研的多模态大模型參展GITEX GLOBAL 2024,展示AI技術積累以及在社交場景的最新落地實踐。此次也是Soul首次亮相國際大型展會,大會上,現場觀衆可以重點體驗到Soul內建3D虛拟人能力的多模态AI互動方案。
為了降低使用者社交壓力,Soul自2016年上線之初便不支援使用者上傳真實頭像,年輕人通過平台提供的捏臉系統,自主創造個性化虛拟形象,在不強調顔值、地理位置等實體因素的情況下,自在表達,分享熱愛,相遇同好。
2022年,Soul內建AI、渲染和圖像處理等技術,推出自研的NAWA引擎,為使用者建立個性化的3D社交形象和場景提供技術加持。基于該引擎,使用者可以自主創作生動的虛拟形象,塑造網絡世界的化身,并能靈活地配合聲音、文字等各種資訊,展現每個人鮮明的個性,精準傳遞情緒溫度,在各種虛實融合的場景中與他人自在交流、互動,感受全新的社交體驗。
集合過往的技術儲備以及大模型研發進展的突破,現階段,Soul 3D虛拟人能力全面更新,形成了成熟的內建3D虛拟人能力的多模态AI互動方案——即集合文字、語音、動作互動的多模态大模型方向,實作更接近人類模式的互動體驗和更高效、自然、豐富次元的資訊傳遞。
在大會現場,參與體驗的使用者可以實作高相似度的3D虛拟人的AI模組化,通過包含人臉的90餘個形狀參數和6個屬性參數,于幾秒鐘内,快速在3D世界精細化還原真實人臉的特征,打造專屬的虛拟化身。
同時,基于實時的人體動作識别、數字還原以及多模态對話互動能力,現場可以實作3D虛拟人與真人的沉浸式互動。
多模态端到端大模型,超拟人的情感體驗
事實上,包括語言、對話、3D虛拟人等次元在内,Soul聚焦于多模态大模型方向持續深耕。
在推出智能推薦引擎“靈犀”、以AI算法助力社交關系的發現沉澱環節後,2020年,Soul正式啟動對AIGC的技術研發工作,系統推進在智能對話、語音技術、3D虛拟人等AIGC關鍵技術能力研發工作,并推動AI能力在社交場景的快速落地。
目前,Soul已先後上線了自研語言大模型Soul X,以及語音生成大模型、語音識别大模型、語音對話大模型、音樂生成大模型等語音大模型能力。今年6月,Soul還在社交行業中較早推出了自研端到端全雙工語音通話大模型,具備超低互動延遲、快速自動打斷、超真實聲音表達和情緒感覺了解能力等特點,能夠直接了解豐富的聲音世界,支援超拟人化的多風格語言,實作更接近生活日常的互動對話和“類真人”的情感陪伴體驗。
2024年,Soul AI大模型能力整體更新為了多模态端到端大模型,支援文字對話、語音通話、多語種、多模态了解、真實拟人等特性。
多模态端到端大模型的推出标志着Soul對人機互動體驗的創新突破,同時,從文字、語音到視覺的模态更新,也意味着互動方式的颠覆式改變。
例如,Soul已基于自研AI能力推出了“數字分身”功能,使用者可以直接授權平台基于聊天記錄、發帖内容,或者以自定義方式,設定數字分身的形象和特征,在表征層(形象、聲音、文字風格),身份層(社交關系、長期記憶、人設資訊)和認知層(決策、觀點、偏好),使數字分身達到最大程度複刻真人的效果。而“數字分身”不僅能實作更個性化、更千人千面的智能回複推薦,幫助使用者進行社交破冰,還能在助力人設搭建和認知決策中,提升社交溝通效率。
接下來,通過最新內建的3D虛拟人能力和多模态端到端大模型的AI互動方案,Soul使用者自主打造的3D虛拟人,可以作為數字世界的多模态全能助手,在平台群聊派對、瞬間廣場等豐富社交場景中全面賦能使用者的關系發現、建立、沉澱環節,拓展新關系的同時,提供高品質、趣味性、沉浸式的人機互動體驗,回報真實、自然的情感陪伴。
Soul App CTO陶明表示,“作為天然的流量聚集地和互動入口,社交被視為AI率先落地的最佳場景之一。我們将圍繞使用者的實際社交需求和具體社交場景,持續加大對AI技術的投入,給使用者帶來長期的可持續的價值。預計今年年底,Soul多模态端到端大模型将再次更新,推出全雙工視訊通話能力,讓使用者可以真正便捷、自然的體驗到包括文字、語音、視覺在内的多模态創新互動。”