天天看點

“采銷東哥”AI數字人為啥口音也正宗,網友稱“這麼多小動作,肯定是真人!”

作者:極目新聞

極目新聞記者 陳紅

“大家好,好久不見,我是你們的老朋友東哥……”面對衆網友喊話開直播,“劉強東”以新的形式與大家見面。

4月16日下午6時18分,由京東雲言犀打造的“采銷東哥”AI數字人開啟直播首秀,同時亮相京東家電家居、京東超市采銷直播間。此前一天,京東官方釋出了預熱視訊,不少網友笃定視訊中不是AI,“這麼多小動作,肯定是真人!”

“采銷東哥”AI數字人是如何練成的?

“采銷東哥”講話時偶爾搓動手指

在4月16日的直播首秀中,“采銷東哥”AI數字人一改劉強東以往堅忍不拔的拼搏風格,讓網友們看到了他的另一面:談笑自若,聊自己在運動、烹饪方面的心得,還對直播帶貨的大屏電視、一日三餐的健康搭配滔滔不絕,成為當天京東直播的“首席采銷”。

不少網友驚歎,“采銷東哥”AI數字人近乎百分百還原了東哥的表情、姿态、手勢、音色,即便是數字分身也能擁有鮮活的生命力。不僅要“形似”,更要“神似”,數字人作為人類形象的模仿和延伸,這是怎麼做到的?

“采銷東哥”AI數字人為啥口音也正宗,網友稱“這麼多小動作,肯定是真人!”
“采銷東哥”AI數字人為啥口音也正宗,網友稱“這麼多小動作,肯定是真人!”
“采銷東哥”AI數字人為啥口音也正宗,網友稱“這麼多小動作,肯定是真人!”

“‘采銷東哥’AI數字人是由京東雲言犀制作的。大模型會注意捕捉和呈現東哥的習慣性表情和動作,比如在講話時偶爾搓動手指,強調某件事時會配合更大幅度的手部動作,還有時不時地點頭等。”京東相關負責人介紹說,AI數字人其實更具挑戰的是聲音還原,聽過東哥講話的人,對他的宿遷口音印象深刻,會發現他語速比較快,吐字比較輕,有些詞語會習慣連讀,他對“時間”“正是”中的“sh”發音帶有重鼻音,還喜歡稱呼“兄弟們”鼓舞大家的士氣……

“采銷東哥”AI數字人為啥口音也正宗,網友稱“這麼多小動作,肯定是真人!”

據了解,要讓數字人說好國語并不難,但要讓“采銷東哥”AI數字人說好“宿遷國語”,學習本人的發音習慣并不容易。比如要不要加鼻音,哪裡要連讀,就需要大模型給出準确判斷。這背後依托了京東言犀大模型對形象與聲音的不斷學習與訓練優化。

京東相關負責人還透露,為了讓聲音更适合直播帶貨,以及把“兄弟們”這樣的口頭禅用在合适的地方,京東雲言犀團隊對這些細節進行了模型調優。他們起初“喂”給大模型的演講素材,雖然充滿激情、爆發力強,但過于正式。為此,他們用最新錄制的閑談作為主要素材,其中有東哥娓娓道來生動的旅行經曆,再提取5分鐘演講的韻律特征灌給大模型,通過不斷優化,最終塑造出“采銷東哥”AI數字人親切自然、貼近使用者的聲音。

訓練時被“喂”入5萬小時語音資料

京東雲言犀數字人已服務超4000家品牌直播間

“采銷東哥”AI數字人誕生背後,離不開京東雲言犀多年的技術深耕與積累。

據了解,言犀語音大模型在訓練時,被“喂”入5萬小時海量鮮活的語音資料,這讓言犀數字人可以智能比對不同直播風格,比如用沉穩的音色營造專業的氛圍,又或者用極具感染力的聲音吸引使用者下單,還賦予言大姿态肢體表現。實驗表明,絕大部分使用者在120秒内難以察覺這是數字人。

言犀數字人在零配置基礎上,覆寫了直播間70%的常見問詢,還能借助大模型智能問答調優助手自我疊代。一方面根據商詳頁與腳本自動生成問答,一方面直播結束後自動補足沒有覆寫的知識點,高效、實時地回答海量咨詢。比如,他能像精通業務的資深導購那樣,當有人提問“有沒有适合女生的公路自行車”或“有沒有适合大學生的手機”時,給出适合的商品推薦,應答準确率超90%。

令人驚訝的是,如果直播時有缺貨商品,直播中控台将如同言犀數字人的“大腦”,及時調整直播話術,比如跳過缺貨的商品,或為爆品增加講解頻率。還能監測直播間互動是否過于頻繁,并調整互動頻次和機制,確定順利。

據悉,目前京東雲言犀數字人已服務超4000家品牌直播間。自去年7月,京東釋出言犀大模型,以其為基座,京東陸續推出了近100種創新應用,包括京東智能導購助手“京言”、醫療健康大模型“京醫千詢”、京東物流超腦、京東智能客服、京小智、言犀多模态數字人,通過底層算力到模型服務與AI平台的全棧技術創新,服務平台營運、專業品類知識增強、消費體驗優化、決策成本降低、智能搜推、商家帶貨轉化等場景。

百度創始人李彥宏同日因AI亮相

巧合的是,同樣在4月16日,百度創始人李彥宏也再次活躍在公衆視線中,為自家技術應用站台。在Create2024百度AI開發者大會上,李彥宏強調了未來AI應用發展的一個重要趨勢,并連發多款AI開發工具,給出“開源模型會越來越落後”的判斷。

會上,李彥宏發表了“人人都是開發者”的主題演講,他表示,AI正在掀起一場創造力革命,未來開發應用就像拍個短視訊一樣簡單,人人都是開發者,人人都是創造者。會上,百度正式釋出文心大模型4.0的工具版。使用者可以在工具版上體驗代碼解釋器功能,通過自然語言互動,實作對複雜資料和檔案的處理與分析,還可以生成圖表或檔案,能夠快速洞察資料中的特點、分析變化趨勢、為後續的決策提供高效和精準的支撐。

李彥宏說,大語言模型本身并不直接創造價值,基于大模型開發出來的AI應用才能滿足真實的市場需求,“這是百度根據過去一年的實踐,踩了無數的坑,交了高昂的學費換來的。”

(來源:極目新聞)

更多精彩資訊請在應用市場下載下傳“極目新聞”用戶端,未經授權請勿轉載,歡迎提供新聞線索,一經采納即付報酬。24小時報料熱線027-86777777。