阿裡大模型讓照片跳舞，朋友圈掀起鬥舞潮

作者：貴州交通廣播 2024-01-04 13:54:00

隻要一張照片就能生成一段舞蹈視訊，又一個大模型應用出圈！

2024年第一個工作日開始，兵馬俑、馬斯克以及各地網友跳科目三和網紅舞的視訊就陸續在國内社交媒體和朋友圈刷屏。這些大約10秒左右的視訊都不是真人出鏡，均由大模型生成，這種低門檻的「跳舞」方式引發了網友的廣泛體驗，掀起了一波鬥舞潮。各路網友金句頻出：AI治愈了我的四肢不協調、科目三的風吹到了考古界、再也不用擔心跳科目三崴腳……

這是阿裡雲通義千問APP上線的免費功能，在通義千問APP内輸入“通義舞王”、“全民舞王”等密碼後，即可進入體驗頁面。使用者按照提示要求上傳照片後，十幾分鐘即可生成神形兼備的舞蹈視訊，生成的視訊能較好地保留原形象的面部表情、身材比例、服裝以及背景等特征。目前，通義千問首批為使用者提供了科目三、蒙古舞、劃槳步、鬼步舞等12種熱門舞蹈模闆。

據悉，該功能背後的算法為阿裡通義實驗室自研視訊生成模型Animate Anyone。早在11月底，該研究便在推特、Youtube等海外社交媒體平台爆火，相關視訊播放量超1億，項目在Github上的Star短短數日就超過1萬，是近期大模型領域最受歡迎的大模型算法之一，國外開發者和網友集體稱贊該算法效果，并發出“開放體驗入口”的呼聲。

除了驚豔的生成效果之外，該算法的技術路線也被廣泛關注。視訊生成是大模型領域最熱門的研究方向之一，谷歌、Meta、Runway等國外科技公司都在積極布局，但一直以來，人物形象的視訊生成面臨諸多技術挑戰，例如人物形象一緻、動作流暢可控、時序無瑕疵的人物動作視訊。

根據公開論文顯示，Animate Anyone內建了多項創新技術，引入了ReferenceNet，用于捕捉和保留原圖像資訊，可高度還原人物、表情及服裝細節；此外，該算法使用了高效的Pose Guider姿态引導器，保證了動作的精準可控；另外，通過時序生成子產品，有效保證視訊幀間的連貫流暢性。在相同資料集的測試下，Animate Anyone的性能表現顯著優于國内外同類模型。

今年9月，通義千問成國内首批通過備案的大模型，通義千問APP上線後功能持續更新，目前可提供文本對話、語音對話、翻譯、PPT大綱助手、小紅書文案、視訊生成等幾十項功能。

阿裡大模型讓照片跳舞，朋友圈掀起鬥舞潮

繼續閱讀

錯失億萬富翁機會？俞敏洪：當年若助馬雲，如今或成阿裡幕後大佬

被查出懷孕那天，男友在陪小青梅産檢。我氣的把照片砸向他的臉

劉濤黑曆史被扒出, 某女星公開指責她技術很好, 為上位不惜

台媒曝王力宏不雅照片，範玮琪徐若瑄都參與其中，玩的真花？

亞洲杯，混血門将補時撲點，日本2奪冠軍創曆史，笑傲江湖！解析

布倫森季後賽前5場出手148次居曆史11，得172分，前10

34-33！佛爺傳奇21年：超越伯納烏，皇馬曆史第1，冠軍之王

看了這些照片才知道，時間是多麼可怕的力量，驚呆了！

尤伯杯勇奪第八亞！印尼雖敗猶榮仍創曆史！何冰嬌逆轉助國羽問鼎

NBA少幫主，愛德華茲打破76年曆史紀錄，23歲要成聯盟門面

清朝無疑是當今廣大群眾十分了解和關注的古代王朝，其終結标志着中國長達兩千餘年的封建時代的落幕，揭開了中國嶄新輝煌的篇章。

創曆史！熱議愛德華茲43分，諾維茨基盛贊，蘇群：頗有幫主風範

其實光頭還蠻可憐的，為了證明他寶刀不老，演唱會上的他，又扭又跳，而且拍出來的每張照片，都戴着超大墨鏡，生怕别人看出他額頭

罕見老照片：男女混合脫衣舞俱樂部，真是讓人大開眼界

韻達年營收450億：同比降5% 淨利16億，阿裡成第三大股東

圓通年營收577億：淨利37.2億同比降5% 阿裡是二股東