大火的AI擴圖,為何被網友直呼“離譜”?
中新經緯12月10日電 (林琬斯)近日,AI擴圖火爆出圈,抖音話題“AI擴圖”累積9.2億次播放量,“AI擴得很好下次别擴了”的話題在抖音超7.7億次播放。
不少網友也在社交平台分享了自己擴圖後的照片,有人稱“拯救了我的廢片”,也有人直呼“别太離譜”“根本不管人的死活”“AI比人還癫”。目前,AI擴圖的市場熱度還在發酵,吸引了網際網路巨頭及一些上市公司布局。
頻出意外,原因何在?
AI擴圖,是将一張照片按照等比例或者自由角度擴充,AI會根據圖像内容,預測和補充擴充出來的部分。
目前AI擴圖的用法,一種是單張圖擴圖,另一種是用一張圖檔,不停擴圖。
對比擴充前後兩張圖檔可以發現,部分需要擴大背景範圍的照片出圖效果較為合理,但當原圖出現額外元素需要補充完整時,AI很難根據細節,想象出相應的人、物形象,比例和位置也不太準确。
在網友上傳的部分作品裡,AI擴圖直接給人修改了物種:對于拍照不露臉的人長啥樣,AI擴圖幫你揭曉:“人模狗樣”;一女子身着卡其色外套拍照,AI擴圖直接将上半身“嫁接”到同色木質栅欄上。更有照片AI擴圖後出現不可描述的内容,令網友直呼“毀三觀”。

網友上傳自己的半身照,AI直接将其變鳥人。圖檔來源:社交媒體
這“臉牌”看着詭異。圖檔來源:社交媒體
一位爸爸親吻媽媽的孕肚,AI擴圖将孕肚當臉用。圖檔來源:社交媒體
AI:我是懂脫單許願的。圖檔來源:社交媒體
另一種用法是用一張圖檔,不停擴圖。根據網友在社交平台上分享的經驗,到最後會變成列車、飛機,變成城市、森林的一角。
一些影視經典名場面也“慘遭毒手”,如甄嬛傳中表情嚴肅,正在回宮路上的甄嬛,擴圖後身穿運動服與運動鞋在深宮中打籃球;第一次AI擴圖,躺在枕頭上的皇上出現孕肚,再次擴圖後,AI給皇上加了腿又加了行李箱,故事更新成“孕期離家出走”。
實際上,走紅的AI擴圖,是AIGC(生成式人工智能)領域促生的衆多熱門賽道之一。針對擴圖後出現意料之外的情況,矽基智能CTO林會傑在接受中新經緯采訪時指出,這與AIGC算法仍未發展成熟,無法做到精準控制生成的圖檔内容有關。
林會傑認為,AI擴圖與AI文生圖技術同源,AI文生圖需要通過語義資訊的輸入才能生成圖檔,文字描述本身相對泛化,很難精準控制AI呈現的内容,而AI了解的内容也很難精準呈現人類的想法,不像人類繪圖一樣精準。AI擴圖在原有圖檔的基礎上擴充一些圖檔資訊,本質上與AI文生圖的技術原理類似。
多家廠商布局AI擴圖
實際上,AI擴圖并不是新鮮事物。中新經緯不完全統計,目前包括Midjourney、StabilityAI、Adobe、美圖秀秀、Wink等已試水相關應用産品和場景,涉足AI擴圖領域。
今年3月,Adobe釋出AI創意生成工具Firefly,并于5月底宣布全面開放。其中就有一鍵擴充現有照片和圖像的功能。今年7月,Midjourney更新了“平移擴圖”功能,可以将圖檔自由前後平移。
7月中旬,港股上市公司美圖公司旗下産品美圖秀秀上線AI擴圖功能。目前在美圖秀秀APP首頁仍有AI擴圖的入口,每人每天有3次免費機會,可對圖像進行110%、125%、150%、200%、300%不同比例的擴圖。
另外,AI擴圖在B端的應用還包括營銷海報設計、電商圖檔制作、遊戲素材設計等。
不過目前,一些個人創作者開發的AI擴圖小程式和網站并不多見。中新經緯在微信内進行搜尋,以“XXAI擴圖”命名的微信公衆号、小程式并不多,其中不少也并非免費使用。
下一個熱點在哪?
實際上,就在2022年年底,AIGC另一賽道AI繪畫成為社交平台上的流量密碼,也被衆多網友吐槽“多少有點離譜在身上”。
今年7月,妙鴨相機走紅,使用者選擇20張以上照片,支付9.9元,再選擇喜歡的模闆,就能生成自己的“數字分身”,效果堪比市場價幾十元甚至幾百元的藝術照。
發展至今,AIGC下一個熱點在哪?
林會傑指出,AIGC技術未來将更多地往視訊領域發展。他表示,視訊才是使用最普遍、使用者接受程度最高、想象力最豐富的應用場景,遠大于圖檔的表現力、互動性與想象力。相比圖檔,視訊更能将内容進行高次元呈現。
實際上,今年爆火的AIGC還有圖檔生成視訊。
近日,阿裡推出了Animate Anyone,該項目由阿裡巴巴智能計算研究院開發,使用者隻需提供一個靜态的角色圖像和一些動作、姿勢,便可将其動畫化,同時保留角色的細節特征。
11月中旬,社交媒體巨頭Meta釋出工具Emu Video,能夠基于文本和圖像輸入生成視訊剪輯;位元組跳動發了PixelDance模型,通過描述(純文字)+首幀指導(圖檔)+尾幀指導(圖檔),即可生成包含複雜場景和動作的視訊。
另外,Runway在Gen2中上線Motion Brush動态筆刷功能,隻需對着圖像任意位置一刷,就能讓靜止的一切物體動起來;Stability推出Stable Video Diffusion,可以從圖像中生成高品質的視訊剪輯。
另外,數字人方向也是AIGC技術發展和應用方向,數字人技術能夠結合AI生成的形象應用于視訊場景。
10月,明星跨語言翻譯視訊在全網瘋傳,視訊中郭德綱飙英文、歌手泰勒•斯威夫特用流利的中文接受采訪,不僅音色與本人相似,甚至連口型都能對上,這讓不少人表示“配音演員要失業了”。在今年6月的上海電影節期間,矽基智能成功“複活”已逝的人,讓已故導演謝晉通過數字人的形式和現場觀衆見面。
(文中觀點僅供參考,不構成投資建議,投資有風險,入市需謹慎。)
中新經緯版權所有,未經書面授權,任何機關及個人不得轉載、摘編或以其它方式使用。
責任編輯:羅琨 常濤