01:AI大抽象時代
AI視訊已經發展到了讓人眼前一黑的階段了,隻要你看過下面這段視訊,你一定明白我在說什麼。
AI短短幾秒的改動,就把冷飯炒成了大糞
乍看前幾秒,你或許以為是2023年初走紅的昊京(本名“孫國帥”,曾擔任過吳京的替身)又在炒冷飯了,但現在的你,想必在跪求一雙沒看過它的眼睛。
創作者用了既在意料之外,又不在情理之中的方式,污染了人民群衆的眼睛,吳京看了都要報警的程度。
好消息,這是AI生成的,壞消息,類似的作品還有不少。
如果說,用AI視訊技術讓塵封已久的老照片活過來,是人文關懷極佳的一種應用方式,那近期網際網路上井噴的逆天AI視訊,就是打開了AI抽象時代的潘多拉魔盒。
再不阻止國産AI,它們就要逆天了!!!
當你打開短視訊的推送,從發現小貓吃面時的疑惑,到發現熊貓吃飯時的震驚、老虎吃火鍋時的無語、獅子跳舞時的無奈,不禁心想:“這手機爹又™給我幹哪兒來了?”
“視訊不能是P的,是以是真的”
這還隻是開胃小菜,随着像快手旗下的“可靈Kling”,以及位元組旗下的“即夢Dreamina”等國産大模型的入局,國産AI視訊的創作動力算是徹底釋放了。
過去隻能截圖加字做表情包的影視橋段,現在動動手指頭就能實作天馬行空的惡搞,還不用依仗PS和AE拼技術力。
是以你能看到戴墨鏡、吃拉面、接電話、戴耳機的爾康。
爾康成了“百變星君”,但耳機穿模了
也能觀賞到與紫薇相處愉快,生怕紫薇少吃一口餓死了的貼心容嬷嬷。
看得出來,吃到西瓜的時候,紫薇終于吃飽了
以往經典影視橋段中的一張截圖就能根據訓示詞變幻起來。
無論是甄嬛傳裡吃雪糕的鈕祜祿氏,還是啃着雞腿忘了罵毒婦的皇上、舉槍實體超度衆生的唐長老、用智能手機搖人捉妖的齊天大聖,都讓網友頓感中了賽博幻術。
随着網友腦洞的不斷突破,連正常曆史的時間線都能被AI篡改戲說。
被譽為“五學”的韓劇《第五共和國》,原本與正史符合的劇情——金載圭“除蟲射日”(刺殺樸正熙),但被網友用AI制作成了“樸正熙反殺刺客金部長”,讓經典“下克上”的傳統被完全逆轉。
高木正雄(樸正熙日語名)畢竟當過軍官,會用槍反殺很正常吧
随着更多AI抽象作品的出現,網友們的創造潛力徹底被釋放。
AI或許是最強大的生産力工具,但是在構思邪門内容這條賽道上,它永遠代替不了人類。
何況現在已經過了抛磚引玉的階段,直接實作了“人傳人”。
繼昊京打啵之後,各種雙人場景都難逃AI之手。
《殺破狼》中的正牌吳京已在AI的撺掇下與甄子丹熱吻上了
我們仍未知道,那天華強和瓜攤老闆到底發生了什麼事。
也無法解釋花無缺和小魚兒之間,到底是友情還是愛情。‘
不出意外,李雲龍Kiss楚雲飛的畫面很快就能看到,或許過不了幾日,微信群聊中就能出現各種同性/異性好友深情熱吻的惡搞視訊了。
有位B站up主“咪克菌” 1:1 還原了央視七套經典節目《緻富經》,給大陸鄉村振興的未來發展方向提供了新思路......
看看眼前這些活靈活現的恐龍,不僅長得可愛,經濟效益也高,通過大棚養殖恐龍,不少農民走向了脫貧緻富的道路......
相比起恐龍養殖,異形的馴化之路更具挑戰,但在大陸農民的持續攻堅下(僅僅損失了幾十位村民),馴化異形的壯舉最終還是實作了。
在AI鏡頭加持下,原本兇猛的異形、恐龍,一下子變得平易近人,大大提高了廣大養殖戶對于這些新物種的接受程度,為它們後續大範圍進入養殖場鋪平了道路,很好地把AI前沿技術和農牧業生産的實際應用結合了起來......
如果說以上AI惡搞都算是正常範疇内的抽象發揮,那像“天宮仙女版奧特曼”這種内容則能讓你徹底拜服在碳基生物創造力下,雲南毒蘑菇對于人類大腦的影響,畢竟還是太大了。
“笑口常開”
那麼在這場狂歡背後,國産大模型究竟是如何發力的?
02:風水輪流轉
自AI技術邁入公衆視野開始,國内整個AI圈子長期都有一種“沒有功勞也有苦勞”的尴尬感。
即使陸續推出了國産的“通用大語言模型”、“文生圖大語言模型”等對标産品,但在輿論與使用者感覺當中,國産AI就是一直被OpenAI碾壓,很多時候都被充當“人工智障”對待。
知名賤嘴"人工智障",A.K.A賽博出生(畜生)——評論羅伯特
尤其是當年“文心一言”剛上線時還不穩定,靠一張“魚香肉絲”的AI生圖對決同期的Midjourney和DALL·E,讓其形象在網友心中變得慘烈無比。
AI比網友還邪門的一集
而這波視訊生成AI的出現,完全逆轉了這一切。
倒反天罡了,現在輪到國外網友們求一個咱們的大模型賬号了。
沒手機号登入,直接求人幫忙生成
過去咱們沒海外信用卡買不了ChatGPT會員的窘迫,如今在老外苦求中國手機号碼的情景下反向重演了。
自今年6月份開始,以快手可靈“Kling”為代表的國産AI視訊大模型陸續上線,但一開始并沒有引起國内使用者的廣泛關注。
反倒是經過海外科技媒體與業内人士的多方測評後“出口轉内銷”,才将這些驚豔的生成視訊傳回國内,徹底掀起了排隊測試潮。
業内人士評價:“中國擁有了巨大優勢,懂的都懂”
雖說OpenAI在年初就用Sora的示範片段驚豔了全球,連央視台長都不禁驚呼“我們怎麼辦?”,但至今它還處于封閉内測狀态,隻有極少部分藝術家和業内人士能受邀使用。
畢竟對真實實體世界的了解與模拟,以及對超高精度畫面細節的刻畫需要耗費龐大的算力與資源,若是Sora按照這種生成标準一下子開放了,估計老黃的顯示卡都來不及生産。
光是皮膚紋理與墨鏡反光的細節就能管中窺豹
誠然,Sora示範片可以說是至今仍然是AI生成視訊的标杆,但大家畢竟用不上,遠水解不了近渴,以至于有些按耐不住的網友都在懷疑OpenAI有沒有在PPT畫餅。
同時像Luma和Runway等現有大模型,大家用久了都審美疲勞,想體驗下新貨。
而“可靈”與“即夢”等國産AI視訊大模型抓住了這個視窗期,一方面猛練模型效率,一方面親民定位,降低使用限制。
“可靈”生成的AI必修課——威爾·史密斯吃意面
它們現階段基礎功能均免費,“可靈”不限制使用次數,每次可生成10秒視訊,且最多可以擴充到長達2分鐘的30幀1080p視訊,在架構上,可靈采用的是跟 Sora 相同的 DiT (Diffusion Transformer)架構,用 Transformer 代替了傳統擴散模型中基于卷積網絡的 U-Net。
換句話說就是利用Transformer在處理和生成上的效率優勢,在拟合能力和參數容量間找到一個均衡點,最終提升整體訓練效率,搶跑了其他對手,率先交了卷。
Transformer模型,不僅保障了圖像生成品質,還具有更好的擴充性與計算效率。
“即夢”因算力限制要稍顯落後一點,在使用次數和生成時長上均有一定限制,但畢竟背靠的是位元組,估計很快也會迎來大更新。
靠着這些技術投入,它們都極大地降低了中國人使用AI生成視訊的門檻(像“可靈”即使在内測階段需要排隊,但開放力度已經算是半公測了),不用去外網也不用懂英文。
更重要的是,我們辛苦構思了視訊做出來,肯定不能自己看,這兩位直接是背靠快手和抖音兩個短視訊平台,AI視訊生成徹底産品化,一步到位打通了創意=>生産=>分享=>傳播的閉環。
快進到外公在群裡問你:“這李雲龍怎麼也用上智能機了?”
這股風潮現在已經蔓延到了B站和視訊号,說不定過不了多久,相親相愛一家人群聊中都會出現了AI視訊的身影,那時候才是長輩防騙的高風險期。
“文生視訊”、“圖生視訊”、“視訊續寫”作為三大功能,其中高頻使用的則是“圖檔生成視訊”的功能,因其背靠短視訊應用,娛樂場景更廣,相比于基于純文字生成,其前後更加連貫,畫面也更加穩定。
前面提到的抽象AI視訊大多數都是圖生視訊功能下的産物,部分以圖生視訊後拼接到原視訊當中的形式呈現。
是以,這次創作井噴并非偶然,因為抖音快手洞悉了OpenAI在商業化上的短闆(雖然Sam Altman短期不缺刀樂,但訓練大模型是真燒錢),讓國産大模型較早打通到短視訊平台的天然流量池,真正滿足了老百姓分享自己創意的需求,除了賺到了網絡熱度,還能反哺更多資料給AI。
況且本次國内大模型的實際效果不差,雖然比不過被稱為“工業級”的Sora,但大緻能和Luma、Runway等對手等量齊觀。
相比于文字大模型,公衆也對AI視訊大模型寬容得多,畢竟兩眼一黑的生成結果能被當做意外的笑料,是以這一輪基本沒有鋪天蓋地的“人工智障”批評。
老人、地鐵、吃手機
如果說抖音在試水AI上已經靠着豆包AI助手,以及宮崎駿電影濾鏡,名偵探柯南濾鏡等泛AI功能,逐漸讓使用者擁抱新技術,掀起過多輪網際網路話題,但這次是真沒想到,居然被視作“土鼈”的快手搶先一步。
因為這波照樣是快手擅長的“農村包圍城市”,而在全球的“百模大戰”中,咱們确實也需要自己的AI視訊大模型。
03:不止于抽象
在AI時代裡,一切變化都在瞬息間,後浪,前浪,難分你我。
在6月可靈風頭正盛的時候,Luma釋出最新的文生視訊模型 Dream Machine,向所有使用者免費開放使用,不僅增加了更為豐富的美學風格選項,還能快速生成5秒鐘的電影級視覺畫面;Runway則也釋出了最新的Gen-3,自信宣稱離“世界模型”又近了一步。
Runway Gen-3的官方示範畫面
在這樣的激烈競争下,如今“可靈Kling”在海外的風頭已經過去,但好在随着國内使用者的增多,更多作品與話題必将出現,一切才剛剛開始。
不過還是難言輕松,相比文字大模型,AI視訊大模型需要耗費更多的算力資源,以及對模型的次元要求也更高,是以在技術上,國産大模型們仍需在打出産品化差異競争的短暫紅利期内迎頭趕上。
這也不單單是關乎技術的競争,文化上同樣需要有适合中國人自己的AI視訊大模型,起碼要用足量的用中文網際網路資料喂出來,不要粗暴地被全球各種資料污染了。
Luma、Runway等模型裡的中國乃至亞洲素材不是太少,就是太刻闆印象,很多時候中國人動着動着人種都變了,要麼變歐美面孔,要麼就成了南美人,畢竟國外大模型喂的資料都太雜了。
國外測評者就曾評價,相比國外的一衆AI視訊大模型,中國大模型開發者更了解本土文化,大模型生成的内容也更能滿足本土使用者的需求。
就像很多使用者自己都發覺,可靈生成的視訊當中,人物吃東西的動作就非常流暢穩定,不知道快手背後用了多少個吃播老鐵的視訊資料,論吃還得看中國人。
是以,我們确實需要立足于本國文化背景的大模型存在,這既能提升模型對于國内使用者需求的準确響應度,更能推動中式AI藝術創作的發展。
近年來湧現出了一大批中國特色的熱門AI作品,它們立足本國文化特色,借助AI實作了更多幻想中才有的場景,讓人有一種脫離了現實,但又感覺就在身旁的熟悉感。
在這些作品中,我們能看見熟悉的鄉土村莊中,村民們飼養起了西方經典科幻電影中的“異形”,用《緻富經》的方式解構了“太空恐怖”,異形都變成了“老鄉”。
“哥倆兒生異形啊(生意行啊)” 作者:咪克菌
這種奇異但毫無違和感的搭配,甚至展現在了村民用異形強酸唾液中和鹽堿地的别樣幽默當中。
往更靈更玄方向發展的創作也數不勝數,借鑒《山海經》中的“白澤”創造出了一種隻可意會不可言傳的中式幽寂感,“怪”卻透露着甯靜。(雖然AI粗暴地識别成白馬了)
【新中式志怪】後室白澤 作者:海院業二
借鑒“怪核夢核”元素打造出的“新中式夢核”,營造出一種回憶中泛黃的熟悉感,看似靈異的畫面,卻是國人才會有共鳴的生活記憶元素,最終形成一種“溫馨的疏離感”。
【新中式夢核】魚葬-老家的習俗 作者:海院業二
更不要說衆多把家裡老照片拿出來AI加工,重溫過去溫情時刻的網友作品了。
無論是AI抽象視訊,還是以AI為筆的奇思妙想,都展現出了國人在AI藝術創作上的輸出能力,起碼是中國特有的影像創作,終于不再是大模型官網上的視覺示範片了。
一時技術上追不上TOP1,但起碼把技術搬下台來,讓大家好好用用,AI終究是拿來當工具的,而不是用于看别人精彩的萬花筒。
雖說以往抵制AI生成内容的反對聲依然存在,但随着AI視訊的普及,人們會越來越高頻的使用這一工具,無論是提升生産力還是圖一樂呵。
時代浪潮之下,開發者和創作者們都需要不斷調整的自己的定位與角色,而這一輪井噴,也算是讓國人更好地擁抱與使用AI技術。
仿生人能不能夢見電子羊,當下尚不可知,但AI猴哥已經放下金箍棒用上機關槍了。