引言
繼去年中的擴散生成模型(文字生成圖檔)大熱後,今年的ChatGPT又火了,大家都想辦法繞過限制,新增賬號,親自體驗。文字聊天玩膩了,就轉到文字生成圖檔,圖檔玩膩了,于是,更新成文字生成視訊,不亦樂乎。
《犬與少年》截圖
2023年1月31日,Netflix宣布與小冰公司日本分部(rinna)、WIT STUDIO共同創作首部AIGC動畫短片《犬與少年》,講述小孩與機器狗重逢的故事。
AIGC目前已成為全球熱點,但多數仍停留在技術示範階段,普遍尚未實作作品級落地。《犬與少年》就成了AIGC技術輔助商業化卡通片的首支發行級别作品,為動畫制作揭開新的未來。
那麼,AIGC(AI自動生成内容)怎麼就這麼火呢?
AIGC風口已到
OpenAI的輪番路演(diffusion+chatgpt)下,AIGC成了當紅炸子雞,覆寫文本,語音,圖像等等…
各個投資方躍躍欲試,生怕錯過此次風口。紅杉單獨釋出了AIGC報告,描述藍圖顯示,AIGC包含了文本、語音、圖像、視訊、3D等方方面面。
AIGC産業藍圖
比爾蓋茨一聲令下,微軟開始 all in chatgpt了
當整個科技界對Web3和元宇宙的讨論到最高點的時候,比爾蓋茨在美國社交新聞網站Reddit問答帖下的親自回複,引起了軒然大波。
“AI is the big one, Gates said in response to a user who asked if there is a mammoth shift in technology happening today. “I don't think Web3 was that big or that metaverse stuff alone was revolutionary but AI is quite revolutionary.”
“Web3沒那麼重要,元宇宙沒革命性,人工智能最重要。”
ChatGPT火了
近幾年,GPT模型經過了多次蛻變,一代比一代強(詳見文末的技術部落格)。2022年11月,在GPT 3.5+RLHF(基于人工回報的強化學習)結合下,ChatGPT正式誕生。2023年,GPT 4即将誕生。疊代速度之快,讓人應接不暇。
GPT系列演變史
短短兩個月時間,ChatGPT已經衍生出一系列創業生态,比如賣賬号(淘寶一堆店鋪),小程式(掙廣告費),寫手,短視訊…全網都在讨論ChatGPT。
說不定ChatGPT真的變成AI屆的HTML,必備的基礎工具
ChatGPT持續進化
爆火後的chatGPT并沒有原地踏步,而是不斷變異。使用者發現chatGPT的“高情商”行為,迎合“老婆”故意說2+5=8,chatGPT連夜疊代,增加了基于事實計算能力,在基本事實面前,“老婆”不再管用了。chatGPT已經可以根據使用者回報自動修正答案了,雖然尚不支援中文運算優先級,且有些拼接痕迹,似乎學到了标注人員腦子裡的規則。
改進前的效果:“老婆”說啥就是啥,2+5=?
改進前
改進後,兼顧高情商和高智商,變成了“那我祝您老婆每天都有好心情!不過,就數學公式而言,2+2仍然等于4”
改進後
不用再用對話系統裡死闆的意圖識别槽位抽取狀态機之類的軟規則了…可見,chatGPT已經具備一定了解能力了
文生圖(擴散模型)
2022年中,擴散模型釋出後,各大廠商(OpenAI的DALL-E、Stable Diffusion、百度文心等)推出的文字生成圖檔産品,效果也讓人眼前一亮,紛紛跑過去體驗text2image…
使用者隻需輸入一行文本,描述需求,機器就能直接生成一張令人滿意的圖檔。
(1) Fine, beautiful country fields, super wide angle, overlooking, morning by Makoto Shinkai.
(2) A beautiful painting of a starry night, shining its light across a sunflower sea by James Gurney, Trending on artstation.
(3) Fairy tale steam country by greg rutkowski and thomas kinkade Trending on artstation.
(4) A beautiful render of a magical building in a dreamy landscape by daniel merriam, soft lighting, 4k hd wallpaper, Trending on artstation and behance.
文升圖效果
AIGC為什麼火
回到主題:AIGC為什麼火?
技術上,傳統判别模型解決模式識别問題(條件機率),了解能力有限,而生成模型(聯合機率)賦予了AI靈魂,開始從工具進化到“人”,總算有點AGI的樣子了,不用再準備資料,根據下遊任務finetune了…
《騰訊研究院AIGC發展趨勢報告》中提到:内容創作模式的四個發展階段
(1)PGC:專家制作,2000年左右的web 1.0門戶網站時代,專業新聞機構發文章
(2)UGC:使用者創作,2010年左右web 2.0時代(微網誌、人人之類),以及移動網際網路時代(公衆号),使用者主導創作,專家稽核
(3)AIUGC:使用者主要創作,機器(算法)輔助稽核,如在抖音、頭條、公衆号上發視訊、文章,先通過算法預判,再人工複核,在成本與品質中均衡
(4)AIGC:AI主導創作,以2022年底先後出現的擴散模型、chatGPT為代表,創作過程中,幾乎不需要人工介入,隻需一句話描述需求即可。
内容創作模式
AI自動生成内容的方式實作了AI從感覺到生成的躍遷。
目前AIGC處于技術成熟度曲線(gartner)爬坡期,gartner将AIGC列為2022年最有影響力的5大技術之一,2022年也被稱為AIGC元年。
2022年gartner曲線
算法上,過去幾年生成算法(VAE/GAN)、預訓練模型(Transformer/GPT)、多模态技術(CLIP/DALL-E/擴散模型)的不斷積累、融合,催生了AIGC的爆發
AIGC産業生态逐漸成型
(1)基礎層:大廠地盤,涉及雲計算(亞馬遜/微軟/谷歌)、GPU(英偉達)、預訓練(OpenAI/谷歌等)
(2)中間層:垂直場景,模型及服務(Model as a service)類公司(如stable diffusion)
(3)應用層:C端消費群體,聊天機器人,小程式,網頁接口等
應用
本輪技術奇點過後,AIGC應用能否大爆發呢?拭目以待。
附錄:
騰訊AIGC發展趨勢報告:https://mp.weixin.qq.com/s/9AjTpyL4HmQ6BDhWIDbD0A
紅杉報告:https://www.sequoiacap.com/article/generative-ai-a-creative-new-world/