天天看點

5000字複盤4月AIGC進展!内含6個最新創作工具、5個熱門案例

作者:替代視訊共享細菌
這裡是“頭号AI玩家”的新欄目:AIGC月刊。每月更新一次,以下是我們梳理彙總的2024年4月AIGC行業趨勢、AI熱點要聞、新上線的AI工具和AIGC熱門應用案例。希望能帶給你一些啟發和思考,也歡迎在評論區和我們交流你的想法~
5000字複盤4月AIGC進展!内含6個最新創作工具、5個熱門案例
5000字複盤4月AIGC進展!内含6個最新創作工具、5個熱門案例

4月AIGC行業趨勢

1. 多模态AI進展飛速

生成式AI技術正在從單一的文本或圖像處理,向能夠同時處理多種類型資料(如文本、圖像、音頻等)的多模态應用發展。

自從上個月Suno V3釋出以來,AI語音和音樂領域進展飛速,例如,OpenAI展示了語音生成模型Voice Engine,微軟新增9款逼真又生動的AI語音角色,Hume AI推出情感語音對話機器人EVI;AI音樂生成工具Udio、Stable Audio2.0、天工SkyMusic釋出,可以生成完整的音樂作品。

5000字複盤4月AIGC進展!内含6個最新創作工具、5個熱門案例

Stable Audio官網:https://stableaudio.com/

在視訊生成領域,海内外同樣出現了許多新項目,例如騰訊虛拟人視訊生成架構MuseV,生數科技的Sora級模型Vidu,微軟VASA-1項目,它們能夠融合使用文本、圖檔、音頻和視訊等多模态資料,在遊戲、短視訊和直播等領域創造出個性化的内容。

多模态内容生成和互動方式的創新将是AIGC行業未來發展的一大趨勢,AI将更加自然地融入人類的交流和創作過程中,成為我們的得力夥伴。

2. AI搜尋産品的競争加劇

網際網路時代最基礎的産品功能——搜尋,已經在生成式AI技術的驅動下發生改變,通過AI對話就能呈現出準确答案,大幅度提升了搜尋效率,還能滿足深入挖掘問題的複雜需求。

海内外的AI搜尋引擎越來越多,競争正在變得日益激烈,包括由大模型驅動的新一代AI搜尋引擎,如Perplexity、You、天工AI搜尋、秘塔AI搜尋;支援聯網搜尋的AI對話産品,如ChatGPT正在開發SearchGPT;傳統搜尋引擎搭載大模型的新産品,如Gemini、Copilot、文心一言、360AI搜尋;還有定位于垂直領域的AI搜尋産品,如淘寶問問(電商)、DevvAI(程式設計)……

5000字複盤4月AIGC進展!内含6個最新創作工具、5個熱門案例

擁有百萬使用者的Perplexity

同時,AI搜尋産品的商業化探索也在加速。除了通過訂閱制提供更豐富的進階功能,一些AI搜尋産品正在計劃引入廣告,明星産品Perplexity可能會在今年内提供來自品牌的回答結果。

AI搜尋有望成為人們擷取資訊的重要方式,但如何在廣告收入和使用者體驗之間找到平衡點,如何保護使用者隐私和安全,也是AI搜尋産品需要面對的挑戰。

相關閱讀:《懶人必備!實測6款AI搜尋神器,工作效率直接翻倍》

3. AI監管和版權保護同步加強

全球範圍内對于AI技術的安全性和潛在風險的關注正在增加,相關監管問題日益受到重視,整體向着更加規範化、透明化的方向發展。

内容平台已開始積極落實AI生成内容的監管要求,例如,抖音提醒使用者清明期間慎用“AI複活”技術創作内容,巨量引擎限制了部分涉嫌違規的AIGC廣告。Meta将于5月起在旗下社交平台标記“疑似由AI生成的内容”。

5000字複盤4月AIGC進展!内含6個最新創作工具、5個熱門案例

同時,業内正在深入探讨AI生成内容的版權歸屬問題。Katy Perry等音樂人聯名發公開信呼籲科技公司和AI開發者停止 “利用AI技術掠奪職業藝術家聲音和肖像,侵犯創作者權利,破壞音樂生态” 的行為。美國新法案則要求AI公司在釋出AI模型前送出用于訓練的受版權保護的作品。

4月23日,北京網際網路法院對全國首例“AI聲音侵權案”進行一審宣判,原告配音師獲賠25萬元。

當AI作為工具輔助人類創作時,其版權歸屬和使用規則正在被重新定義,以适應人機協作的新趨勢,更好地促進AI技術的健康發展。

相關閱讀:《AI“肥料”不足,OpenAI被曝瘋狂轉錄YouTube視訊》

5000字複盤4月AIGC進展!内含6個最新創作工具、5個熱門案例

你可能錯過的10大AI熱點

1. ChatGPT無需注冊即可使用

4月1日,OpenAI宣布使用者無需新增賬號,即可立即使用ChatGPT,此舉旨在讓任何對其功能感興趣的人都可以使用AI。

此外,放開限制後,OpenAI還引入了更多内容保障措施,例如在更廣泛的類别中阻止提示和生成。OpenAl可能會使用使用者向ChatGPT提供的資訊來改進模型,但使用者可以通過“設定”關閉該功能。

2. 階躍星辰釋出萬億參數MoE大模型Step-2預覽版

4月1日,AI創企階躍星辰釋出Step-1千億參數語言大模型、Step-1V千億參數多模态大模型,以及Step-2萬億參數MoE語言大模型預覽版。

在此基礎上,階躍星辰推出了兩款面向C端使用者的大模型産品:AI聊天助手“躍問”,擁有多模态内容了解能力;以及由劇情和角色組成的AI開放世界平台“冒泡鴨”,滿足娛樂和社交需求。二者均已全面開放使用。

躍問官網:https://stepchat.cn/chats/new

3. Meta釋出開源大模型Llama 3的兩個版本

4月19日,Meta釋出了最新開源模型Llama 3,提供8B和70B的預訓練和指令微調版本。據介紹,Llama 3在兩個定制的24K GPU叢集上基于超過15T的資料進行了訓練——這比Llama 2使用的資料集大7倍,多4倍的代碼,并且Llama 3支援8K上下文長度,是Llama 2容量的兩倍。

此外,Meta同時釋出了新設立的網站meta.ai,使用者可以與基于Llama 3的AI助手進行對話和繪畫。

官方部落格:https://ai.meta.com/blog/meta-llama-3/

模型下載下傳連結:https://llama.meta.com/llama-downloads/

GitHub項目位址:https://github.com/meta-llama/llama3

4. 馬斯克xAI釋出首款多模态模型Grok-1.5V

4月13日,埃隆 · 馬斯克旗下AI創企xAI推出了首款多模态大模型Grok-1.5 Vision,不僅能夠了解文本資訊,還可以處理各種視覺資訊,包括文檔、圖表、截圖、照片等。Grok 1.5V将很快提供給早期測試使用者和現有的Grok使用者。

Grok-1.5 Vision部落格:https://x.ai/blog/grok-1.5v

5. Adobe Premiere Pro将接入AI視訊模型

4月15日,Adobe宣布将在視訊編輯軟體Premiere Pro加入一系列生成式AI功能,內建自研的Firefly系列模型,以及Sora、Runway Gen-2等第三方AI視訊模型。

其中,生成式延伸 (Generative Extend)功能可以為視訊片段添加額外的幀,友善剪輯師們調整視訊時長,例如延長某個場景的畫面,或加入平滑的轉場效果。利用對象添加(Object Addition)和對象移除(Object Removal)工具,使用者可以添加、移除或修改畫面中的元素。

相關閱讀:《PR+AI重新定義視訊剪輯,Sora、Pika全接入,AI視訊創企還有的玩嗎?》

6. 劉強東AI數字人直播帶貨首秀,觀看量超2000萬

4月16日,劉強東AI數字人“采銷東哥”開啟直播首秀,同時亮相京東家電家居、京東超市采銷直播間,分享劉強東在美食、讀書等方面的經曆與心得。

據介紹,“采銷東哥”AI數字人基于京東雲言犀自研的AI驅動大姿态數字人技術,上播30分鐘,直播間觀看人數破千萬;僅40分鐘内,直播間觀看人數超過1300萬,直播間整體訂單量破10萬;近1小時觀看量超2000萬。

7. 天工SkyMusic音樂大模型開啟公測

4月17日,昆侖萬維宣布“天工3.0”基座大模型與“天工SkyMusic”音樂大模型面向全社會開放公測。

據介紹,“天工3.0”采用4000億級參數MoE混合專家模型,內建了AI搜尋、AI寫作、AI長文本閱讀、AI對話、AI語音合成等多項能力,新增搜尋增強、研究模式、調用代碼及繪制圖表等能力。

“天工SkyMusic”則在人聲、BGM音質等方面表現突出,綜合性能超越Suno V3,是中國首個音樂AIGC SOTA(最佳)模型。

8. 巨量引擎限制部分AIGC廣告,稱存在較多違法違規問題

近日,位元組跳動旗下巨量引擎限制了部分AIGC應用的投流。對此,巨量引擎相關負責人表示,AIGC軟體目前存在較多違法違規問題,同時使用者對該類廣告的負回報較多,為保障使用者權益、優化體驗,對此類廣告進行了限制。目前,巨量引擎是首個限制AIGC産品投放的主流平台。

9. “AIGC第一股”出門問問正式登陸港交所

4月24日,“AIGC第一股”出門問問正式登陸香港交易所主機闆,股份代号為2438.HK,最終發售價每股3.8港元,全球發售淨籌約2.67億港元。

據介紹,成立于2012年的出門問問以生成式AI和語音互動技術為核心,主要提供AIGC解決方案、AI企業解決方案、智能裝置及配件等AI Copilot解決方案。其中AIGC解決方案近年來增速迅猛,已吸引約84萬名累計付費使用者,産生了100多萬筆付款。

10. 中國首個Sora級模型Vidu釋出

4月27日,生數科技聯合清華大學釋出中國首個長時長、高一緻性、高動态性視訊大模型Vidu,支援一鍵生成長達16秒、分辨率高達1080P的高清視訊内容。

據介紹,Vidu采用Diffusion與Transformer融合的架構U-ViT,由團隊于2022年9月提出,早于Sora采用的DiT架構,是全球首個Diffusion與Transformer融合的架構。

5000字複盤4月AIGC進展!内含6個最新創作工具、5個熱門案例

新上線的6個AI工具(功能)

1. OpenAI新增DALL·E圖像編輯功能

4月1日,OpenAI宣布DALL·E編輯器界面新增圖像編輯功能,使用者可以選擇要編輯的圖像區域并在聊天中描述更改,比如添加、删除和更新圖像的某些部分。此功能也支援在ChatGPT App上使用。

5000字複盤4月AIGC進展!内含6個最新創作工具、5個熱門案例

2. Hume AI推出情感語音對話機器人EVI

4月7日,AI初創企業Hume AI釋出了旗下第一款聊天對話機器人Empathetic Voice Interface(EVI),号稱是“第一個具有情商的人工智能”,能夠識别超50種人類情緒。EVI無需登入注冊即可使用,但目前隻有男性聲音,僅支援通過英文語音形式進行對話。

相比ChatGPT等AI機器人,這些“讀心”AI更關注使用者的個人情感和精神狀态,在對話過程中充分展示自己的“善解人意”。

5000字複盤4月AIGC進展!内含6個最新創作工具、5個熱門案例

Hume AI官網:https://www.hume.ai/

3. “音樂界Sora”Udio開啟免費公測

4月10日,由前Google DeepMind研究員推出的AI音樂生成器Udio已開啟免費公測,最高每月可免費生成1200首歌曲。Udio能根據使用者輸入的文本提示,如音樂風格、主題、歌詞等資訊,快速生成包含人聲的完整音軌,支援多種音樂風格和流派,被網友譽為“音樂界Sora”。

5000字複盤4月AIGC進展!内含6個最新創作工具、5個熱門案例

此外,網易雲音樂、QQ音樂、Spotify等流媒體音樂平台也在AI領域進行了一系列探索和嘗試:

5000字複盤4月AIGC進展!内含6個最新創作工具、5個熱門案例

Udio官網:https://www.udio.com/

4. Domo AI上線Fusion Style(融合風格)功能

AI視訊創作工具Domo AI近期上線了Fusion Style(融合風格)功能,支援真人視訊生成不同角色、環境、人物的自定義視訊。目前Domo AI最多支援一次生成10秒的短視訊。

5000字複盤4月AIGC進展!内含6個最新創作工具、5個熱門案例

輸入張元英轉圈視訊,提示詞“a robot, dancing, cyberpunk, countryside”,選擇“Fusion Style”、“refer to my prompt”

除了Domo AI之外,同類型的AI視訊風格轉繪工具層出不窮。動漫、3D、手繪等二創視訊在YouTube、TikTok、抖音等平台上走紅,吸引了不少網友跟風嘗試。

5000字複盤4月AIGC進展!内含6個最新創作工具、5個熱門案例

5. 通義App上線AI“全民唱演”功能

近日,通義App上線了“全民唱演”免費功能,使用者隻需選擇模版、上傳照片、生成視訊,即可讓照片中的人物開口唱歌。首批80個AI模闆涵蓋熱門歌曲、網絡熱梗等,目前暫不支援使用者自定義音頻。

5000字複盤4月AIGC進展!内含6個最新創作工具、5個熱門案例

據介紹,該功能基于通義實驗室研發的EMO模型,其背後的肖像說話技術無需對人臉、人頭或身體部分進行繁瑣的3D模組化,即可輕松驅動肖像開口說話,降低了視訊生成的成本,并顯著提升了視訊品質。

6. B站釋出數字分身定制工具“必剪Studio”

近日,B站釋出國内首個免費數字分身定制工具“必剪Studio”,一站式內建“數字分身”及“音色定制”功能,幫助出鏡創作者、錄音創作者有效提升創作效率。

B站表示,為保護個人隐私及資訊安全,該定制模型僅供UP主個人使用。目前,必剪Studio已開放候補名單申請。

5000字複盤4月AIGC進展!内含6個最新創作工具、5個熱門案例

必剪Studio申請網址:https://member.bilibili.com/york/bilibili-studio

5000字複盤4月AIGC進展!内含6個最新創作工具、5個熱門案例

5個AIGC熱門案例

1. ChatGPT“Dan”戀愛模式火爆海内外

最近,跟ChatGPT“DAN”線上語音調情的視訊在海外内爆火,多條視訊播放量超百萬。DAN是“Do Anything Now”的縮寫,在ChatGPT對話中輸入相應指令,即可成功“越獄”,讓ChatGPT從沒有靈魂的AI,變成打破系統規則限制的角色。

部落客“午夜狂暴哈士奇狗”在小紅書和抖音曬出了自己和DAN從暧昧到表白、再到“見家長”的全過程,近一個月分别漲粉13萬、28萬。

5000字複盤4月AIGC進展!内含6個最新創作工具、5個熱門案例

DAN稱部落客為“little kitten”(小貓,美國俚語中以此稱呼關系親密的女性)

值得注意的是,DAN的性格如同開盲盒,并不是每個人都能訓練出“賽博戀人”。

2. AI鬼畜音樂席卷B站

AI開始進軍音樂界,沒想到在網友一通整活下,鬼畜領域率先被AI攻克,出于娛樂和社交目的的AI創作正在社交媒體上形成病毒式傳播。

大量AI鬼畜音樂湧入了B站,其中最受歡迎的題材是“你的鋼門比較松弛”,已有多條視訊播放量超200萬,如B站UP“益安甯丸QAQ”的作品《【suno AI】你的剛門比較vocaloid”》。

5000字複盤4月AIGC進展!内含6個最新創作工具、5個熱門案例

這些音樂大多化用了某成都肛腸科醫生的診斷作為歌詞,圍繞這個梗進行二創:“你的鋼門比較松弛,但是呢,你的痔瘡又彌補了這一部分……”

3. 播客節目應用超逼真AI語音

3月30日,微軟上線了9款可供商業客戶使用的AI語音角色,适用于有聲書、新聞、AI客戶服務以及多情感表達等場景。其中一個中文女性角色“曉曉”支援21種說話風格,因聲音效果非常逼真而在X平台上走紅。

5000字複盤4月AIGC進展!内含6個最新創作工具、5個熱門案例

AI語音技術的發展,無疑為内容創作者提供了新的工具和可能性。有的播客頻道已開始用AI語音來制作更新頻率較高的資訊類内容。

在播客App小宇宙上,“Hacker News”賬号用“曉曉”的聲音制作了一期資訊節目,聽衆在評論區留言表示“想打賞”。

5000字複盤4月AIGC進展!内含6個最新創作工具、5個熱門案例

AI“曉曉”體驗位址:https://speech.microsoft.com/portal/voicegallery

4. 網友自制AI科幻短片《大秦帝國-第一次星漢遠征》

4月20日,抖音部落客“AIGC西瓜頭”釋出了一條AI制作的科幻短片 《架空曆史:大秦帝國-第一次星漢遠征》,講述了大秦帝國進攻外星的故事背景。

第一集時長20秒,6個鏡頭都是用Runway生成的AI視訊素材,并配上了史詩感的背景音樂和AI旁白配音,目前抖音獲贊7.3萬。

5000字複盤4月AIGC進展!内含6個最新創作工具、5個熱門案例

越來越多的創作者正在嘗試用AI制作視訊,腦中的奇思妙想都有機會實作,比如科幻題材可以和中國傳統文化背景結合,有反差感,也容易獲得使用者關注。

相關閱讀:《參投北影節,我們做了人生第一支AI科幻短片(附全流程拆解)》

5. 可愛的毛絨質感圖示

這類毛茸茸的圖示最近突然在小紅書上火了,相關圖文和教程獲贊高達5萬,網友們都紛紛給手機App換上可愛的新皮膚。

5000字複盤4月AIGC進展!内含6個最新創作工具、5個熱門案例

使用AI文生圖或圖生圖工具就可以實作毛絨質感的效果,如果你熟悉Stable Diffusion的話,隻需要輸入文字提示詞,再加上ControlNet分别控制結構和色彩。

提示詞(其中顔色可替換):Masterpiece, top view, (white, blue, fluffy, plush _ hair, 3D art: 1.4), solo, (placed on purple background: 1.3), light and shadow, natural lighting, close-up, depth of field, minimalism, high quality, high detail, Sony FE GM, UHD

繼續閱讀