阿裡達摩院上線文本生成視訊大模型：僅支援英文輸入，已開放試玩

作者：IT之家 2023-03-22 17:02:00

IT之家 3 月 22 日消息，近日，阿裡達摩院已在 AI 模型社群“魔搭”ModelScope 上線了“文本生成視訊大模型”。

根據官方介紹，目前文本生成視訊大模型，由文本特征提取、文本特征到視訊隐空間擴散模型、視訊隐空間到視訊視覺空間這 3 個子網絡組成，整體模型參數約 17 億，目前僅支援英文輸入。擴散模型采用 Unet3D 結構，通過從純高斯噪聲視訊中，疊代去噪的過程，實作視訊生成的功能。

官方介紹稱，本模型适用範圍較廣，能基于任意英文文本描述進行推理，生成視訊。一些文本生成視訊示例如下：

A giraffe underneath a microwave.（一隻在微波爐裡的長頸鹿）

A goldendoodle playing in a park by a lake.（一隻金貴犬在湖邊的公園玩耍）

據IT之家了解，模型已經在創空間和 huggingface 上線，可以直接體驗，也可以參考該頁面自行搭建。模型需要硬體配置大約是 16GB 記憶體和 16GB GPU 顯存。在 ModelScope 架構下，通過調用簡單的 Pipeline 即可使用目前模型，其中，輸入需為字典格式，合法鍵值為 'text'，内容為一小段文本。該模型暫僅支援在 GPU 上進行推理。

從試玩的結果來看，目前能生成的視訊長度多在 2-4 秒，生成等候時間從 20 多秒到 1 分多鐘不等。

阿裡達摩院上線文本生成視訊大模型：僅支援英文輸入，已開放試玩

繼續閱讀

智能生成文案視訊，口播部落客必備。隻需要三步，就能在五分鐘之内，做出一條高播放量的口播視訊。不需要有任何的經驗，以及基礎的

【AIGC新玩法：任意輸入、任意輸出】文生圖、文生視訊、文生音頻，火爆的AIGC，有沒有新玩法？目前，人們迫切希望開發一

能吃苦敢熬大夜，靠複制粘貼拿了33w，附帶入門實操。如果說你能吃的了苦也能熬的了夜，不怕長黑眼圈以及發際線一直往後移，那

一招"複制粘貼"，一月收益：2萬。千萬不要在抖音上面傻傻的釋出作品了，那樣是沒有收益的。跟着我這樣操作，一條視訊也能拿個

随着資訊時代的到來人們對資訊的需求日益增長，自媒體的崛起也成為了目前資訊傳播主要的方式之一。如何運用AI快速的生成高品質

美區的MacAppStore上架了《DEATHSTRANDINGDIRECTOR'SCUT》（《死亡擱淺》導演剪輯版），

抖音新玩法-剪映，一條視訊變現100~200。如果你手機上也安裝了剪映，但是到現在100塊錢都沒有賺到，今天跟着我的操作

手機裡的剪映每天操作賺200-300。手機裡面的剪映就能幫你賺錢知道嗎？今天我來教你兩個步驟，用手機剪映每天賺個生活費。

視訊腳本模闆制作方法-自動生成視訊腳本工具分享

中視訊可以不用達到一萬七的播放，隻要換個入口、釋出就能擷取兩份收益，操作非常簡單。不管是七零後還是八零後，隻要有一部手機

如何用FFMpeg生成視訊

以下是幾款AI工具，可幫助您提高工作效率，讓您每天準時下班！·1.沉浸式AI：這是一款可自動創作内容的工具，有APP和網

百度的AI成片和騰訊智影這兩天測試了下，發現百度AI視訊自動生成挺強大的。騰訊的AI自動生成視訊感覺比較廢，主要很多文字

在家做小說推文，昨天收獲：68.1分鐘教會你超速賺錢。剛剛收到一位小姐姐的私信，問有沒有簡單易操作的賺錢方法，今天我就來

點選左下角連結，可以一鍵生成視訊哦！@DOU+小助手#小舞#完美身材#ai

今年是大模型爆發元年，微軟創始人比爾蓋茨直言不諱地說“大模型是40餘年來最革命性的技術”，可以說它有望成為數字時代的新生