天天看點

萬興科技AIGC概念迷霧:60秒文生視訊能力遭質疑,開月薪10萬招AI人才

本文來源:時代财經 作者:謝斯臨

萬興科技AIGC概念迷霧:60秒文生視訊能力遭質疑,開月薪10萬招AI人才

圖源:天幕文生樣闆視訊截圖

Sora爆火兩月之後,國内迅速有A股上市公司做出跟進,推出同樣具備文生視訊能力的多媒體大模型。

4月28日,A股數字創意軟體龍頭萬興科技(300624.SZ)旗下天幕大模型開啟公測。據萬興科技此前介紹,該模型是國内首個音視訊多媒體大模型,目前已疊代文生音樂、多語言對話、一鍵成片等近百項音視訊原子能力。特别是在文生視訊能力上,已實作不同風格、豐富場景及主題的連貫性,一鍵生成時長支援60秒左右。

這一視訊生成時長,甚至可以比肩全球頂級大模型企業OpenAI在今年2月釋出文生視訊模型“Sora”。該産品最長可生成60秒左右的視訊,因其生成視訊的一緻性、清晰度,和模拟真實實體世界的能力震驚世界。

在公測的同時,萬興科技也公布了2023年業績,營收與利潤均實作明顯增長。财報資料顯示,公司2023年實作營業收入14.81億元,同比增長25.49%,歸母淨利潤8620.57萬元,同比增長113.20%。

自4月18日宣布将公測天幕大模型之後,其視訊生成能力如何尚未可知,但萬興科技的股價和市值卻已“聞風而動”。時代财經統計發現,截至4月30日收盤,萬興科技報92元/股,總市值達126.69億元。相比18日收盤的113.07億元,其市值上漲超過13億元,漲幅達12%。

自2018年上市後,萬興科技的股價幾經大起大落,作為曾坐擁"獨角獸""元宇宙"等多個概念股标簽的“妖股”,萬興科技的天幕大模型是否真的如宣傳般強大?

在天幕大模型公測後,外界發現,除生成時長這一名額之外,天幕的生成效果與Sora相去甚遠。在畫面流暢度、連貫性以及拟真能力等多個名額上的表現均不及預期。

萬興科技副總裁朱偉曾公開表示,天幕的模型能力和Sora相比确實還存在一定差距。尤其是文生視訊效果方面,他曾在接受媒體采訪時表示,“Sora作為行業标杆,是公司正在努力看齊的目标。”

就研發投入、商業化前景等問題,時代财經向萬興科技發去采訪提綱。

朱偉在接受時代财經采訪時指出,為打造天幕大模型,公司在研發層面配備了上百人的研發團隊,每年需投入數千萬元,此外還有資料采買的投入和算力的投入,三者總計上億級别的投入。

此外,朱偉表示,天幕有自己差異化的特點,相較于Sora這類基礎模型,天幕更偏向于細分的垂類行業,希望聚焦到每一個具體的應用場景,解決實際問題,為使用者帶來價值。如AI歌手、數字人播報等能力,就是在具體細分場景中的落地展現,屬于純應用。“我們希望萬興科技的每一款産品,都是技術與應用的結合,能解決某個細分領域的具體問題。”

據時代财經不完全統計,目前已入局AI大模型的國内網際網路頭部公司中,尚無一家宣傳能夠生成10秒以上的文生視訊,更多的還是圖生視訊。如騰訊混元曾聯合清華、港科大推出圖生視訊大模型“Follow Your Click”;阿裡智能計算研究所也推出過EMO,也僅支援用照片和音頻生成唱歌視訊。

那麼,作為國内第一批宣稱擁有60秒AI視訊生成的公司,萬興科技到底成色幾何?

視訊生成效果不及預期?

天幕開放公測後,時代财經第一時間做出試用申請,排在等候序列的1458位,截至發稿申請仍未通過稽核。

官網資訊顯示,天幕主要具備文字生成視訊、已有視訊風格化處理、文字生成背景音樂、視訊配樂、文字生成音效、文字生成圖檔,以及圖檔生成圖檔等7項能力。以市場最受關注的文生視訊為例,天幕支援最長2000字的描述詞,并提供寫實和動漫兩種風格進行選擇。

萬興科技AIGC概念迷霧:60秒文生視訊能力遭質疑,開月薪10萬招AI人才

圖源:萬興科技官網截圖

不過,萬興科技提供的兩個文生視訊示例均隻有短短2秒,且視訊畫面死闆單一,隻有簡單的鏡頭移動。

而4月18日萬興科技官方公衆号放出的59秒樣闆視訊,畫面同樣僵硬而緩慢。比起Sora放出的一鍵生成的長視訊,這段視訊在一緻性和連貫性的表現十分初級。

AI算法專家、資深人工智能從業者黃頌在觀看樣闆視訊後向時代财經分析指出,該模型生成的視訊卡幀明顯,而且幾乎沒有光影效果、物體之間的互動,卡通效果也離真實世界也差得很遠。

一位就職于知名清華系AI大模型創業公司的資深人士向時代财經評論道,萬興科技的天幕“更像是縫合怪”,即将多個短視訊拼合剪輯為60秒左右的長視訊。

事實上,時長是文生視訊模型應用落地的關鍵環節。網際網路大廠AI研究員艾長青指出,即便生成視訊效果好,但如果沒能從底層算法結構上支援視訊時長的可擴充性,模型很難找到合适的落地場景,隻能停留在實驗室環節。

“業界視訊生成模型核心關注的點包括視訊的生成時長是否是可擴充,以及生成品質是否達标。前者是被認為是根本性、方向性的問題,後者則是資料品質打磨、訓練方式的問題。”艾長青表示。

在天幕公測的前一天,4月27日,生數科技首席科學家、清華大學教授朱軍在中關村論壇未來人工智能先鋒論壇上,釋出了視訊大模型Vidu。該模型采用團隊原創的Diffusion與Transformer融合的架構U-ViT,支援一鍵生成長達16秒、分辨率高達1080P的高清視訊内容。Vidu不僅能夠模拟真實實體世界,還擁有豐富想象力,具備多鏡頭生成、時空一緻性高等特點。

生數科技的投資人啟明創投發文評價道:“Vidu是自Sora釋出之後全球率先取得重大突破的視訊大模型,性能全面對标國際頂尖水準,并在加速疊代提升中。”

德邦證券研報亦指出,在以鏡頭語言為代表的動态性,以及對實體世界規律的了解與模拟能力等方面已做到了Sora相近水準,Vidu或将發揮在國産視訊大模型的“鲇魚效應”,激勵國産多模态大模型突破創新。

可見,萬興科技天幕大模型的能力表現與之相比仍有一定差距。

但也有聲音認為,國産視訊生成模型仍處于初級階段,早期效果不佳可以了解。艾長青向時代财經指出,視訊是三維以上的空間,相比于文本模型,訓練難度數量級增加,必須依靠大量算力作為支撐。目前,國内沒有足夠的算力,較難開展視訊生成模型的研究。

“國内視訊生成模型距離應用程度還有很長的路要走,至少還需要兩年甚至更長時間,才會有通用效果比較好的模型出現。”艾長青是以認為,國内陸續有視訊生成模型問世其實是件好事,隻有邁出第一步,才能夠互相交流不斷疊代提升能力。

時代财經還發現,萬興科技近期在以極高的待遇吸引AI領域的高端人才。據萬興科技此前釋出的2024年度春招資訊,AIGC相關産品經理和研發崗位的基礎起薪超過40萬,其中圖形圖像算法工程師等關鍵崗位月薪最高可達10萬元,年薪超過百萬元;多模态音視訊算法工程師、基礎平台架構師等崗位月薪亦超過5萬元。

萬興科技AIGC概念迷霧:60秒文生視訊能力遭質疑,開月薪10萬招AI人才

圖源:萬興科技官網

天使投資人、資深人工智能專家郭濤則向時代财經指出,對于文生視訊模型這一新興領域,不同公司産品可能處在不同發展階段,“即便萬興科技的天幕大模型在各方面表現都不如Sora,但這并不代表他們的技術研發沒有價值,最終還是要看與實際業務、市場應用的結合情況。”

AIGC間接帶動業績增長

通用大模型的競争是少數平台級巨頭公司的遊戲,對于絕大多數企業來說,更關鍵的是如何将已有的能力投入可以快速變現的商業場景——天幕大模型究竟能給萬興科技帶來多少業務增量?

作為一家以向C端客戶銷售創意類數字軟體的上市公司,萬興科技從2023年開始,就已經嘗試将AIGC能力應用在産品之中,不僅旗下萬興喵影、萬興PDF、億圖圖示、億圖腦圖、萬興易修等多款産品上線了适配的AIGC功能,如AI摳圖、AI降噪、AI文案、AI圖檔生成等,還釋出了數字人短視訊營銷工具萬興播爆、AI虛拟陪伴應用TruMate、AI文字視訊剪輯工具Kwicut等創新型的AIGC産品。

但這些探索沒有直接轉化成為收入。朱偉向時代财經透露,公司大多數原有産品暫未強制推行AI收費等商業化政策,是以并未帶來直接的收入增長。

影響更多是間接的。朱偉以萬興喵影舉例表示,該産品自去年10月底上線文本成片、AI音樂生成等功能後,一定程度帶動内容服務需求和使用者粘性的提升,年内實作素材資源訂閱金額提升100%,進一步優化産品的營收品質和效率。

萬興科技在2023年年報中表示,AIGC能力的引入,疊加産品疊代更新的影響,幫助公司文檔創意類産品線付費使用者數提升20%,營收達1.3億元,同比增長30.92%;繪圖創意類産品月活同比增長30%,營收達1.29億元,同比增長30.52%;視訊創意類産品訂閱續費率提升5%個點,營收達9.6億元,同比增長28.91%。

然而随着文生文、文生圖等AIGC技術應用的不斷深入,帶來的産品創新空間逐漸被挖掘殆盡,萬興科技增長開始放緩。2024年一季度,萬興科技錄得營業收入3.58億元,同比增長0.9%;歸母淨利潤2564.98萬元,同比增長22.99%。

目前還未得到大規模落地應用的視訊生成模型能力,成為萬興科技下一步增長的關鍵。隻是考慮到現階段還不成熟的視訊生成效果,和仍舊高昂的訓練、推理成本,其商業化變現路徑仍不明确。

“在文本大模型領域,免費可能是大家的共識,因為成本相對可控,而且使用者越多越有利于大模型快速更新。但對于訓練成本、推理成本巨大的視訊大模型來說,必須考慮更多。”朱偉指出,從原則上來講,萬興科技會更慎重地向免費使用者提供視訊AIGC能力。同時,重點将這一能力推向付費意願和能力相對更強的B端使用者,盡快把音視訊多媒體大模型真正推向商用。

據萬興科技年報,其前五大客戶占其年度銷售總額比例為66.96%。

去年曾被兩次問詢是否炒作AI

盡管大模型能力差強人意,但并不妨礙上市公司從市值方面“獲利”。以萬興科技為例,自去年以來,就不斷有聲音質疑其蹭AI概念熱點炒作股價。

去年大模型爆火帶動AI概念股股價起飛之時,萬興科技就曾多次在互動平台釋放與ChatGPT相關利好,如表示公司已有商用賬号開通GPT-4的API接口;已與微軟簽訂了雲服務架構協定,且海外主要産品已接入Azure OpenAI服務等。

一番操作後,萬興科技也成了當年漲幅最大的幾隻牛股之一。雪球資料顯示,2023年,萬興科技股價從年初的每股30.65元,一路瘋漲,到同年6月20日的頂峰時刻,曾一度觸及每股172.2元的曆史記錄,漲幅超過4倍。而後股價開始回落,截至2023年底仍報每股94.6元,漲幅超過208%。

萬興科技AIGC概念迷霧:60秒文生視訊能力遭質疑,開月薪10萬招AI人才

圖源:Pixabay

2023年3月27日和5月8日,萬興科技兩次收到深交所的關注函,詢問公司相關産品運用ChatGPT、AIGC等技術的具體情況,有無帶來直接收入,以及是否存在蹭熱點、炒概念及配合股東減持的情形。

萬興科技對此回複表示,公司采用AIGC相關技術旨在實作功能更新和智能化效率提升,增強産品吸引力。但未針對AI新技術、新功能進行單獨收費,是以沒有帶來直接收入;也暫未收到實控人、董監高的減持計劃,是以不存在蹭熱點、炒概念及配合股東減持的情形,後續有相關事項,公司将嚴格按照規定做出披露。

然而就在2023年5月回複完深交所不到半個月之後,萬興科技便釋出公告表示,公司實控人吳太兵計劃在未來6個月時間内,減持不超過206萬股,即不超過公司總股本的1.5%。同年7月26日,這一減持計劃宣告結束,以減持均價初略計算,吳太兵套現超過2億元。

實控人在股價高點減持套現無疑是巨大利空,這無疑讓萬興科技的AIGC蒙上了一層迷霧,如今萬興科技雖然釋出了擁有文生視訊能力的大模型,但顯然仍未消除資本市場的疑慮。

在吳太兵去年減持萬興科技前後,還有大量AI牛股上演花樣減持,如創始人前妻減持并将50%收益借給上市公司的昆侖萬維(300418.SZ),以及被質疑離婚式減持的三六零(601360.SH)等。

在中國數實融合50人論壇智庫專家洪勇看來,判斷一家公司行為是否涉嫌蹭概念炒作,需從實際研發投入、産品功能、市場應用等多個角度綜合考慮。

“如果萬興科技隻是在宣傳上誇大其詞,而沒有實質性技術創新或明顯産品優勢,可能确實存在概念炒作的嫌疑。但如果其持續在技術研發上有所投入,并且産品能夠逐漸提升并滿足特定市場需求,即便目前表現不如國際先進水準,也應視為行業發展的正常過程。”洪勇對時代财經表示。

繼續閱讀