天天看點

未來已來,大模型無處不在。音視訊技術人,你準備好了嗎?

作者:LiveVideoStack
_“_音視訊領域正面臨着一場人機互動體驗的革命,是算力、連接配接、顯示整個端到端革命的更新,市場也在呼喚着颠覆式的終端,現象級的内容以及全新的産業生态。”

技術是從什麼時候開始改變我們的生活的?

未來已來,大模型無處不在。音視訊技術人,你準備好了嗎?

打開電視,電影《瞬息全宇宙》為我們帶來了一次視聽上的頂級盛宴。飛速旋轉的圖檔,背後是技術的把控和加持;

未來已來,大模型無處不在。音視訊技術人,你準備好了嗎?

手機裡,“哪幾種人将被人工智能取代?”的新聞在不停彈窗;便利店中,一個個由算法排列的貨架會記住你對食物的偏好,并帶來超高的銷售轉化,更不必提 ChatGPT 的高效帶給人類的恐慌:我們似乎早已忘記,從 2016 年 Alpha Go 打敗棋王的那天起,AI 就準備颠覆世界了。

未來已來,大模型無處不在。音視訊技術人,你準備好了嗎?

cr. Wei-Shen Wang

疫情的結束和 ChatGPT 的出現讓技術人卷得更加瘋狂:在現有的市場競争環境下,越來越多的企業開始專注于降本增效;另一方面,對于不斷湧現的新技術、新場景,實時音視訊的标準化将引導行業邁向更高的服務品質,而海外業務版圖的擴大也将驅動行業迎來新一輪的業務增長。據艾瑞咨詢報道:

預計到 2024年,實時音視訊(RTC)PaaS 市場規模将達到 30 億元。

未來已來,可答案在哪裡?我們似乎還沒有看到,但在 LiveVideoStackCon 你一定能看到:新的希望。

在剛剛結束的北京站,許多人收獲了滿滿的技術幹貨,看到了音視訊的無限可能。

未來已來,大模型無處不在。音視訊技術人,你準備好了嗎?

LVSCon 2022北京站

随着 ChatGPT 的不斷疊代,未來是一個模型無處不在的時代,而對于音視訊應用和體驗的思考,就必須從二維轉向三維甚至是更多元,就像被浸泡在了某個空間,周圍環繞的都将是未來技術的産物。

LiveVideoStackCon 上海站「沉浸 新視界」的主題正是這一想法的表達。

除了技術本身,如何讓技術的産物、産品、方案也能沉浸在生活周圍,實時支援我們的生活、體驗、社交等等,将是此次活動讨論的重點。

那麼,你可能想問,上海站到底講什麼?

本次上海站的「沉浸 新視界」将會在音頻、視訊、圖像等技術的最新思考與應用實踐。除了繼續探索音視訊技術在不同場景下的融合與發展外,還将增添雲遊戲、AIGC、IoT、元宇宙和數字化行業案例**等時下熱門的話題。

以下

是目前可以公開的情報

未來已來,大模型無處不在。音視訊技術人,你準備好了嗎?

翟爽 上海廣播電視台技術中心,上海東方傳媒有限公司轉播部副總監

《SMT 在遠端制作及虛拟化雲端制作的發展實踐》

随着流媒體技術、虛拟化技術和雲技術的發展,也伴随着疫情等客觀因素,遠端制作的應用越來越廣泛,虛拟化及雲端制作也逐漸開始起步,一種全新的轉播模式也在被世界各大重要賽事所接受,所認可。遠端制作和虛拟化雲端制作到底能給客戶帶來什麼,是制作品質的提升,類似于 HDR,4K,8K,三維聲給我們帶來的全新的視聽體驗,還是制作成本的大幅減少,這是值得讨論的。

未來已來,大模型無處不在。音視訊技術人,你準備好了嗎?

馬良 Pinterest 視訊架構師

《探讨如何在Pinterest中部署HTTP/3》

本次分享我們将首先介紹 Pinterest 的視訊規模和技術棧,不同階段面臨的挑戰和演化。接下來介紹 Pinterest 如何定義一個好的視訊浏覽體驗,并建立相關的名額。最後分享 Pinterest 如何部署 HTTP/3,包括 HTTP/3 對視訊播放關鍵名額的影響,以及多 CDN 的問題和解決方案。

未來已來,大模型無處不在。音視訊技術人,你準備好了嗎?

文念 騰訊進階工程師/雲遊戲背景開發

《面向超低延遲的多路徑傳輸優化》

随着網際網路行業的發展,從文字、語音、圖檔,視訊,再到最近兩年非常火爆的直播、視訊會議等,整個行業是向着流量越來越大,實時性越來越高的方向發展。和行業内要求最高的視訊通話場景相比,雲遊戲的要求更高,延遲從百毫秒級降低到二十毫秒級,碼率從 2Mbps 上升到 30Mbps,這對網絡傳輸的實時性提出全新的挑戰。

本文分享主要分為 3 個部分,第一部分介紹實時音視訊場景下,資料可靠性和網絡不确定性對低延遲高碼率系統的挑戰;第二部分介紹手機端基于 wifi+4g 雙鍊路的傳輸方案,以及如何在延遲,碼率和低流量消耗下求取最佳平衡;第三部分介紹系統架構設計上,如何支撐靈活的多路徑傳輸。

未來已來,大模型無處不在。音視訊技術人,你準備好了嗎?

陸其明 瑞聲科技 軟體開發總監

《“觸”手可及的視聽新體驗——觸覺回報标準及新進展》

人類對美好體驗的追求是永無止境的。在多媒體應用領域,特别是在 AR/VR 場景下,如何讓人們獲得更加沉浸的體驗?僅僅在視覺和聽覺兩個方向努力是不夠的,還需要觸覺、嗅覺、味覺… 本次分享側重于觸覺的介紹,而行業内對觸感的應用價值和觸感品質的認知是不夠的,相關标準的缺失也阻礙了技術的快速普及。

本次分享分三個部分:第一部分介紹觸覺的生物學原理、應用價值以及觸感設計和表達方法;第二部分介紹觸感的軟硬體生态現狀,以及相關的應用開發技術,力求全平台覆寫;第三部分介紹觸感相關國際标準的最新動向和進展。通過以上三個部分的内容,期望大家對觸感開始有基本的認知,認可其價值,并且能夠快速上手,共同促進應用端的繁榮。

未來已來,大模型無處不在。音視訊技術人,你準備好了嗎?

付濤 中國移動智慧家庭營運中心 人工智能專家/多媒體通信算法專家

《家庭場景大模型技術與應用實踐》

智慧家庭作為一種新的生活方式,受到越來越多的關注,其核心在于人們渴望從繁瑣的家居操作中解脫,把更多精力投入到生活中的精彩和感動中。

對話陪伴,家庭安防,家庭教育,家庭健康,家庭娛樂等子產品是智慧家庭的重要組成部分,其中涉及到自然語言處理,計算機視覺,語音處理等多模态複雜 AI 了解和生成技術,為解決人們對智能要求的不斷提升,需要利用大規模預訓練大模型所湧現出的通用智能,并針對性的做場景化微調适配;具體的,我們利用千億參數的大模型,并結合家庭場景進行指令微調和對應算法優化,賦能了億級的智慧家庭使用者,其中智能對話,智能安防,家庭教育等覆寫率達到了千萬級以上;

本次分享分為 4 個部分,第一部分主要是介紹家庭場景的核心業務,同步引入算法應用的關鍵問題,第二部分主要是回顧行業大模型的發展現狀和主要算法架構,第三部分是我們在家庭場景下大模型的關鍵技術研發,第四部分主要是大模型的應用實踐。

以上隻是本次分享内容的冰山一角,後續更多内容細節我們将随時更新。在這裡,你不僅可以與業内大佬們進行技術上的心得交流,還可以感受到多媒體生态内的頭部公司、頂級玩家對行業目前發展趨勢、瓶頸挑戰,與對未來規劃的深入解讀。絕對值得期待!

未來已來,大模型無處不在。音視訊技術人,你準備好了嗎?

LVSCon 2022北京站

心動了嗎?7 月 28-29 日,上海龍之夢大酒店等你!最後兩天的八折優惠實實在在,掃碼即可購票!心動不如行動!

8 折購票通道倒計時兩天:https://sh2023.livevideostack.cn/tickets

最後,我們期待你也有關于“沉浸”式的音視訊話題,直接聯系我們,分享給大家吧!

未來已來,大模型無處不在。音視訊技術人,你準備好了嗎?

LiveVideoStackCon 2023上海講師招募中

LiveVideoStackCon是每個人的舞台,如果你在團隊、公司中獨當一面,在某一領域或技術擁有多年實踐,并熱衷于技術交流,歡迎申請成為LiveVideoStackCon的講師。請送出演講内容至郵箱:[email protected]

繼續閱讀