未來已來，大模型無處不在。音視訊技術人，你準備好了嗎？

_“_音視訊領域正面臨着一場人機互動體驗的革命，是算力、連接配接、顯示整個端到端革命的更新，市場也在呼喚着颠覆式的終端，現象級的内容以及全新的産業生态。”

技術是從什麼時候開始改變我們的生活的？

打開電視，電影《瞬息全宇宙》為我們帶來了一次視聽上的頂級盛宴。飛速旋轉的圖檔，背後是技術的把控和加持；

手機裡，“哪幾種人将被人工智能取代？”的新聞在不停彈窗；便利店中，一個個由算法排列的貨架會記住你對食物的偏好，并帶來超高的銷售轉化，更不必提 ChatGPT 的高效帶給人類的恐慌：我們似乎早已忘記，從 2016 年 Alpha Go 打敗棋王的那天起，AI 就準備颠覆世界了。

cr. Wei-Shen Wang

疫情的結束和 ChatGPT 的出現讓技術人卷得更加瘋狂：在現有的市場競争環境下，越來越多的企業開始專注于降本增效；另一方面，對于不斷湧現的新技術、新場景，實時音視訊的标準化将引導行業邁向更高的服務品質，而海外業務版圖的擴大也将驅動行業迎來新一輪的業務增長。據艾瑞咨詢報道：

“

預計到 2024年，實時音視訊（RTC）PaaS 市場規模将達到 30 億元。

”

未來已來，可答案在哪裡？我們似乎還沒有看到，但在 LiveVideoStackCon 你一定能看到：新的希望。

在剛剛結束的北京站，許多人收獲了滿滿的技術幹貨，看到了音視訊的無限可能。

LVSCon 2022北京站

随着 ChatGPT 的不斷疊代，未來是一個模型無處不在的時代，而對于音視訊應用和體驗的思考，就必須從二維轉向三維甚至是更多元，就像被浸泡在了某個空間，周圍環繞的都将是未來技術的産物。

LiveVideoStackCon 上海站「沉浸新視界」的主題正是這一想法的表達。

除了技術本身，如何讓技術的産物、産品、方案也能沉浸在生活周圍，實時支援我們的生活、體驗、社交等等，将是此次活動讨論的重點。

那麼，你可能想問，上海站到底講什麼？

本次上海站的「沉浸新視界」将會在音頻、視訊、圖像等技術的最新思考與應用實踐。除了繼續探索音視訊技術在不同場景下的融合與發展外，還将增添雲遊戲、AIGC、IoT、元宇宙和數字化行業案例**等時下熱門的話題。

以下

是目前可以公開的情報

翟爽上海廣播電視台技術中心，上海東方傳媒有限公司轉播部副總監

《SMT 在遠端制作及虛拟化雲端制作的發展實踐》

随着流媒體技術、虛拟化技術和雲技術的發展，也伴随着疫情等客觀因素，遠端制作的應用越來越廣泛，虛拟化及雲端制作也逐漸開始起步，一種全新的轉播模式也在被世界各大重要賽事所接受，所認可。遠端制作和虛拟化雲端制作到底能給客戶帶來什麼，是制作品質的提升，類似于 HDR，4K，8K，三維聲給我們帶來的全新的視聽體驗，還是制作成本的大幅減少，這是值得讨論的。

馬良 Pinterest 視訊架構師

《探讨如何在Pinterest中部署HTTP/3》

本次分享我們将首先介紹 Pinterest 的視訊規模和技術棧，不同階段面臨的挑戰和演化。接下來介紹 Pinterest 如何定義一個好的視訊浏覽體驗，并建立相關的名額。最後分享 Pinterest 如何部署 HTTP/3，包括 HTTP/3 對視訊播放關鍵名額的影響，以及多 CDN 的問題和解決方案。

文念騰訊進階工程師/雲遊戲背景開發

《面向超低延遲的多路徑傳輸優化》

随着網際網路行業的發展，從文字、語音、圖檔，視訊，再到最近兩年非常火爆的直播、視訊會議等，整個行業是向着流量越來越大，實時性越來越高的方向發展。和行業内要求最高的視訊通話場景相比，雲遊戲的要求更高，延遲從百毫秒級降低到二十毫秒級，碼率從 2Mbps 上升到 30Mbps，這對網絡傳輸的實時性提出全新的挑戰。

本文分享主要分為 3 個部分，第一部分介紹實時音視訊場景下，資料可靠性和網絡不确定性對低延遲高碼率系統的挑戰；第二部分介紹手機端基于 wifi+4g 雙鍊路的傳輸方案，以及如何在延遲，碼率和低流量消耗下求取最佳平衡；第三部分介紹系統架構設計上，如何支撐靈活的多路徑傳輸。

陸其明瑞聲科技軟體開發總監

《“觸”手可及的視聽新體驗——觸覺回報标準及新進展》

人類對美好體驗的追求是永無止境的。在多媒體應用領域，特别是在 AR/VR 場景下，如何讓人們獲得更加沉浸的體驗？僅僅在視覺和聽覺兩個方向努力是不夠的，還需要觸覺、嗅覺、味覺… 本次分享側重于觸覺的介紹，而行業内對觸感的應用價值和觸感品質的認知是不夠的，相關标準的缺失也阻礙了技術的快速普及。

本次分享分三個部分：第一部分介紹觸覺的生物學原理、應用價值以及觸感設計和表達方法；第二部分介紹觸感的軟硬體生态現狀，以及相關的應用開發技術，力求全平台覆寫；第三部分介紹觸感相關國際标準的最新動向和進展。通過以上三個部分的内容，期望大家對觸感開始有基本的認知，認可其價值，并且能夠快速上手，共同促進應用端的繁榮。

付濤中國移動智慧家庭營運中心人工智能專家/多媒體通信算法專家

《家庭場景大模型技術與應用實踐》

智慧家庭作為一種新的生活方式，受到越來越多的關注，其核心在于人們渴望從繁瑣的家居操作中解脫，把更多精力投入到生活中的精彩和感動中。

對話陪伴，家庭安防，家庭教育，家庭健康，家庭娛樂等子產品是智慧家庭的重要組成部分，其中涉及到自然語言處理，計算機視覺，語音處理等多模态複雜 AI 了解和生成技術，為解決人們對智能要求的不斷提升，需要利用大規模預訓練大模型所湧現出的通用智能，并針對性的做場景化微調适配；具體的，我們利用千億參數的大模型，并結合家庭場景進行指令微調和對應算法優化，賦能了億級的智慧家庭使用者，其中智能對話，智能安防，家庭教育等覆寫率達到了千萬級以上；

本次分享分為 4 個部分，第一部分主要是介紹家庭場景的核心業務，同步引入算法應用的關鍵問題，第二部分主要是回顧行業大模型的發展現狀和主要算法架構，第三部分是我們在家庭場景下大模型的關鍵技術研發，第四部分主要是大模型的應用實踐。

以上隻是本次分享内容的冰山一角，後續更多内容細節我們将随時更新。在這裡，你不僅可以與業内大佬們進行技術上的心得交流，還可以感受到多媒體生态内的頭部公司、頂級玩家對行業目前發展趨勢、瓶頸挑戰，與對未來規劃的深入解讀。絕對值得期待！

LVSCon 2022北京站

心動了嗎？7 月 28-29 日，上海龍之夢大酒店等你！最後兩天的八折優惠實實在在，掃碼即可購票！心動不如行動！

8 折購票通道倒計時兩天：https://sh2023.livevideostack.cn/tickets

最後，我們期待你也有關于“沉浸”式的音視訊話題，直接聯系我們，分享給大家吧！

LiveVideoStackCon 2023上海講師招募中

LiveVideoStackCon是每個人的舞台，如果你在團隊、公司中獨當一面，在某一領域或技術擁有多年實踐，并熱衷于技術交流，歡迎申請成為LiveVideoStackCon的講師。請送出演講内容至郵箱：[email protected]。

未來已來，大模型無處不在。音視訊技術人，你準備好了嗎？

繼續閱讀

視訊流概念

視訊帶寬計算公式(碼流_分辨率_幀率)

windows下使用FFmpeg生成PCM音頻檔案并播放（通過指令的方式）

YUV格式

在MFC視窗中嵌入VLC ActiveX控件，讀網絡流和本地檔案的不同調用方法

windows下編譯ZLMediaKit

文娛、交通、醫療……超高清視訊技術為各行各業注入新動能

Ubuntu下安裝、編譯、運作nginx和nginx-rtmp-module。

4K視訊技術發展

常見的相機輸出接口CVBS、VGA、DVI、HDMI、SDI、Camera Link、HS-LINK、CoaXPress1.CVBS2.VGA3.DVI4.HDMI5.SDI6.Camera link7.HS-LINK8.CoaXPress

ffmpeg自定義編解碼器

淺析景區慢直播的需求與基于視訊技術的解決方案

ffmpeg常用接口FFmpeg新舊接口對照使用一覽

音頻基礎知識

淺析EasyCVR視訊技術與AR實景智能管理平台在智慧廠區中的應用

ffmpeg 筆記：mp4視訊截圖