神蠶、鶴劼 阿裡雲雲原生 2023-07-14 17:30 發表于浙江
沉寂三年後,線下演出市場正在迎來“報複性”複蘇。對于一場期待已久的演唱會,驗票環節是否流暢、能否快速入場,直接影響着每一位觀衆對整場演出服務的體驗和評價,相信不少朋友都有着切身的感受。
阿裡巴巴影業集團是以網際網路為核心驅動的影視實業公司,擁有内容生産制作、網際網路宣傳發行、衍生品授權及綜合開發、院線票務管理及資料服務的全産業鍊娛樂平台,是阿裡巴巴文化娛樂集團重要的垂直業務縱隊。阿裡影業一直在通過技術與架構的創新,引領行業全鍊路向數字化和智慧化變革。
行業流量爆發增長的同時,影演場景也在不斷得到延伸和豐富。在此背景下,為了應對演出現場服務效率、系統穩定性、高可用性壓力帶來的嚴苛考驗,阿裡影業基于阿裡雲邊緣容器服務 ACK@Edge 實作了一套面向影演現場服務場景的雲邊端一體混合雲架構,通過對海量異構裝置接入的支援,以及高可用、高穩定性、可擴充等性能提升,來滿足未來高時延敏感實操消息上下行和業務快速發展需求。值得一提的是,這是演出行業首例實作雲邊端一體、雲端服務與邊緣叢集雲原生協同的落地實踐,并于 2023 年 6 月獲得中國信通院“可信邊緣最佳實踐案例”。
人流大、環境複雜,
影演現場服務挑戰催生雲邊協同訴求
Cloud Native
阿裡影業線下演出場景的服務人群主要分為三類,消費者、主辦方以及監管方。對于監管方要滿足安全、穩定的要求;對于消費者要保證核驗準确、進場快速;對于主辦方,除了以上幾點,還需要盡量降低成本。
服務系統管理平台作為阿裡影業的核心業務系統,在不同演出場地的基礎網絡設施參差不齊的條件下,結合現場人流量呈現短時并發增長的特性,業務系統對高度敏感的網絡資源需求依賴較大,導緻業務健壯性無法保證。在演出現場服務規模高速發展的現狀下,已經出現嚴重的邊端業務發展瓶頸,如多邊端項目規則無法協同配置,多演出現場無法統一監控管理,海量異構裝置無法統一運維排程,傳統雲到端以及端到端架構現狀無法繼續滿足實際邊端場景需求,需要面向海量異構裝置接入的高可用、高穩定性、可擴充的雲邊端一體的混合雲架構,解決現有瓶頸與未來擴充問題:
- 雲邊協同便捷:随着雲計算、邊緣計算和物聯網等技術的快速發展,對于協同工作的需求也在不斷增長。雲邊協同可以充分利用這些先進技術,為使用者提供更高效、便捷的協同體驗。
- 高效資料處理:資料已成為企業群組織最重要的資産之一。伴随電影演出資料量呈現爆炸式增長,這使得對資料的存儲、處理和分析需求也随之增。雲邊協同可以幫助使用者更好地管理和利用這些資料資源,雲邊協同可以跨越地域和時區的限制,提高工作效率。
- 低延遲時間:在電影演出現場,對資料處理和回報的實時性要求非常高。雲邊協同可以通過邊緣計算技術,實作資料在本地裝置的快速處理,降低延遲,滿足實時性需求。
- 大幅降本:雲邊協同可以在本地裝置上進行部分資料處理,減少資料在網絡中的傳輸量,進而降低網絡帶寬需求和通信成本,同時更合理地利用機器資源,降低硬體投入成本以及硬體運輸成本。
阿裡影業基于 ACK@Edge 的
雲邊協同 IoT 架構實踐
Cloud Native
阿裡影業邊緣 IoT 服務系統使用雲邊端協同的架構,是針對現場換驗業務場景的一種解決方案。整體思路主要以雲控邊、邊自治、端智能為核心思想,以實作雲邊協同、多元化的方式為現場提供高可用、高性能、高擴充的現場服務。
ACK@Edge 是阿裡雲容器服務針對邊緣計算場景推出的雲邊一體化協同托管方案.面向大規模邊緣計算場景,ACK@Edge 擁有經中國信通院認證的“卓越級節點管理”産品能力,采用原生 Kubernetes 非侵入方式增強方式支援邊緣計算場景下的應用統一生命周期管理和統一資源排程,幫助企業專注于容器化應用的開發與管理。
在整體架構上采用雲邊端一體化協同托管方案,将雲計算的能力下沉到邊緣側、裝置側,重點提供存儲、網絡、安全、監控、日志等能力;在叢集管理方面,APIserver 和排程器内置了大量性能優化;在雲邊網絡方面,通過對網絡插件 Flannel 優化大幅度降低雲邊流量開銷;此外,考慮到邊緣資源的異構性、地域性以及網絡的複雜性等特點,ACK@Edge 提供了異構資源管理、邊緣自治、邊緣單元化、邊緣流量管理、輕量化、原生運維 API 支援等,以原生方式支援邊緣計算場景下的應用統一生命周期管理和統一資源排程,保障邊緣業務穩定性。
ACK@Edge 目前已經廣泛應用于 CDN、實時音視訊雲服務、線上教育、交通、智慧城市、智慧工業、IoT、物流、水利、能源、農業等場景。
阿裡影業的現場換驗雲邊端協同架構使用 ACK@Edge 作為底層雲原生邊緣基礎設施排程的托管底座,利用 ACK@Edge 提供的邊緣自治、邊緣管理、服務運維等能力來支撐雲控邊、邊自治的設計原則。
在實際業務場景中,現場的邊緣伺服器是分散在各個現場的并且是不固定的,通常需要在邊緣伺服器出廠時,便将邊緣節點添加到 ACK&Edge 的 master 節點上,再通過雲上自建裝置監控平台進行業務部署、運維管控等操作。利用 ACK&Edge 的邊緣自治能力保證現場節點在極端弱網、無網的情況下服務正常啟動,提供現場需要的換票、驗票等能力,以便現場能夠保證正常地進行驗票、換票等操作,此外,通過 ACK&Edge 的可觀測能力,對現場服務節點進行監控、告警等以提升現場服務問題的自我發現能力和保證現場服務的可用性。
2.1 高效的邊緣服務定制管理
邊緣容器服務 ACK@Edge 提供的功能,通過更上層次的抽象,對多個 Deployment 進行統一管理,比如建立、更新和删除等操作。提供一個模闆來定義應用,将多個 Workload 部署到不同的區域,每個區域定義為一個節點池。
目前單元化部署支援兩種類型的 Workload,StatefulSet 和 Deployment。控制器會根據單元化部署中節點池的配置建立子的 Workload 資源對象,每個資源對象都有一個期望的 Replicas Pod 數量。通過一個單元化部署執行個體就可以自動維護多個 Deployment 或者 Statefulset 資源,同時還能實作 Name、NodeSelectors 和 Replicas 等的差異化配置。
現場運維管理平台提供邊緣裝置服務發現、邊緣服務差異化配置服務,根據現場業務動态調整 Deployment 配置,依托 ACK@Edge 實作高效的邊緣服務定制、管理。
2.2 邊緣自治,節點任務無縫自動切換
大型和超大型演出現場驗票系統可靠性要高其他類型現場,對裝置可靠性提出更高的要求,并且裝置故障平均故障時間也要滿足全天候驗票要求,同時針對現場容災,可自動感覺和服務切換,減少現場運維人員排除故障時間。針對現場驗票服務裝置可靠性要達到 0.999 及其以上,并具備服務容災能力,實作多機運作,雲端一體的服務容災。
邊緣節點可以自主協商、決策和執行任務的能力;自治能力可以使邊緣節點更加智能化,能夠自動适應環境變化,保證系統的穩定性和可靠性。無縫自動切換是指在邊緣計算中,當某個節點故障或不可用時,系統可以自動将任務轉移到其他節點上,實作無縫的任務切換和容錯能力。通過邊緣自治和無縫自動切換的技術,邊緣計算可以更加靈活、高效地進行任務排程和資源利用,同時也能夠提高系統的可靠性和容錯性。
裝置端連接配接邊緣和雲端提供換驗能力,裝置通過自動決策 SDK,判斷網絡狀态、智能監測服務行為自動進行決策,确定連接配接邊緣還是連接配接雲端服務。邊緣通過資料同步服務與雲端進行多通道資料互動,以確定雲端和邊緣資料一緻性。
2.3 雲邊協同,確定現場規則一緻
雲邊協同将雲計算和邊緣計算相結合,通過協同工作,實作更加高效、靈活和可靠的計算模式。現場規則一緻多開是指在邊緣計算環境中,可以快速複制、部署和管理相同的應用程式和服務,以滿足現場多個節點的需求。通過雲邊協同和現場規則一緻多開的技術,可以将計算資源和應用程式更好地分布到邊緣節點上,提高系統的響應速度和性能,同時也能夠滿足現場多樣化的需求。
具體來說,雲控制整體中心雲與邊緣雲部署,主動協同邊緣,推送邊緣資料實時協同,雲端項目與邊緣項目共享現場規則,雲邊配置整體協同與回流,現場規則雲邊一體一緻多開協同,雲端管控高速觸達邊緣,做到“雲控端,邊回雲,一緻協同”。
2.4 服務安全,智能體檢
服務安全邊緣計算環境下,需要保護資料和服務不受攻擊和濫用的技術和政策。邊緣計算場景下,由于資料傳輸路徑較長、網絡拓撲結構複雜,安全風險較高,是以保障服務安全顯得尤為重要。同時,智能體檢是對邊緣裝置、網絡環境和服務進行全面的安全體檢和分析,及時發現和排查安全隐患,保證系統的安全性和穩定性。通過服務安全和智能體檢的技術,可以提高邊緣計算系統的安全性和可靠性,保障資料和服務的安全和可用性。阿裡影業 IoT 雲邊端充分考慮服務安全和智能體檢,以保障系統的安全性和可靠性。
邊緣服務自動智能檢測邊緣服務各個系統名額,自動上傳系統體檢名額資料,自動化檢測、修複、引導等進行現場系統告警修複,并将檢測資料實時上傳雲端,以便對現場所有邊緣伺服器進行早知道、早修複、早處理。
ACK@Edge 助力阿裡影業
IoT 雲邊協同、增效降本
Cloud Native
通過将 ACK@Edge 平台作為 IoT 雲邊端架構整體基座,阿裡影業在影演現場服務場景打通了現有雲上 Paas 平台與邊緣端服務配置管理能力,将雲原生的能力擴充到了邊緣側, 能夠滿足邊端的高響應、低延遲時間、大連接配接的強訴求的雲管邊的整體協同能力。
目前,該架構已經很好的應用于現場服務中,在超過 200 場次的各類項目中驗票總數近十萬張,帶來業務結果在諸多方面的提升:
- 将服務置于容器中,解決了原始資源不隔離帶來的穩定性差的問題,統一裝置作業系統與配置環境,降低現場 98% 的裝置相容問題,現場人員部署速度提升 45% 以上,降低活動人員成本;
- 利用邊緣容災完成局域叢集負載均衡,無需人工監控與操縱,減少 99% 的切換時間,實作主機與備用機的平滑無感切換,大大增強現場服務容災能力,在保證服務穩定性的同時,提升了驗票環節的使用者體驗,1 秒完成驗票,人均驗票時間減少 70%;
- 機器資源合理利用,實作多節點一台機器,使硬體的投入和部署成本整低降低 50%。
- 邊緣裝置管理實作了邊緣裝置鏡像釋出、復原以及更新,監控資料以及服務發現,實作遠端對所有節點的統一管控,同步所有節點版本釋出,減少因版本不一緻或版本未更新造成的入場問題。
通過落地基于 ACK@Edge 的雲邊一體協同架構,阿裡影業拓展了更多的演出行業場景,整體服務穩定性與高可用度得到提升,并且大幅提升主辦方對阿裡影業信任與消費者滿意度,形成了幫助阿裡影業在現場服務領域處于領先的重要支撐。
未來,阿裡影業将繼續秉持“内容+科技”的雙輪驅動發展戰略,加速上遊内容布局,加長科技闆塊優勢,不斷優化營運效能,推動業務多元化發展。阿裡雲容器服務也将始終與客戶業務同行,助力阿裡影業為廣大使用者、市場和行業提供豐富、滿意的文娛消費體驗。