到目前為止,我們已經将鏡像加速優化到了較高的水準。我們在函數計算的公開用例裡面挑選了 4 個典型的鏡像并将它們适配至國内外幾個大型雲廠商(名稱以廠商 A、廠商 B 代替)進行橫向對比,每間隔 3 小時調用上述鏡像,重複數次,我們得到了以下結果:
1、AI 線上推理-貓狗識别
該鏡像包含了基于 TensorFlow 深度學習架構的圖像識别應用。阿裡雲函數計算和廠商 A 都能正常運作,但廠商 A 性能較差。廠商 B 則無法正常運作。下圖中阿裡雲函數計算和廠商 A 的延時資料包含鏡像拉取,容器啟動,執行推理運算端對端的延時,而廠商 B 的資料隻是拉取鏡像部分的延時,都已經是最慢。FC 相對穩定,可以看出函數計算在 CPU 消耗型如 AI 推理方面有着更大優勢。
函數計算 GB 鏡像秒級啟動:下一代軟硬體架構協同優化揭秘背景
以雲盤熱啟動為基準(灰色),對比各個廠商的額外開銷(彩色)
2、Python Flask Web Service
此鏡像為常見的網絡服務,内部使用 Python 搭配 Flask 服務架構。此鏡像的作用旨在測試不同雲産品是否有能力完成高效按需加載。FC 與廠商 A 均有波動但後者的波動最為明顯。
函數計算 GB 鏡像秒級啟動:下一代軟硬體架構協同優化揭秘背景
函數計算 GB 鏡像秒級啟動:下一代軟硬體架構協同優化揭秘背景
3、Python 機器學習運算
鏡像内同樣是 Python 運作環境,可以看出各個廠商依舊保持着各自的特性,廠商 B 全量下載下傳,廠商 A 部分請求有優化但不穩定。
函數計算 GB 鏡像秒級啟動:下一代軟硬體架構協同優化揭秘背景
函數計算 GB 鏡像秒級啟動:下一代軟硬體架構協同優化揭秘背景
4、Cypress Headless Chrome
此鏡像包含無頭浏覽器測試流程,廠商 A 由于程式設計模型限制和運作環境不相容無法運作。而廠商 B 過慢隻能在規定時間内耗時 71.1 秒完成應用初始化。不難看出函數計算在重 I/O 的鏡像方面依然有着不錯的表現。
推理類計算依賴大體積底層訓練架構以及大量的資料處理,普通的 AI 架構如 Tensorflow 的鏡像可以輕松達到 GB 級,對 CPU 要求已經很高,要再滿足擴縮容就更是挑戰。函數計算自定義鏡像可以很好的解決此類需求,使用者隻需直接使用底層訓練架構鏡像并與資料處理邏輯打包至新的鏡像内便可以輕松省去更換運作環境所帶來的移植開銷,同時又可以滿足彈性擴縮容帶來的快速訓練結果。歌曲喜好推理、圖檔 AI 識别分析等都可以無縫與函數計算銜接以達到彈性滿足大量動态的線上推理請求。