公司簡介
圖森未來(TuSimple)成立于2015年,是一家專注于L4級無人駕駛卡車技術研發與應用的人工智能企業,已經實作卡車在幹線物流場景和半封閉樞紐場景下的無人幹預駕駛。圖森未來品牌旗下産品——圖森未來 L4 級别無人駕駛卡車能夠實作環境感覺、定位導航、決策控制等自動駕駛核心功能,可應用于高速公路貨運和港内集裝箱碼頭運輸及其相似場景。
公司于2019年9月完成總額2.15億美元D輪融資,資方:UPS、鼎晖資本、萬都中國、累計融資超過3億美元,最新估值超過12億美元,是卡車無人駕駛頭部企業,也是全球第一家無人駕駛卡車獨角獸企業。

業務痛點
-
GPU使用率不高
一台車自動駕駛卡車,兩個星期會産生大約50TB的資料。圖森未來目前有超過70台卡車在上路,意味着每天有大量的資料産生。為了讓自動駕駛卡車更聰明,就需要不斷地積累更多的真實資料集訓練它目标檢測與物體識别架構的能力。 随着業務高速發展,疊代越來越快,圖森未來的模型也越來越複雜。每次模型疊代,都需要短時間排程大規模的GPU資源來分布式地進行模型訓練。 然而,GPU伺服器采購成本高,運維複雜,圖森未來不得不投入越來越多的精力到運維工作中;更重要的是,圖森未來發現,随着所用GPU數量增長,GPU的使用率卻并不高。
-
模型訓練需求算力波動大
每次疊代的模型訓練完成之後,圖森未來需要對優化後的模型進行測試。如果每次都要上路測試,成本大、風險高、而且不能驗證各種極端情況。 幸虧,圖森未來有個汽車仿真平台,模拟在各種環境下(例如:晴天、陰天、雨天、霧霾天、夜晚),模型的處理能力。 這種測試任務依賴開發人員的開發節奏,具有突發、臨時、短期的特征,并且需要的算力規模非常大,如果包年包月地購買海量算力,則很多時候都處于閑置狀态,需求來了可能算力又不夠用,仿真模拟任務需要排隊完成,影響開發人員的開發效率和模型的疊代速度。
解決方案
理論上來說,GPU卡越多,整體算力越大,但是随着機器數的增加,不同機器的GPU之間的配合難度會越來越大,單張GPU卡的使用率反而會下降。是以增加了幾十倍的卡的成本,但是性能卻很難随之線性增長。 于是,阿裡雲的飛天AI加速器AIACC團隊,針對圖森未來的場景,在底層針對通訊、計算、時延和帶寬等做了深度優化,将訓練性能提升了将近60%,大大縮短了圖森未來的模型優化時間,加速模型疊代,提高技術門檻。
由于圖森未來的整體業務架構早已實作容器化,為這類臨時高峰場景做好了靈活的業務儲備。通過阿裡雲ASK(Alibaba Cloud Serverless Kubernetes)容器服務,圖森未來可以在需要測試的時候,在阿裡雲上秒級啟動大規模的容器叢集,即刻擷取海量算力,縮短了60%的模型測試時間;完成測試之後迅速釋放算力,避免資源浪費。 阿裡雲ASK是Serverless免運維的K8s容器服務,底層使用阿裡雲ECI(Elastic Container Instance彈性容器執行個體)作為容器計算基礎設施,提供高彈性、低成本、免運維的Serverless容器運作環境,免去使用者對容器叢集的運維和容量規劃工作,大大節省了圖森未來運維的工作量。 另外,ASK的計費粒度精确到秒,非常适用于仿真計算這類突發的高并發短時任務;針對長期的訓練任務,圖森未來則使用包年包月的ACK(Alibaba Cloud Kubernetes)。通過适用于長短任務的ACK+ASK産品搭配,即提升了圖森未來的資源使用率,又節省了成本。
上雲價值
- 将圖森未來訓練性能提升了将近60%,大大縮短了圖森未來的模型優化時間,加速模型疊代,提高技術門檻。
- 縮短了60%的模型測試時間,完成測試之後迅速釋放算力,避免資源浪費。
- 免去使用者對容器叢集的運維和容量規劃工作,大大節省了圖森未來運維的工作量。
- 通過适用于長短任務的ACK+ASK産品搭配,即提升了圖森未來的資源使用率,又節省了成本。
相關産品
-
容器服務 ACK
容器服務 Kubernetes 版(簡稱 ACK)提供高性能可伸縮的容器應用管理能力,支援企業級容器化應用的全生命周期管理。整合阿裡雲虛拟化、存儲、網絡和安全能力,打造雲端最佳容器化應用運作環境。
更多關于容器服務 ACK的介紹,
參見容器服務 ACK産品詳情頁。
-
飛天AI加速引擎
飛天AI加速引擎是AIACC業界首個統一加速Tensorflow、MXNet、Caffe、PyTorch等主流深度學習架構的加速引擎,拿下斯坦福深度學習榜單Dawnbench圖像識别四個世界第一。
更多關于飛天AI加速引擎的介紹,
參見飛天AI加速引擎幫助文檔。-
容器服務Serverless Kubernetes版
Serverless 容器服務是一款基于阿裡雲彈性計算基礎架構,同時完全相容 Kuberentes 生态,安全、可靠的容器産品。通過該産品,您無需管理和維護叢集,即可快速建立 Kuberentes 容器應用,并且根據應用實際使用的 CPU 和記憶體資源量進行按需付費,進而使您更專注于應用本身,而非運作應用的基礎設施。
更多關于容器服務Serverless Kubernetes版的介紹,
參見容器服務Serverless Kubernetes産品詳情頁-
彈性容器執行個體ECI
阿裡雲彈性容器執行個體(Elastic Container Instance)提供安全的Serverless容器運作服務。您無需管理底層伺服器,隻需要提供打包好的Docker鏡像,即可運作容器,并僅為容器實際運作消耗的資源付費。
更多關于彈性容器執行個體ECI的介紹,
參見彈性容器執行個體ECI産品詳情頁