前瞻打造超級「怪獸」，商湯想要馴服AI長尾一 56億的超級「怪獸」二馴服長尾，SenseCore 的底層邏輯三潛力初綻四走向開放

目前展示的人工智能（AI）特技已經被行業解決方案所取代。人工智能正在改變每個行業，人工智能從天而降，将改變周圍的一切，改變每一個行業。

為了加速人工智能向行業角落的滲透，必須降低人工智能的啟用成本，降低使用障礙。尚唐認為，整個行業需要一個更加通用的模型，用一個模型來支撐更多的任務，在一般的模型做小場景模型時，成本就會降低。然而，模型越通用，通常需要的資料和計算就越多，這是Mercial Soup建構的ai裝置的底層邏輯。

2020年4月，國家發改委在例行新聞釋出會上首次明确了"新基礎設施"的範圍，将資料中心和智能計算中心作為計算基礎設施納入新基礎設施。智能計算中心也成為中國科技公司近年來一直在推動的一個項目。

在去年的世界人工智能大會上，商唐宣布将在上海布局一個人工平台，總投資超過50億元，主要由商唐本人出資。與傳統的IDC不同，這個超公司中心滿足了人工智能時代高互動和高吞吐量的需求。

編寫|吳偉

"我真的很喜歡這個AR導航功能，它真的很友善。香港的一位朋友很高興看到谷歌推出其AR室内導航服務。

對于像他這樣的道路盲人來說，進入城市綜合體是一個挑戰。他因為要找車，在武漢一個大型城市綜合體的地下車庫（三層）裡迷路了，并抱怨說，由于上海一家商場的訓示不明，找不到附近的廁所。

這一次，"悲劇"不會在成都國際金融中心"上演"。從地下停車場到購物中心樓層，隻需打開"ARgo增強型實時導航"，然後用手機掃描周圍環境，即可通過AI Vision立即識别位置。

上唐科技以成都IFS高達46萬平方米的面積進行大規模3D地圖重建，結合實時定位和地圖建構（SLAM）等技術，定位成功率高達99%，定位精度可達"厘米"級，單次可達"毫秒級"級，且不會出現偏移、閃耀等條件。

如果按照傳統的定制服務去做，成本會非常高，甲方很可能被價格吓倒，隻有降低成本，提高部署效率，甲方才會付出代價，否則，他們隻會優先考慮頭部需求。

這一切背後最大的貢獻者是商唐打造的人工智能基礎設施——Business Tang SenseCore（"AI Big Device"）。

<h1級"pgc-h-right-arrow"資料跟蹤"12">56億的超級"怪物"</h1>

在上海面向港口的新區，矗立着人工智能資料中心AIDC。這座晶片狀建築占地面積約5.8萬平方米，總投資約56億元，屋頂僅用了168天就圓滿完工，預計2021年底投入試運作。

上塘科技人工智能計算中心效果圖

與傳統的網際網路資料中心（IDC）不同，這個超級公司中心滿足了人工智能時代高互動和高吞吐量的需求。完成後，AI計算的峰值将為3740 Petaflops（1 petaflop等于每秒10萬億次浮點運算）。

它可以支援同時通路850萬個視訊，同時滿足四個人口超過2000萬的特大城市的使用;

算法的強算術是火，至于食物是如何煮熟的，在一定程度上取決于火的控制。目前，人工智能在技術上已經達到了非常高的水準，一個重要的瓶頸是計算功率跟不上工業發展的需要。

然而，這個AIDC隻是商業湯的"AI大裝置"的一部分，但不是全部。與普通程式設計不同，算法開發是一種系統工程，需要平台級産品，這些産品可以協同工作以優化資料，算法和計算。"大裝置"還包含三層。

算術層主要基于上塘在建的智能中心（AIDC），相容AI晶片和AI傳感器的強大功能。

平台層，除了資料平台之外，還內建了原有的深度學習訓練架構、推理部署引擎和模型生産平台，通過資料存儲标簽、模型訓練部署、業務系統全鍊路、批處理。

算法層，包括各種算法工具箱，不僅是城市交通、公園等高頻應用場景算法，還有火災、垃圾檢測等長尾低頻算法。

SenseCore還包括一個工業級算法模型生産平台，可以将訓練的大型模型應用于不同的行業和場景。

"AI大裝置"可以将人工智能算法的整個生産過程變成一條管道，可以根據工業流程批量生産算法。上塘已使用該系統生産了17，000多個型号，并用于各個領域。

然而，"AI大裝置"的推出絕不是一次性的。自2016年以來，商唐一直在做很多探索，試圖重做深度，觸及硬體的底部。

例如，在其存在的早期，商唐開始建構底層算法平台。尚唐認為，自身底層算法平台的完善，保證了在進入任何一個新興行業時，都能将投入産出比降到最低，以最低的成本達到最佳效果。

當時，上唐甚至在總部辦公樓犧牲了辦公空間，打造了核心機房的原型，總投資近7億元，用于項目前期研究。

"AI大裝置"在AI行業，就像福特管道在行業内一樣。這種"AI管道"支援不同場景下算法模型的底層抽象，通過子產品化平台套件建立通用服務平台。

特别是，對于AI落地中尾部較長的客戶和場景，可以基于不同算法套件的組合對新場景進行定制，以較低的邊際成本實作新場景的規模覆寫。

< h1類"pgc-h-arrow-right"data-track""28" > II 馴服長尾，senseCore的底層邏輯</h1>

在商唐看來，這是未來必須邁出的一步。無論一家技術公司做什麼，它最終都展現了商業能力。

目前，視覺AI市場企業的主要業務可分為三大類：硬體、定制服務和軟體業務。人工智能軟體業務的毛利率最高，但這類業務往往占最小的百分比。雖然複制力不強，服務成本居高不下，但對于政府、國有企業等大型企業來說，定制化服務業務占比最大。

來自許多自然系統的資料通常是淩亂的，長尾的，不可預測的，甚至是高熵的，由此産生的工作量已被證明是人工智能企業難以節約的主要原因。

例如，檢測工廠場景中的元件和醫學圖像中的病理特征本質上是檢測，但落在不同場景中的同一算法演變成非常不同的版本，對技術的積累提出了巨大的挑戰。

獲得準确的結果需要大量的資料、實驗和參數，而任務和場景的微小變化需要對模型進行回憶、标記和訓練。

特别是，在2020年，政府将提出一項新的基礎設施戰略，這将掀起新一波的人工智能業務。商唐與各城市博物館合作推出的智慧城市治理平台，以及醫院推出的智慧診療項目，都是新的基礎設施項目。

随着業務進入新基建業務的語境，城市長尾資料分布下的目标檢測性能問題更加"無法到達"傳統的單任務、流量大、參數規模較低的"基礎設施"。

過去算法性能的提高依賴于手動标注，現在數十億甚至數百億量級的資料，又如何還能依靠人工标注呢？

識别跳傘的人、車後扛箱子的人、倒在路中間的樹等零碎、極端長尾的場景，足以難以倒車無人駕駛汽車;

在城市管理過程中，需要人工智能從不同的組合中學習并建立反應政策。上塘CEO徐立曾解釋，每個人平均每天觸摸600個物體，隻考慮三種物體組合，超過3500萬種組合，不同的場景組合可以被了解為識别完全不同的結果。

如何高效合理地解決這許多細節，被上唐視為人工智能深入行業最重要的一點，這反過來又需要新一輪的突破和創新。

從本質上講，長尾就像一把尺子來衡量問題的複雜性，這表明我們想要自動化人工智能生産。許多領先的機器學習組織也運作（甚至設計）自己的機器學習叢集。

在尚唐看來，這一次，整個行業需要一個更加通用的模型，用一個模型來支援更多的任務。模型的通用性越高，通常需要的資料和計算就越多，這是在商業湯中建構AI裝置的基本邏輯。

"要解決特定行業對多場景長尾算法的需求，需要足夠的資料，足夠的計算，來訓練一個足夠大的通用模型，然後在通用模型下做一個小場景模型，成本降低。"上塘科技聯合創始人楊帆說。

近年來，AI對"風向"進行了研究，呈現出從"大煉化模式"到"煉油模式"的趨勢。

通過設計先進的算法，整合盡可能多的資料，彙集大量的計算能力，對大型模型進行密集訓練，供大量企業使用。這些模型具有很強的泛化能力，可用于許多具有非常不同的内部原理的不同任務。

例如，文本生成模型 GPT-3 具有 1750 億個參數的天文數字，其資料集總數是 GPT-2 早期釋出的資料集總數的 116 倍，是迄今為止最大的訓練模型的 116 倍。GPT-3正文生成，泛化能力強，可用于多種任務。除了寫圖紙、打字碼、玩遊戲等，還被網友玩了50多種新用法。

更值得注意的是，即使使用最新的專用深度學習計算硬體和分布式計算方法，這些前所未有的大量訓練參數（例如1.75萬億個參數水準）也很困難，進而對基礎設施提出了更高的要求。例如，硬體晶片和超級計算機的計算能力。

AlphaFold2在短短幾個小時内确定了蛋白質的三維結構，為了訓練算法，Alphafold使用了一個包含170，000個蛋白質結構的資料庫，并使用大約128個TPUv3核心（相當于100-200個GPU）運作了數周。

上塘在上海臨港建立的人工計算中心是目前亞洲最大的人工智能計算中心，作為參考，GPT-3完成訓練一次需要3.14E23次浮點運算，而上塘臨港AIDC的計算能力可以在短短一天内完成。

<h1級"pgc-h-right-arrow"資料軌道""49">三個潛力開始綻放</h1>

今天，這個大型AI裝置開始工作。

在大型裝置的幫助下，商唐在超大模型技術的研究方面取得了一些成果。例如，在計算機視覺的卷積神經網絡（CNN）中，模型參數通常小于1億，但SenseParrots，商業湯的深度學習訓練架構，支援訓練50億個參數化的超大視覺模型。一旦 aidC 完全投入運作，對超大視覺模型訓練參數的計劃支援可以達到更高的數量級。

6月，成都國際金融中心（成都IFS）推出全國首個全場景城市綜合體AR導航。不僅首次從地下停車場到所有品牌專賣店、服務設施及配套寫字樓、酒店、服務式較高價的電梯大廈的整個AR導航指南，還為品牌租戶包括AR禮券、新産品推薦、主題活動推廣等豐富的營銷功能，還為紅色地标性大熊貓戶外藝術裝置I AM HERE設計了專屬的打卡路線。

無論是多功能還是可擴充，Commercial Soup的解決方案都是高度可擴充的，可以在短時間内快速部署。其中，資料平台可以幫助降低資料的生産成本，而生産平台和訓練架構以及部署能力的整合，可以實作模型的快速選擇、優化和封裝。通過AIDC計算，可以大大提高服務效率。

據介紹，平台層在內建了原有的商務湯算法，打造了SenseParrots的訓練架構，可以高效利用GPU叢集計算能力，訓練單個大型模型在kcal上可以達到90%以上的加速效率，達到單卡900倍的效果，遠遠高于開源方案。

"我們幾乎所有的研究都是基于這種大型裝置，"上塘聯合創始人林大華說。它為進行算法研究的學生提供了足夠的算術，使他們能夠快速進行實驗。此外，大單元積累的效用縮短了創新的驗證周期。

除了"個人生活"，人工智能裝置也在推動城市治理中從人密集型到人機互動的治理。

2020年，上海市長甯區和上塘科技試點"AI-one網絡管理"。通過AI場景分割等技術将全區1000個攝像頭轉化為智能感覺神經元，将中心城市最集中的垃圾曝光、單車停車等事件實作二級發現，推送到電網從業人員的政府微信立案。

處置後，在規定時間内，錄影機到該位置重新檢測，如無問題可上報平台完成案例，完成整個事件處理過程智能化。

自系統運作以來，電網使用者數量達到100多人，完成率達到70%，超過一半的事件在4小時内完成處置，最快從識别到處置需要20分鐘。

尚唐還與恒大地産、藍光嘉寶合作，推動社群"從0到1"智能更新，解決降低物業管理成本和效率的問題。

例如，針對近年來居民比較關注的電池轎廂進入電梯、高空抛物線等不文明行為，恒大地産集團、恒大高新集團通過商用湯業提供的人工智能技術實作有效管理。

尚唐還與瑞士迅達電梯簽署戰略合作夥伴關系，打造自動扶梯安全智能響應系統，提供覆寫自動扶梯入口、自動扶梯區域、自動扶梯出口的全場景安全管理協助。

例如，在自動扶梯區域，系統會在乘客跌倒時發出警報以停止梯子，或實時提醒他們注意不安全行為，例如逆行行為。如果系統在自動扶梯區域内檢測到沒有乘客，還可以通知從業人員遠端停止梯子，進而降低營運成本。

< h1級"pgc-h-right-arrow"資料軌道""64">周四開市</h1>

高通全球業務發展副總裁沈進曾表示，像上塘科技這樣的巨頭将成為并且正在成為人工智能平台級公司，它将是一個"電站"，中小初創企業的"電"會很好，不需要自己發電。

麻省理工學院計算機科學與人工智能實驗室的研究員Neil Thompson及其同僚分析了1，058篇AI論文，發現機器學習的計算需求遠遠超過硬體改進或模型訓練效率。在這條道路上，該系統有朝一日将花費數億甚至數十億美元的教育訓練費用 - 以及其他成本。

"使用更多GPU的問題在于，每次将GPU數量增加一倍時，成本就會翻倍。湯普森說。

在從事高端深度學習的大學中，"計算機技能較弱的大學比例越來越小"。"仍然有不少人可以玩這個遊戲，但随着計算負擔的增加，玩家的數量變得越來越少。

是以，從全社會的角度來看，人工智能基礎設施将從内部平台演變為開放服務，并最終成為整個生态和社群的整體公共設施。

這也是企業走向開放的潛在驅動力。要想讓AI賦能産業，就不應該單單依靠AI企業，而應該打通整個行業生态，讓更多的人參與到傳統行業的AI轉型中來。

商用湯不僅開源算法，還推出了開源生态，OpenMMLab開源算法系統已經在GitHub上獲得了超過37000顆星。基于超級公司中心巨大的計算能力，商唐未來将能夠為客戶和合作夥伴輸出更多底層AI核心能力。

中國在這方面還有很長的路要走，包括晶片、人工智能超級公司平台、深度學習平台等基礎層。未來，商唐不會專注于解決特定場景中的問題，必須專注于潛在的原創能力。這也是面向未來的商業湯的長期核心競争力，而這種長期競争力的建立在一段時間内，構成了屏障和護城河。

幾十年前開始的人工智能創新，終将超越這個時代。無論是THEDC還是開源生态學，它隻是未來恒星之海的開始。

前瞻打造超級「怪獸」，商湯想要馴服AI長尾一 56億的超級「怪獸」二馴服長尾，SenseCore 的底層邏輯三潛力初綻四走向開放

繼續閱讀

為了看看AI有多強，有人帶它玩了一次“劇本殺”

硬體丨 AMD預計最早2023年推出整合AI引擎的CPU

聲音為什麼适合打造品牌強化心智

第7代高通AI引擎：透過AI，看見未來

5分鐘攝像頭抓拍一次，居家一天至少89次！尚德員工：連廁所都不敢上

玩了一場劇本殺，同車隊友“不是人”

2022樂橙新品釋出會：14款新品齊發軟體硬體全面更新

有沒有給視訊配音的軟體？分享能給視訊配音的軟體

别讓ChatGPT跑了

梗圖搜尋神器來了！還能搜視訊，網友：找了六年的梗圖兩分鐘解決

用ChatGPT作弊，小心被抓，反剽竊水印技術讓學生噩夢提前到來

谷歌“狂飙”生成式AI賽道，最新模型可憑文字、圖檔“創作”音樂

ChatGPT發瘋怎麼辦？小冰李笛：兩個關鍵，我可破之

體驗再次刷屏的ChatGPT：還會算錯題，但邏輯更強了

小紮親自官宣Meta視覺大模型！自監督學習無需微調

CV圈又炸了？小紮高調官宣DINOv2，分割檢索無所不能，網友：Meta才是“Open”AI

前瞻打造超級「怪獸」，商湯想要馴服AI長尾 一 56億的超級「怪獸」 二 馴服長尾，SenseCore 的底層邏輯 三 潛力初綻 四 走向開放

繼續閱讀

前瞻打造超級「怪獸」，商湯想要馴服AI長尾一 56億的超級「怪獸」二馴服長尾，SenseCore 的底層邏輯三潛力初綻四走向開放