天天看點

為什麼加速資料處理對各行各業的 AI 創新都至關重要

在各行各業,AI 正在用機器驅動的計算來推動創新。在金融領域,銀行正在使用 AI 更快地檢測欺詐行為并確定賬戶安全;電信公司正在使用 AI 優化網絡以提供優質服務;科學家正在使用 AI 開發治療罕見病的新療法;公共事業正在使用 AI 建設更清潔、更可靠的能源網絡,汽車行業正在利用 AI 使自動駕駛汽車更安全、更便捷。

為什麼加速資料處理對各行各業的 AI 創新都至關重要

資料是各種大型 AI 用例的基礎。有效且精确的 AI 模型需要使用廣泛的資料集進行訓練。企業要想利用 AI 的力量,就必須建立一個資料流,從各種來源提取資料,并将其轉換成一緻的格式并進行有效存儲。

資料科學家通過多次實驗完善資料集以微調 AI 模型,進而在真實應用中實作其最佳性能。從語音助手到個性化推薦系統,這些應用都需要快速處理大量資料,以保障實時性能。

随着 AI 模型變得越來越複雜,并開始處理文本、音頻、圖像和視訊等各類資料,滿足快速資料處理的需求變得更加關鍵。對于繼續依賴傳統 CPU 計算的機構而言,資料瓶頸、資料中心成本不斷攀升和算力不足阻礙了其創新發展和性能提升。

許多企業正轉向加速計算以将 AI 融入其業務營運中。這種方法充分利用 GPU、專用硬體、軟體和并行計算技術,将計算性能提升最高達 150 倍,能效提升高達 42 倍。

各行各業的領先企業正在利用加速資料處理來實施其開創性的 AI 計劃。

金融機構瞬間檢測到欺詐行為

由于需要對大量交易資料進行快速分析,金融機構在檢測欺詐方式時面臨巨大挑戰。此外,由于缺乏真實欺詐案例的标記資料,也給 AI 模型的訓練造成了困難。在處理與欺詐檢測相關的大量資料時,傳統的資料科學工作流缺乏所需的加速能力。這導緻資料處理緩慢,阻礙了實時資料分析和欺詐檢測。

為了克服這些挑戰,每年處理超過 80 億筆交易的美國運通使用加速計算來訓練和部署長短期記憶(LSTM)模型。這些模型用于順序分析和異常檢測,并能夠适應新資料和從中學習,是打擊欺詐的理想選擇。

利用 GPU 上的并行計算技術,美國運通大幅加快了 LSTM 模型的訓練速度。GPU 還使已經投入使用的模型能夠處理大量交易資料,以進行高性能的計算,進而實時檢測欺詐行為。

該系統可在低于兩毫秒的延遲中運作,以更好地保護客戶和商家,與基于 CPU 的配置相比性能提高了 50 倍。通過将加速的 LSTM 深度神經網絡與其現有方法相結合,美國運通在特定領域的欺詐檢測準确率提高了 6%。

金融公司還可以使用加速計算來降低資料處理成本。通過在 NVIDIA GPU 上運作涉及大量資料的 Spark3 工作負載,PayPal 證明了其有望将大資料處理和 AI 應用的雲成本降低 70%。

通過更高效地處理資料,金融機構可以實時檢測欺詐行為,進而在不幹擾交易流的情況下更快決策,并将财務損失的風險降至最低。

電信公司簡化複雜的人員調派

電信公司的各項業務産生了海量資料,包括網絡裝置、客戶互動、計費系統以及網絡性能和維護。

每天處理數百 PB 資料的全國性網絡需要進行複雜的技術人員調派,以確定服務。為了優化技術人員排程,先進的調派引擎需要執行數萬億次計算,并充分考慮天氣、技術人員技能、客戶需求和車隊分布等因素。這些操作的成功取決于細緻的資料準備和充足的算力。

AT&T 擁有美國最大的現場排程服務團隊之一。該公司正在通過 NVIDIA cuOpt 改善資料密集型人員調派,依靠啟發式、元啟發式和優化來計算複雜的車輛調派問題。

在早期試驗中,cuOpt 在 10 秒内就提供了調派解決方案,将雲計算成本降低了 90%,這使技術人員每天能夠完成更多的服務呼叫。NVIDIA RAPIDS 是一套能夠加速資料科學和分析資料流的軟體庫,它進一步加速了 cuOpt,使企業能夠內建 本地搜尋啟發式算法和元啟發式算法(如 Tabu 搜尋),以持續地優化人員調派。

AT&T 正在采用 NVIDIA RAPIDS Accelerator for Apache Spark,以增強基于 Spark 的 AI 和資料流的性能。這有助于該公司從訓練 AI 模型到保持網絡品質,再到減少客戶流失和改進欺詐檢測的營運效率全方位提升。通過 RAPIDS 加速器,AT&T 正在減少目标工作負載的雲計算支出,同時實作更高的性能并減少碳排放量。

基于電信公司對提高營運效率同時提供高品質服務的需求,加速資料流的傳輸和處理将至關重要。

生物醫學研究人員縮短新藥研發時間

研究人員對人類基因組中大約 25000 個基因進行了研究,以了解它們與疾病之間存在何種關系,這使得醫學資料和同行評審的研究論文數量激增。生物醫學研究人員依靠這些論文來縮小開發新療法的研究範圍。然而,對數量如此龐大且仍在不斷增加的相關研究進行文獻綜述,已成為一項不可能完成的任務。

領先的制藥公司阿斯利康開發了一個生物學洞察知識圖譜(BIKG),從文獻綜述到篩選命中率評級、靶點識别等整個藥物發現過程為科學家提供幫助。該圖譜将公共和内部資料庫與科學文獻中的資訊進行整合,模拟了 1000 萬至 10 億種複雜的生物關系。

BIKG 已被有效地用于基因排序,幫助科學家假設高潛力靶點以研發新療法。在今年的 NVIDIA GTC 上,阿斯利康團隊介紹了一個項目,該項目成功識别了與肺癌治療耐藥性相關的基因。

為了縮小潛在基因的範圍,資料科學家和生物學研究人員共同定義了相關标準和基因特征,以确定理想的開發療法靶點。他們訓練了一種機器學習算法,在 BIKG 資料庫中搜尋具有文獻中提到的可治療基因的特征。通過利用 NVIDIA RAPIDS 來加快計算速度,該團隊将初始基因庫從 3000 個減少到僅僅 40 個目标基因,以前完成這項任務需要耗時幾個月,但現在隻需要幾秒鐘。

通過用加速計算和 AI 助力藥物研發,制藥公司和研究人員最終可以利用醫學領域積累的大量資料,更快、更安全地開發新藥,幫助挽救生命。

公共事業公司創造清潔能源的未來

能源部門正大力推動碳中和能源轉型。在過去的 10 年裡,随着太陽能等可再生能源的使用成本大幅下降,清潔能源未來的實作取得了重大的進展。

然而,在整合來自風力發電廠、太陽能發電廠和家用電池的清潔能源時,電網管理面臨着新的複雜性考驗。在能源基礎設施多元化并且需要雙向輸電的情況下,電網管理變得更加資料密集化。是以,現在需要新的智能電網來處理汽車充電的高壓充電區,此外還必須管理分布式儲能的可用性,并适應整個電網的各種用電情況。

知名電網邊緣軟體公司 Utilidata 與 NVIDIA 合作,使用定制的 NVIDIA Jetson Orin 邊緣 AI 子產品,為電網邊緣開發了分布式 AI 平台 Karman。這種嵌入電表的定制晶片和平台将每個電表轉化為一個資料收集和控制終端,支援每秒處理數千個資料點。

Karman 處理來自電網邊緣電表的實時高分辨率資料。這使公共事業公司能夠在幾秒鐘内(而不是幾分鐘或幾小時)詳細了解電網狀況,預測用電情況,并無縫整合分布式能源。此外,通過邊緣裝置上的推理模型,電網營運商可以預測并快速識别線路故障,以預測潛在的停電,并進行預防性維護,進而提高電網的可靠性。

通過內建 AI 和加速資料分析,Karman 幫助公共事業公司将現有的基礎設施改造成高效的智能電網。這樣即可實作量身定制、本地化的電力配置設定,以滿足波動的用電需求,而無需大規模地更新實體基礎設施,進而實作更具成本效益的電網現代化。

汽車制造商使自動駕駛汽車

更安全、更便捷

汽車廠商正在努力實作全自動駕駛。為此,車輛必須能夠實時檢測物體和進行導航。這就需要高速的資料處理,包括将攝像頭、雷射雷達、雷達和 GPS 的實時資料輸入 AI 模型,以做出導航決策,確定道路安全。

自動駕駛的推理工作流非常複雜,包括多個 AI 模型以及必要的預處理和後處理步驟。傳統上,這些步驟是在用戶端使用 CPU 處理的。然而,這可能會導緻處理速度出現重大瓶頸,對于快速處理等同于安全的應用來說是不可接受的缺點。

為了提高自動駕駛工作流的效率,智能電動汽車制造商蔚來将 NVIDIA Triton 推理伺服器內建到其推理工作流中。NVIDIA Triton 是一款開源、多架構的推理服務軟體。通過整合資料處理任務,蔚來在一些核心領域将延時降低至原來的 1/6,并将總體資料吞吐量提高最多達 5 倍。

蔚來以 GPU 為中心的方法使更新和部署全新 AI 模型變得更容易,并無需對車輛進行任何改動。此外,該公司還可以在同一組圖像上同時使用多個 AI 模型,而無需通過網絡來回發送資料,進而節省了資料傳輸成本并提高了性能。

通過使用加速的資料處理,自動駕駛汽車軟體開發人員可確定他們能夠達到高性能标準,以避免交通事故,降低運輸成本,進而助力使用者更好地出行。

零售商提升需求預測能力

在快節奏的零售環境中,快速處理和分析資料的能力對于調整庫存水準、個性化客戶互動和動态地優化定價政策至關重要。零售商的規模越大,銷售的産品越多,其資料操作就越複雜,同時計算密集程度也更高。

世界上最大的零售商沃爾瑪通過使用加速計算,顯著地提高了對其 4500 個商店中 5 億種商品組合的預測準确性。

随着現有的計算環境開始出現無法完成工作或産生不準确結果的問題,沃爾瑪的資料科學團隊建構了更強大的機器學習算法,以來應對這一巨大的預測挑戰,他們發現,資料科學家必須從算法中删除一些特征,才能順利運作。

為了改進預測,沃爾瑪開始使用 NVIDIA GPU 和 RAPIDS。該公司現在使用的預測模型擁有 350 種資料特征,可以預測所有産品類别的銷量情況,包括銷售資料、促銷活動以及影響需求的外部因素(如天氣狀況和超級碗等重大活動)。

先進的模型幫助沃爾瑪将預測準确率從 94% 提高到 97%,同時消除了約 1 億美元的生鮮産品浪費,減少了缺貨和降價的情況。GPU 運作模型的速度也提高了 100 倍,隻需 4 小時即可完成各項作業,而這在 CPU 環境中則花費數周的時間。

通過将資料密集型操作轉移到 GPU 和加速計算,零售商可以降低成本和碳排放量,同時為消費者提供最适合的選擇和更低的價格。

公共部門提高防災能力

無人機和衛星拍攝了大量航空圖像資料,公共和私營機構則使用這些資料來預測天氣模式、追蹤動物遷徙和觀察環境變化。這些資料對研究和規劃非常寶貴,可以幫助農業、災害管理和應對氣候變化等領域做出更加明智的決策。然而,如果缺乏特定的位置中繼資料,則這些圖像發揮的價值可能會受到限制。

與 NVIDIA 合作的一家美國機構正在探索一種方法來自動确定缺少地理空間中繼資料的圖像位置,這對搜救、應對自然災害和監測環境等任務至關重要。然而,使用沒有中繼資料的航空圖像識别更大的區域内的一塊小區域,這種挑戰有如大海撈針。設計有助于地理定位的算法,必須解決圖像光照的變化以及在不同時間、日期和角度拍攝圖像所造成的差異。

為了識别無地理标記的航空圖像,NVIDIA、Booz-Allen 公司和當地政府機構合作開發了一種解決方案,即通過使用計算機視覺算法從圖像像素資料中提取資訊,以解決圖像相似性搜尋問題。

在試圖解決此問題時,一位 NVIDIA 解決方案架構師首先使用了基于 Python 的應用程式。最初在 CPU 上運作時,其處理時間超過 24 小時。而 GPU 可将處理時間壓縮到僅幾分鐘,且并行執行數千個資料操作,而在 CPU 上隻能執行少量操作。通過将應用程式代碼轉移到開源 GPU 加速庫 CuPy 中,該應用程式驚人地提速了 180 萬倍,在 67 微秒内就傳回了結果。

借助可以在幾分鐘内處理大面積陸地圖像和資料的解決方案,各個組織或機構就可以獲得其所需的關鍵資訊,進而更快、更有效地應對緊急情況,并積極主動地制定計劃,進而有望挽救生命、保護環境。

加速 AI 計劃,傳遞業務成果

使用加速計算進行資料處理的企業正在推進 AI 計劃,以實作其在業内更高水準的創新并取得更好的成果。

加速計算可以更高效地處理大型資料集,更快地實作模型訓練和精選的優化算法,并為實時 AI 解決方案提供更精确的結果。

與基于 CPU 的傳統系統相比,使用加速計算的企業可以實作更高的成本效益,并增強其向客戶、員工和合作夥伴提供卓越結果和優質體驗的能力。

了解加速計算如何幫助組織機構實作 AI 目标并推動創新,請通路:

掃描下方海報二維碼,立即觀看在 NVIDIA AI Summit 的精彩視訊,了解生成式 AI、工業數字化、機器人、大語言模型等領域的行業上司者對 AI 的寶貴見解,探索 AI 時代的無限可能。

繼續閱讀