一場突如其來的疫情打破了人類社會運作的原有模式,也在方方面面改變了原有的規則。資料分析領域在這次疫情中也受到了同樣的沖擊。
大波實體經濟因為“封城”原因轉到線上,這一方面加速了傳統行業的資料化程序,另一方面也帶來了巨大的挑戰。
從線下轉到線上是許多受疫情沖擊企業的自救模式,但是這些平時線下業務為主的企業,突然轉到線上,難免會出現“水土不服”的現象。整體資料規模的擴大,讓所有公司的資料量級都更大、更複雜,如何能夠有效做好資料分析,并基于這些資料做好決策,更好的服務客戶,是所有轉型線上+線下模式的公司在後疫情時代面對的最大問題。
如何應對?
專注資料分析40多年、服務全球超過20,000家客戶,老牌資料分析公司SAS給出的答案是:依靠正确的技術,用好奇心改變世界。
在2021年SAS Global Forum上,SAS首席執行官Jim Goodnight表示:“将資料轉化為決策進一步滿足了人們的好奇心,并揭示了新的可能性。與我們的客戶和合作夥伴一起,我們敢問:'如果用另一種方式呢? 作為回報,我們的客戶提高了效率和收益,同時使這個世界更安全,更強大和更有彈性,實作了SAS的承諾。”
SAS首席執行官Jim Goodnight
**
十年一劍,SAS Viya始于大規模資料分析**
事實上自誕生之日起,SAS一直緻力于大規模資料的分析解決,也從不懼變化帶來的問題。
在2021 SAS Global Forum上,Jim Goodnight首次披露了SAS備受好評的AI平台——SAS Viya的誕生背景及十多年來其随着時代變更的過程。
“2009年,我們在和一家新加坡銀行合作的過程中了解到,他們進行一次業務上的風險計算需要18個小時完成,這對他們的決策産生了很大的影響。是以,我們開始思考如何減少計算處理和處理大資料所需的時間。并設計了一個儲存在記憶體中的系統。”
沒有使用大多數平台采用的Hadoop方案,SAS選擇自主研發了最新的分布式計算方式,讓資料分析可以分布在數十個或數百個核心中同時進行。Goodnight在演講中表示:“我們希望消除SAS技術和底層硬體的限制。”
這就是SAS Viya的誕生過程,2009年推出的這一分布式計算引擎将新加坡銀行的18小時風險分析計算壓縮到了15分鐘。十多年來,SAS Viya已經更新了四代,在第三代産品中,它“已成為市場上性能最快的産品”,最新版本4已于2020年11月釋出。
“Viya從一開始就從設計上追求性能、速度和大規模資料。一旦進行了資料分析并建立了模型,就可以立即在生産環境中運作它。市面上其他競争對手一般需要進行程式設計語言變更,但我們不需要。”
在最新的産品中,那項最初需要18個小時分析完成的風險技術任務現在隻需要15分鐘就可以完成。
應對全球數字化程序,SAS給出兩大對策
回到最開始的問題,如何在後疫情時代解決企業大規模資料分析問題?
在SAS Global Forum前的新聞釋出會上,SAS首席技術官Bryan Harris給出了兩大解決政策。
分析無處不在:收購英國Boemska公司,結合雲原生能力
Harris提出的第一個解決方案是:讓分析無處不在。
為了實作随時、随地進行資料分析,SAS做出了一系列努力。今年年初,SAS宣布收購英國Boemska公司,加速人工智能在雲計算方面的努力,進一步将SAS和開源模型移植到移動和企業應用程式中,這結合了下一代雲原生功能,也将低代碼和無代碼技術融入産品中,開發和執行模型和決策,以執行特定任務,例如預期欺詐,與醫療事件有關的決策,識别制造缺陷等等;此外,還能同時確定Microsoft Azure等雲上分析更加高效經濟。
SAS Viya在2020年SAS Global Forum上就宣布了與微軟的戰略聯盟。當時,微軟首席執行官Satya Nadella在談到與SAS的合作時說:“在後疫情的世界中,客戶,員工等的期望正在發生變化,分析在這裡将變得很重要。” Nadella稱:“啟用資料使(每位員工)能夠使用預測和分析能力将對業務績效産生直接影響。” “通過幫助實作這一目标,我們可以加快客戶轉型。”
2020年SAS Global Forum上,微軟首席執行官Satya Nadella與SAS首席執行官Jim Goodnight對談
今年,SAS進一步擴大了合作夥伴關系,Harris宣布将增加AWS和Google Cloud作為雲選項。其還與Red Hat(IBM)合作,在混合雲中運作SAS産品,其Kubernetes版本還将囊括阿裡雲、騰訊雲、華為雲等。
“客戶可以靈活地在本地、上雲,混合雲實施技術方案。” Harris表示。
人人都可以使用分析的力量:低代碼+無代碼趨勢
除了随時随地進行資料分析,SAS還緻力于讓資料分析成為人人都可以使用的工具。
為了實作這一目标,SAS将低代碼和無代碼融入了産品中。
其實早在2001年,大資料和資料分析起步之時,SAS就将低代碼和無代碼操作融入産品設計中,當時SAS已經從專有代碼轉向簡易操作平台,這也是機器學習自動化的最早形式。
在2018年釋出的SAS Viya版本中,已經完成了算法自動化上的設定,表現了對AI和機器學習自動化程式這一新聚焦點的全面擁抱——AI分析植入和自動化;更加透明的結果輸出;更好地資料治理功能;使用者體驗地提升;更加開放,支援更多分析工具。
在本次峰會後的采訪中,Harris告訴《大資料文摘》,SAS的客戶正在整個企業中部署數十種、數百種甚至數千種模型。低代碼、無代碼環境通過增加分析生命周期的參與來提高組織的靈活性。客戶在新的數字化時代的競争優勢有多大,取決于公司能夠以多快的速度識别機會、開發模型,并将這些模型合并到決策流中,然後将決策流內建到任何業務流程或任何應用程式中。
針對資料驅動決策的實時和有效,Harris還在采訪中給出了一些SAS産品的使用建議:
制定資料驅動的決策,首先需要及時将實時資料或接近實時的資料納入決策制定過程。在運作時,必須在特定情況下及時做出決策評估。SAS智能決策支援多種實時資料源,包括流資料,以確定可以以适當的粒度應用決策邏輯。當與 SAS 資訊目錄結合使用時,系統可以識别潛在的資料異常和分布不一緻,以及不應被共享的潛在私人資訊。
在模型建構過程中,SAS Visual Machine Learning 允許資料科學家在将模型部署到生産中之前識别潛在的偏差區域。無論是多數人群或少數群體,不管是公司還是代理機構,最終使用者不僅能使用,還能夠了解“為什麼”使用某個模型。關于生産中的潛在偏差,SAS 模型管理器允許跨各種名額和次元進行偏差檢測,查找與總體相比的資料和模型偏差。
部署決策或模型後,好的資料驅動還會持續根據最新資料驗證性能。在SAS Model Manager和SAS Intelligent Decisions中,資料治理可自動應用于模型和業務規則,以跟蹤更新資料,在必要時進行監測、驗證和重新訓練。新的最優模型和修改後的業務規則可以輕松部署到生産中。
結語
疫情加速了各類企業的數字化程序,根據SAS在 2021 Global Forum上公布的資料我們可以看到,在各行各業,資料分析和軟體都在滲透。後疫情時代,SAS也已經做好了全面的準備應對資料化程序的加速。
在采訪中Harris表示,短期内,我相信我們将看到傳統行業對AI的使用會大大增加,以幫助公司跨結構化、非結構化、流式傳輸、圖像音頻、視訊等各種資料集做出更好的決策。從長遠來看,我認為我們将看到合成資料的巨大機會,以支援現實世界中客戶環境的複雜模拟。從AI的角度來看,這将大大降低資料擷取成本并進一步加速創新。
不止提升合作夥伴的工作效率,SAS還相信可以通過Viya這款産品用資料分析造福世界,Goodnight今年也線上示範了SAS Viya低代碼、無代碼分析的能力。他在演講中公開示範了如何使用多種機器學習模型,預測由于新冠疫情患者人數增加而導緻的床位緊張,在示範中,該計算機在30分鐘内完成了在Microsoft Azure上的配置,通過并行處理完成了大規模資料分析,并通過簡單的“拖-拽-點選”等無代碼操作建立了一個機器學習流程。