“如果把神經網絡的層數從10增加到50,輸出結果可以更好一點嗎?……再高一點呢?”
美國丹佛市當地時間4月8日晚,在SAS 2018全球論壇(SAS Global Forum 2018)的開幕演講中,年近八旬的SAS創始人兼CEO Jim Goodnight,與SAS年輕的資料科學家Jonathan一起,合力上演了一幕程式員的辦公室日常噩夢:
焦急等待結果的挑剔老闆,和嘗試各種模型來輸出更好結果的絕望程式員。

SAS創始人兼CEO Jim Goodnight在SAS 2018全球論壇開幕演講中示範SAS®ViyaTM最新版本
面對6300位來自世界各地的SAS使用者,SAS®ViyaTM最新版本在Jonathan的操作下顯示出了強大的機器學習能力:資料可通過拖拽直接載入;不同模型、甚至神經網絡層數的調整都可以通過點選實作;輸出隻需要幾秒鐘;結果的優化從面闆顯示的數字上一目了然。
而出現在開幕演講中,這一場景的設計遠比展示最新産品效果更加意味深長:它代表着SAS正在擴充自己的使用者群體——不再隻是傳統的程式員、科學家,它瞄準的是不太懂程式設計,但看好并急于進行資料和人工智能轉型的公司高層。
斯坦福大學教授李飛飛曾公開表示:人工智能、機器學習仍然是一個進入門檻高的領域,需要大量專業知識和資源,而很少有公司自己能負擔得起這些資源。今天,雖然AI能為企業提供無數的益處,但由于資源稀缺,多數企業還無法開發個性化的模型。
SAS®ViyaTM最新版本在算法自動化上的設定顯然是奔着解決這一痛點而來。
本次大會上,SAS表現了對AI和機器學習自動化程式這一新聚焦點的全面擁抱。SAS分析産品部負責人Saurabh Gupta在次日釋出了ViyaTM最新版本,并解釋了其一系列新特點:AI分析植入和自動化;更加透明的結果輸出;更好地資料治理功能;使用者體驗地提升;更加開放,支援更多分析工具。
來自加拿大的SAS資深使用者、Mcdoougall Scientific公司的副總裁John Amrhein對這最新版本ViyaTM操作的“便利性(ease)印象深刻:“支援各類資料格式,而且通過拖拽點選就可以實作各種模型的調整,非常高效。”這一友好的使用者界面可謂SAS本次全球論壇中的最大亮點。
2018年4月8日至11日,SAS 2018全球論壇在美國丹佛召開
對于自動化,除了便利性,參會使用者對于最新的分析工具也有一些反思。“太過簡單的工具也可能會讓人忽略資料的重要性”,加拿大的獨立咨詢顧問、SAS資深使用者Peter Eberhardt非常認可ViyaTM産品的優質性能,但也向大資料文摘表達了自己的擔憂:很多使用者因為工具太簡單,反而會不認真思考資料的品質。
“我曾經見過一個廣告領域的客戶,輸入的資料真的非常差,但是因為工具好是以跑出來的模型很棒,客戶會是以覺得資料其實也不錯。”
“好的資料非常重要。”正是以,Jim Goodnight在采訪中一直強調資料清洗和管理的重要性,而他自己也一直以一位“統計學家”自稱。
專注資料四十年,SAS分析經驗的全球化輸出
盡管扮演了一位“技術盲”的挑剔老闆,Jim Goodnight的資料分析能力絕不弱于他身邊的資料科學家:四十多年前,他在美國北卡羅來納州立大學進行一項農業資料研究時,開發了一款資料分析軟體,并基于此,創立了SAS公司。
SAS創始人兼CEO Jim Goodnight
40多年來,SAS的整體營收保持了持續的增長。即使在開源軟體大行其道的今天,略顯昂貴的SAS依然是全球多數金融、醫療機構、甚至政府的首選資料分析軟體。根據IDC的資料,SAS占全球進階和預測分析市場30.5%的份額。
經曆了資料寫在紙上的時代,到大資料、雲存儲,再到今天的機器學習、人工智能,SAS盡管經曆了多次技術探索方向的變更,作為一家專注“分析”40餘年的老牌公司,其在行業内積累的豐富資料和業務經驗鮮有匹敵者。而在算法和模型愈加“自動化”的今天,這些寶貴的行業知識積累顯然比技術更難複制。
這些經驗也是SAS開拓國際市場的秘密武器。
博雅融創軟體技術有限公司是SAS在中國的重要合作夥伴,其總經理陳建文告訴大資料文摘,中國客戶非常看重SAS在資料分析領域的先驗經驗。
“我們正在和中國一些省市的疾控中心合作,開展疫情相關的資料分析項目,而SAS之前協助美國相關部門進行了很多案例積累。盡管資料不同,但是業務經驗、模型都可以直接借鑒,這是客戶非常看中的。”
開放包容,和更年輕的資料科學家一起成長
但是,SAS也面臨着所有老牌巨頭同樣的挑戰:新生的資料分析工具。
從丹佛向北飛兩小時,你将從下着雪的西部到達陽光普照的矽谷。這裡是新生網際網路巨頭Facebook、Apple、谷歌等的大學營,也是一批資料科學、人工智能創業公司的誕生地。在這些公司中,新生代的80、90後資料科學家正在占據技術世界的主力。盡管SAS的名字依然響亮,這些動手和學習能力都極強的程式員更樂于自己探索開源的程式包。
“開源軟體更便宜、更酷,自己開發的應用也更順手。”來自Facebook的一位90後資料科學家告訴大資料文摘,“SAS是挺好用的,但是對個人使用來說太貴了”。
價格太過昂貴顯然也是SAS現任CTO Oliver Schabenberger本次SAS全球論壇中,受到最多質疑的地方。
SAS CTO Oliver Schabenberger在SAS 2018全球論壇演講
采訪中,Oliver沒有否認新出現的開源軟體有自己的優勢,尤其是在價格方面。
“(開源軟體)确實更便宜,我們也希望我們客戶有更多選擇。”面對質疑,Oliver的回應相當坦誠,“但你不能抛棄價值隻談價格,我們相信SAS的品質,我們也在不斷改善産品應對挑戰。”
近年來,SAS也确實有一些轉而使用開源軟體的客戶。
亞洲最大的銀行星展銀行DBS是SAS的老客戶,其首位首席分析官(Chief Analytics Officer)Sameer Gupta告訴大資料文摘,除了SAS,DBS之前也曾嘗試使用開源軟體R、Spark等以確定産品的多樣性
為應對使用者對多樣性産品的需求,2016年,SAS整合了自身的分析能力,推出了通用部署的計算平台ViyaTM:這是一個開放的、支援雲計算方式部署的記憶體計算平台,面向企業内部提供一個單一、開放和統一的分析環境。
作為一個開放的架構,ViyaTM期待可以滿足所有分析專業人士的需求,其支援包括REST API、SAS語言、Python、Java、R和Lua等方式的資料操控和分析開發。
中科聚信是SAS目前在中國較為重視的合作夥伴,其創始人兼CEO馬占軍告訴大資料文摘,相比無人維護的開源軟體,SAS的産品會更加穩定專業,這是銀行、保險公司、醫療機構這種公司非常看重的,這樣的機構根本無法承擔開源軟體的不穩定性帶來的風險。
而為了抓住資料分析領域的新生力量,SAS對高校和年輕人的投入也一直不遺餘力。
Jim Goodnight告訴大資料文摘,SAS與全球非常多的高校、教授建立了持續的合作關系,并向學生提供優惠價格下載下傳軟體,每年都有成千上萬的高校學生從中受益。
當然,抓住新一代資料分析者的關鍵不隻是導師需要或者免費的軟體,能切實用最前沿的技術做炫酷的項目,才能真正征服這群“最聰明的腦袋”。
“資料為善”
在主論壇的keynote演講上,兩個有趣的例子把SAS“資料為善(Data for good)”的主題展現到了極緻。
WildTrack:用腳印識别保護瀕危野生動物
SAS 2018全球論壇中提到了一個人工智能有趣的應用場景:使用動物的數字足迹來識别瀕危野生動物物種。
野生動物的腳印是觀察瀕危種群并實施保護的起點,通過腳印,從業人員可以确定物種的性别,有時也會鑒别年齡。
之前,這樣的腳印資訊隻能靠當地志願者人工發現、拍照,并手動錄入資料,效率極低,資料的缺失也讓研究人員很難确切地了解哪些物種需要監測。
SAS将AI圖像識别技術應用于此,并為此建立了一個野生動物的腳印資料庫項目。
在這一資料庫中,SAS從業人員已經為15種不同的物種開發了相關軟體及其算法,包括黑犀牛,白犀牛,孟加拉虎,阿穆爾虎,和北極熊等動物的腳印資料都被收錄其中。
通過收集這些資料,從業人員可以更好地确定瀕危物種栖息地物種的數量和分布情況,以便實施保護方案。目前,識别準确度已經達到了90%以上。
SAS Graphics Accelerator移動端上線:讓盲人通過音樂感覺圖表
SAS Graphics Accelerator的移動端應用是本次SAS 2018全球論壇又一驚豔釋出:通過和蘋果合作,SAS Graphics Accelerator可讓盲人通過音樂的形式使用和了解圖表。
在大會上,來自SAS的盲人體驗師現場展示了如何在手機上“觀看”一副折線圖。在app中,我們可以通過三種方式閱讀圖表:由螢幕閱讀器讀取圖形描述;将圖形轉換為易于閱讀的表格;或者獲得圖形的聲波表示。
現場觀衆和體驗師一起感受了聲波随着折線沿y軸改變而産生的變化:圖聲波表示沿着X軸傳播;在Y軸上較高的資料點的聲音比在Y軸上較低的資料點的音調聲音更高。
自誕生到現在的40多年,SAS和使用者也都沒有停止對資料分析的思考。除了業内使用者,曆屆SAS 全球論壇都會邀請到一些全球各行業領袖代表,比如薩利機長、全球首個半機械人Neil Habisson,還有《赫芬頓郵報》創始人Arianna Huffington等。
今年,SAS邀請到了美國第一位女性F-14飛行員Carey Lohrenz、總統曆史學家Jon Meacham、紐約時報暢銷書作家Dan Heath。他們的演講是論壇的“驚喜”,也引導聽衆們思考,資料分析在人文、曆史和上司力建設中如何應用。
原文釋出時間為:2018-04-16
本文作者:文摘菌
本文來自雲栖社群合作夥伴“
大資料文摘”,了解相關資訊可以關注“
”。