天天看點

阿裡巴巴CTO張建鋒:大資料+計算+算法才是未來

“不論是人工智能還是其他前沿技術,都離不開高品質的資料、強大的計算平台和高效的算法平台。”阿裡巴巴集團cto張建鋒在西雅圖表示,“隻有這三件事放在一起,才能真正在機器學習和人工智能領域取得突破。”

8月6号,阿裡巴巴在西雅圖舉辦技術論壇,有近400名當地的技術人才參加,除了有架構、中間件、搜尋等技術負責人到場介紹幹貨,阿裡cto張建鋒也第一次在美國分享阿裡的技術戰略。

阿裡巴巴CTO張建鋒:大資料+計算+算法才是未來

經過4個月的思考,張建鋒選擇這個場合,首次圍繞資料、計算和算法三個核心,系統闡述了阿裡的技術布局。

為什麼阿裡是一家大資料公司

阿裡巴巴之是以将自己定位成大資料公司,是因為擁有非常多的高品質資料。 “今天大資料做的最好的,都是平台性的企業,比如facebook和google,因為他們有海量的高品質的資料,” 張建鋒表示,“與之相比,阿裡的資料不但種類豐富,而且含金量特别高。”

阿裡的資料有三個明顯的特征:首先阿裡的資料是使用者通過購買行為投票産生的,和搜尋等場景相比,更加真實;其次相較于社交等資料,阿裡的資料高度結構化,例如淘寶上的商品描述就高達一百多個緯度;第三非常密集而且實時,不管在無線還是pc端,阿裡日常都有超過1億使用者在通路。

阿裡巴巴CTO張建鋒:大資料+計算+算法才是未來

這幾點再加上整個阿裡生态整合的多場景資料,對大資料的發展,可謂得天獨厚。

計算平台需要大規模資料訓練

在計算平台的建構方面,得益于大規模資料訓練的優勢,阿裡巴巴做了大量的技術創新。除了圍繞開源計算平台hadoop生态所做的各項工作,如流計算和批處理,阿裡還有兩個非常高效的自研計算平台:離線計算平台odps和實時計算平台galaxy,不但承載阿裡日常的海量計算工作,而且通過阿裡雲對外提供服務。

“在大量的實踐中才能發現更多改進方向,是以阿裡有機會真正改變計算平台的效率。”張建鋒表示。

張建鋒還談到為什麼阿裡巴巴能夠在7年之前就洞察到雲計算的未來,“阿裡一直做平台化業務,交易平台既然可以共享,計算能力為什麼不能?是以我們比大多數公司更早意識到,計算可以變成水電煤一樣的公共服務。”張建鋒回憶到。

如今阿裡雲已經成為中國最大雲計算平台,提供包括iaas、paas、saas在内的完整服務。

高效的算法挖掘更大資料價值

對于算法,張建鋒認為,算法必須和行業場景進行高度的結合,在實驗室中并不能研究出真正高效的算法,而阿裡巴巴最大的優勢就是能夠提供多樣化的、極其豐富的場景。資料、計算平台和算法的結合,是未來非常重要的趨勢。

強大的計算平台加上高效算法,能夠進一步挖掘資料價值,最大化資料效率,形成正向循環。而雲計算則能加速資料融合,例如孤立的看氣象資料價值有限,但和農業或商業結合,就會産生巨大化學反應。而傳統制造業如果能充分利用大資料,也将有助于大幅提升良品率。

目前阿裡正積極推進與交通部門、氣象部門、制造業等多個行業的合作,讓資料産生更大價值。“我們堅信大資料總有一天會改變所有行業,是以阿裡目前在各個領域都有新的探索。”張建鋒表示。

阿裡未來技術布局

展望未來技術布局時,張建鋒重點談到vr/ar、人工智能和物聯網。在他看來,目前的世界變化之大超越了人們的想象,不斷湧現各種新技術,但未來究竟是怎樣的,所有人都在探索,并無定論。

“從pc到無線,疊代周期非常短,很多公司還沒有反應過來,已經進入無線時代,很多企業就沒有了。”張建鋒談到大熱的vr/ar時以此類比。vr/ar技術代表着從二維空間到三維空間的趨勢,讓我們對世界的了解更深入。

目前人工智能的技術方向很多,爆發性的出口還沒有明确答案,在張建鋒看來,最有可能獲得成功的,是對消費的趨勢、對資料和場景規模化有研究的人,阿裡将在這方面投入更多的資源。

繼續閱讀