天天看點

在阿裡做博士後是一種怎樣的體驗?

上個月,阿裡巴巴釋出2018年博士後招聘啟事,針對機器智能、機器學習、資料挖掘、機器人、高性能計算、通信技術、人機互動、物聯網等研究方向,邀請海内外博士加入阿裡博士後科研工作站。

阿裡博士後工作站的優勢在于真實豐富的業務場景和資料,這對技術研究至關重要,卻為高校和科研院所欠缺。是以,打通學術界和工業界就很有必要。這正是阿裡這些年努力的方向。

在阿裡做博士後是一種怎樣的體驗?

阿裡巴巴博士後“企業導師”名單

早在2008年,阿裡就建立了博士後工作站。2017年10月,立足基礎科學、颠覆性技術和應用技術研究,“緻力于探索科技未知”的阿裡巴巴達摩院成立。得益于此,阿裡可以為工作站提供頂尖科學家組成的“明星導師團”:世界頂級量子科學家施堯耘、美國密歇根州立大學前終身教授金榕、亞馬遜前最進階别華人科學家任小楓、新加坡南洋理工大學終身教授王剛……在阿裡,可以擔任企業博士後導師的海内外學術帶頭人、研發管理人才已有百餘人。

針對人才,阿裡也開出了豐厚的條件。除了提供“具有市場競争力的薪酬福利”,協助申請國家級、省級和市級多種科研經費之外,阿裡還将協助博士後解決北京或杭州戶口。

阿裡博士後工作站是阿裡博士人才引進和培養的重要平台。現有北京站和杭州站,并與中國科學院、清華大學、浙江大學、上海交通大學、新加坡南洋理工大學等頂尖高校達成了聯合培養計劃。目前阿裡技術團隊擁有數百名博士。未來3年博士後工作站計劃引入200位青年科學家。

那麼,在阿裡做博士後究竟是一種怎樣的體驗?兩位阿裡博士後和我們聊了聊他們的故事。

做真正影響使用者的技術和産品

—— 薛少飛

(阿裡北京站第一批出站博士後)

我是去年11月份出站的,現在的Title是阿裡達摩院機器智能技術實驗室算法專家,主要負責語音識别的技術創新和産品落地。我在這個領域已經做了快十年——大學是中國科學技術大學電子資訊專業,大三就進了實驗室,後來保送碩博連讀,在中科大一直讀完博士。

在阿裡做博士後是一種怎樣的體驗?

薛少飛(左一)參加ICASSP2017國際學術會議

我不完全是個技術男。我喜歡文學、曆史,會看很多人文的書,我相信技術能夠解決很多的問題:比如可以用規則和統計模組化方法解決的問題,技術很大程度上都能夠解決。但我覺得技術的作用并不是要取代人類,而是将人類從重複性勞動中解放出來。讀了研究所學生之後,我開始想自己到底要做什麼樣的工作。過程中也經曆了很多嘗試,最後我給自己的定位是——做能真正影響使用者的技術和産品。

到阿裡做博士後,我看重的是阿裡這個平台。它有很多的應用場景,有很多的資料。我們做語音識别需要大資料以及資源、平台,阿裡都具備,而且我在進入之前就對我們團隊有所了解,這是一群能夠做出事情的人。

我是阿裡北京站第一批博士後,2015年9月進站。剛到阿裡做的第一個項目就很有成就感。那是一個智能客服的項目,在使用者咨詢人工客服之前,先去分析使用者的行為,猜測他遇到了哪些問題,推薦給使用者一些解決方案。這在當年的“雙11”就展現了價值。做項目過程中跟支付寶團隊有很多協作,會和他們一塊兒頭腦風暴。這個過程非常有自我價值實作的感覺,一個做技術的人最希望的就是自己做的東西能夠展現出它的價值。

2016年阿裡雲年會上,我們做的語音識别系統和金牌速記員去做了一個PK,在識别準确率上以微弱優勢戰勝了人類速記員。我們在業界首個采用了LC-BLSTM聲學模型。在當時這個語音識别模型很前沿,在學術研究上也是正在進行當中的。我們首先需要從學術的角度去判斷這個東西會不會比現有的模型有一個明顯的提升,然後你要迅速地去實作和證明,并進行落地。後來這套模型也用到了其他的産品裡面。

LC-BLSTM聲學模型相關的技術幹貨:

為提升線上語音識别效率,他創造了兩種更新版算法模型

在阿裡做博士後是一種怎樣的體驗?

薛少飛(左九)與他所在的機器智能技術實驗室團隊

現在我的工作與博後期間的研究是有延續的。這兩年我做了好幾個遠場語音識别的項目,最近在雲栖大會上亮相的“阿裡AI收銀員”、“上海地鐵語音購票機”都是我參與的項目,我負責其中的遠場語音識别部分。上海地鐵站的環境非常嘈雜,在那種環境下作出一個非常準确的識别,其實非常難。而且真正的使用者行為可能和我們想象的很不一樣。比如開始我們會設想很多正常互動的場景,但實際上使用者可能很随意,比如隻說了地鐵站名字,或者中間帶許多語氣詞和停頓。這個過程中我們踩了很多坑。

這是一個根據使用者回報不斷疊代的過程。在大學裡不會有這些機會。在學校裡進行研究的時候,通常你是在做某一個點,其他的都是fix(固定)的——在這種情況下進行這個點的創新。在阿裡你會跳出來,跳到一個系統的層面去考慮問題。這個可能涉及學術創新、工程創新、方法創新……它會更全面地要求你,思考的方式是完全不一樣的。

到工業界做科研是趨勢

——裴昶華

(阿裡北京站博士後)

我是2017年7月進站的,經曆比較簡單,清華計算機2008級大學,然後直博,2017年從清華畢業。我導師現在跟阿裡、騰訊和其他公司也有一些深度的合作,他喜歡科研跟企業結合的方式。受導師影響,我也覺得科研應該做一些實際的問題,真正能夠影響人們現實生活的問題。

在阿裡做博士後是一種怎樣的體驗?

裴昶華參加阿裡年會

博士的時候,我研究怎麼将機器智能用到網絡領域,提高網絡性能和可用性。來阿裡之後,在搜尋事業部,研究個性化推薦的問題。很多人都問我,你博士畢業了為什麼不去學校,他們了解不了博士為什麼要去工業界。大家一般認為去工業界就是寫代碼,科研能力相當于荒廢了。其實不是這樣的,我們也寫論文,前段時間我剛投了一篇論文。以後企業招的博士後會越來越多,到工業界做科研肯定是一種趨勢了。

在阿裡的好處是,你不用刻意地去找問題,問題就自動地找上你了。

去年“雙11”之前,我們做了一個百萬級QPS(每秒查詢率)的智能排程系統。“雙11”有很多的使用者會買買買,背景伺服器壓力就會突增。以前都是人工排程,看某個場景,比如手淘購物車——壓力太大了,就多加點機器。有個人拿個本,在那兒記。我們就想,這是可以用算法解決的。當時就聯合另一個團隊做了一個排程算法。這個智能排程系統,并不是我們想着去做它,是備戰“雙11”的時候,人力成本太大,自然而然就想起這個問題。

在阿裡做博士後是一種怎樣的體驗?

2017年“雙11”平穩度過後的淩晨,裴昶華(左二)與參與項目的其他同僚合影留念

在阿裡,現實問題推動創新的例子有很多。就在上個月,我們做了一個手機淘寶的項目,為了讓推薦給使用者的商品更精準,我們用了一個新模型­——強化學習模型,算法上線之後,商品點選率提升了7%。這個工作現在我在總結,準備投一篇論文。

到阿裡做博士後,對我的影響是比在學校時更重視細節了。在公司你做的項目是真實線上的,做産品對細節要求很嚴。比如這個排程系統,一旦出什麼問題的話,那就會給公司帶來直接的損失。那段時間,整天腦子裡都是這個,睡覺想着這個東西,去食堂、在辦公室裡都是想着這個事情,想着哪裡有遺漏,哪裡還沒解。後來“雙11”平穩度過,淩晨從辦公樓出來,當時就覺得很有成就感。自己做的東西被用上了,用到人們的生活裡面,是一種不一樣的感覺。

原文釋出時間為:2018-07-18

本文來自雲栖社群合作夥伴“

阿裡技術

”,了解相關資訊可以關注“

”。

繼續閱讀