作者簡介:
張心怡,北京大學前沿交叉研究院研究所學生,中國人民大學資訊學院大學生。從18年底開始在POLARDB-X團隊智能資料庫組的實習,現已在阿裡度過了一年多的時光。
心怡說,對于有志于資料庫領域研究的小夥伴,這裡是最好的學習和工作平台。
01、優秀的同行人,助我成長
我所在組的研究方向是智能資料庫,目标是利用機器學習和統計優化等技術,實作資料庫系統各個元件的自動優化,如存儲引擎,并發控制,SQL優化器等,以減少系統成本,提升系統性能,以實作一個self-driving的資料庫系統。
這是一個很有前景的方向。大四上學期,初來實習的我内心其實頗為忐忑,面對組裡的同僚前輩,“跟不上進度”成了我最擔心的事情。然而,進入到工作狀态之後,我心裡的石頭落了地:mentor給實習生安排的任務是循序漸進的,一次次讨論與指導,使我能夠快速上手。
經過和mentor的讨論,我選擇把“智能查詢優化”作為第一個研究項目,并且與大四學期的畢設結合,基于阿裡線上平台的實際問題,展開研究。
查詢優化屬于資料庫比較底層的部分,之前我沒有很深的了解。在開展研究的過程中,除了自己閱讀文獻,同僚成為了我的“知識寶庫”。遇到場景落地問題時,我會請教PolarDB-X優化器開發的同僚,他們往往能夠一針見血地指出實際問題。
我的成長離不開組裡各位老師的幫助與分享,組内還會定期或不定期組織reading group,講解工作成果與學界進展。在這裡,你會發現身邊的同僚大多對深耕于某一領域,實力紮實,與他們交流會收獲很多!
02、快樂工作,認真生活
“快樂工作,認真生活”,記得我剛剛入職時HR提到了這個觀點,入職之後我發現這是阿裡人身體力行的一句話。
在工作上,身邊的人都很努力。在這種氛圍的感召下,遇到難題,我也會情不自禁地在工位上多坐一會。暑期實習的時候,時常9點之後結束工作,打車回宿舍。
生活上,團隊裡組織了豐富多彩的活動。聚餐已經成為了正常項目。工作間隙還可以去健身房鍛煉一波,園區的按摩椅也成為了養生女孩的午休項目。
印象最深的是團隊組織的運動會,女子項目是平闆支撐。聽到這個消息之後,我基本每天都進行練習。運動會那天,杭州base、北京base、矽谷base進行了三地PK,在同僚的加油下,我堅持了平闆支援7分25秒,最後拿到了女子組冠軍。
大家的工作與生活模式都很健康充實。在阿裡,我見識到了工作發展的可持續性與優秀的團隊互動模式。

獲得運動會冠軍
03、阿裡實習,帶我打開科研大門
來到阿裡之前,我是一個對科研比較懵懂的門外漢。特别幸運的是,在這裡我遇到了很棒的mentor們指導我進行研究工作。
不論是基礎的代碼風格還是研究思路、遇到的問題,mentor都會事無巨細地進行引導。以前我寫代碼,能跑起來、自己看得懂就行。
我在阿裡送出的第一次merge request,有不少随意的空行和一些tricky且難以維護的邏輯。印象很深的是,當時mentor逐行寫了comment指出問題。我認識到了代碼的規範性和可維護性,以及别人是否能夠了解自己的代碼都是要考慮的問題。
2019年我從中國人民大學畢業,來到北京大學攻讀資料科學研究所學生,感謝我的研究所學生導師崔斌老師對我在阿裡實習的支援。當時,我在阿裡研究的第一個課題,也畫上了圓滿的句号:我在NDBC(CCF National Database Conference)進行了課題報告,投稿論文并被評為best student paper。
參加NDBC
我在阿裡參與研究的第二個課題是資料庫的智能調參。傳統的資料庫調參中DBA基于經驗與嘗試推薦參數值,而我們要做的是基于機器學習算法自動高效給出推薦。
這個課題在進行過程中遇到了不少困難,算法的适用性與有效性是我們重點考慮的。在進行了很久的實驗之後,會發現一些坑和問題,挫敗感是有的,但是會馬上被新的嘗試與期待替代。
我發現,在這裡的研究并不是為了學術灌水而做,有意義研究是問題導向的。mentor時常強調要找到可複現的場景和實際問題,這樣才有實際意義。我的mentor base在矽谷,因為時差我時不時在早上收到消息和回報,這成為了我起床開啟新的一天的最大動力。mentor是我科研路上的引路人,也是并肩作戰的戰友,大家一起為了攻克問題而努力!
阿裡的實習經曆,幫我找到了打開科研大門的鑰匙,讓我從對科研的懵懵懂懂,到愛上了這一發現問題、攻克問題的過程。我希望将來能繼續資料庫領域的研究工作,在玉潔冰清的邏輯世界繼續追尋。