天天看點

實習派|姜雪:我适合做科研嗎?在微軟亞洲研究院,我找到了答案

作者:微軟亞洲研究院

“我适合做科研嗎?”帶着這個問題,在中國傳媒大學通信與資訊系統專業讀研一的姜雪來到微軟亞洲研究院尋找答案。當時的她還沒有豐富的科研經驗,對深度學習的了解也有限。

在研究院的“沉浸式”科研環境中,姜雪在多媒體計算組從頭探索“基于深度學習的音頻編碼”這一新方向。一年半的實習成果豐碩,她在包括 ICASSP、INTERSPEECH 等在内的語音研究領域頂級會議以第一作者的身份發表了多篇學術論文。

今年9月,姜雪選擇繼續攻讀博士學位,這段實習經曆帶領她找到了開頭問題的答案。“不管是 mentor 們還是小夥伴們,我都在他們身上看到了自己想成為的樣子”,姜雪說。

從科研小白到頂會文章作者,背後是姜雪工作日裡風雨無阻的早出晚歸,也是她與 mentor 親密無間的合作。自我定義為“非天賦型選手”的她證明了“一直全身心投入一件事,總是會有收獲的”。

實習派|姜雪:我适合做科研嗎?在微軟亞洲研究院,我找到了答案

生活中的姜雪

在微軟亞洲研究院從頭探索新方向

姜雪與微軟亞洲研究院的緣分始于她在中國傳媒大學的導師推薦。中國傳媒大學張遠教授認為,微軟亞洲研究院的科研氛圍非常好,學生能夠在此接觸前沿技術、接受專業指導,是以她很建議學生來到研究院實習。此前,姜雪的同門師姐也曾在研究院實習且收獲頗豐。在導師的全力支援下,姜雪開始了在微軟亞洲研究院的科研之旅。

初入研究院,姜雪用“一張白紙”來形容自己——對深度學習的了解有限,也沒有完整經曆過全流程的科研工作。2021年恰逢基于深度學習的音頻編碼蓬勃發展,微軟亞洲研究院也開始在該領域進行持續探索,多媒體計算組的很多項目都圍繞實時通訊場景下傳輸音頻中出現的各種問題展開。

遇上全新的方向,姜雪開始從頭探索。在微軟亞洲研究院進階研究員彭秀蓮和研究員薛華穎的指導下,姜雪聚焦音頻通訊場景下的編解碼問題,研究在同等碼率下,如何使解碼出來的音頻品質更好。當時,這個方向在領域内尚屬藍海。

創新總是與挑戰并存。在沒有源碼、參考文獻也很少的情況下,不管是寫代碼還是搭架構,一切都需要從零開始。姜雪和研究院的新方向一起成長,一步步解鎖科學研究新地圖。目前,在多媒體計算組的努力下,音頻在 3kbps 下已達到 near-transparent 的聽覺品質,也最先在實時通訊的場景下實作了 1kbps 還能達到遠高于 Lyra 3kbps 的聽覺品質。

實習派|姜雪:我适合做科研嗎?在微軟亞洲研究院,我找到了答案

姜雪(右四)和小夥伴們

“姜雪是我們這個方向探索的中堅力量,和我們一起完成了許多重要工作。”彭秀蓮這樣評價姜雪的貢獻。姜雪參與了抗丢包恢複算法、回聲檢測算法等多個 Microsoft Teams 語音通信項目的研究,後期還設計實作了基于 TFNet 架構的新一代實時語音編碼器,性能遠超越傳統語音編碼器,并以此展開了超低碼率及 scalable 語音編碼器研究。在與 Microsoft Teams 團隊合作優化的過程中,姜雪也做了很多模型訓練的工作。與美國 Microsoft Teams 産品團隊的協作也讓姜雪收獲頗豐,産品團隊立足産品工程的視角,為科研提供了新的思路。“真正感受到了産品與科研的互相促進”,姜雪說。

實習的一年半轉瞬即逝,姜雪碩果累累,在包括 ICASSP、INTERSPEECH 等在内的語音研究領域頂級會議以第一作者的身份發表了多篇學術論文。姜雪坦言,自己最初并未想好是否讀博,這段實習經曆直接影響了她的決定。

“我适合做科研嗎?”回想起一年半之前的問題,姜雪找到了答案。

亦師亦友,綻放女性科研光芒

從學術小白到獨當一面,mentor 們在姜雪的成長中扮演着重要角色。實習期間,姜雪的兩位 mentor 彭秀蓮和薛華穎扮演着亦師亦友的角色。從學術指導到情緒輔導,她們關心實習生方方面面的成長,也作為榜樣引領着姜雪的科研之路。而這個全女性的組合,也綻放着她們獨特的科研光芒。

彭秀蓮關注視訊編碼領域,在編碼方向上非常有經驗。在姜雪看來,秀蓮是一個細緻的“實幹派”,會基于自己的經驗提出方向和目标,不斷提出一些可以嘗試的地方。從初期調研,到寫代碼完成實驗,再到分析實驗結果,每一次進展間都穿插着密集的讨論,二人共享着探索成功後的興奮感與成就感。

由于秀蓮此前也未曾涉獵音頻編碼領域,二人在新方向的探索初期難免遇到一些問題。秀蓮會根據自己的經驗,耐心幫助姜雪分析目前問題和解決思路,姜雪提起一次令她印象深刻的瓶頸期,盡管她參考了過往相關論文的方法,解碼出來的音頻品質卻仍不理想。姜雪疑惑:明明感覺所有的地方都很合理,為什麼結果就是不對呢?是解碼端不夠強大,還是量化做得不合理?在秀蓮的建議下,她重新閱讀了所有相關論文,仔細對比了不同論文輸入音頻資料的處理細節,最後将問題定位到音頻資料的分幀步長。做出相應調整後,問題迎刃而解。“她真的很牛”,姜雪反複贊歎。

至今,姜雪仍對遇到困難時與秀蓮一起頭腦風暴的場景記憶深刻。秀蓮站在白闆前梳理難點的身影讓姜雪覺得“做科研的女生真的很酷,我也想成為這樣的人”。

實習派|姜雪:我适合做科研嗎?在微軟亞洲研究院,我找到了答案

姜雪與 mentor 彭秀蓮(右)、薛華穎(左)合影

另一位 mentor 薛華穎則是姜雪心中“最有能量的姐姐”,從如何使用編碼工具到如何做好學術分享,薛華穎親手帶她推開學術的大門。在共同制定研究方案、分析問題、驗證結果的過程中,研究思路在思維的碰撞中迸發。

作為女性研究員,華穎對情緒的感覺也十分細膩。科研進展緩慢時,姜雪初期容易陷入低落情緒中。華穎敏銳地察覺到姜雪的焦慮,主動開導姜雪靜下心來分析問題。兩人時常進行朋友般的聊天。華穎将自己定位為忠實的聆聽者,“我會先以同理心開導她,表示感同身受,其次是鼓勵以平常心對待,化焦慮為動力,最後是跟她一起直面瓶頸。我們會跳出來去看一些别人的工作,試圖跳出目前的思維困境。”

除了科研能力的提升,姜雪的另一大收獲便是培養了穩健的技術心态。“做科研就是這樣,不可能一直很順,翻過一個坎之後一定會是一個瓶頸期。隻需要關注自己問題的本質,别的不用考慮太多。”

姜雪将學術路上遇到的導師視為自己的榜樣。在學校,導師張遠是姜雪的科研啟蒙。她關注行業前沿,并鼓勵自己的學生多探索,對圖像、編碼等每一個領域都有所了解,打好基礎再選擇自己感興趣的領域。在秀蓮和華穎的影響下,姜雪也越來越堅定對自己科研想法的信心,持續探索、耐心調整。導師們對科研的極緻追求也激勵着姜雪更加努力,未來,她希望自己也能成為“科研品味很好、能主動有一些新發現”的女性研究員。

一直全身心投入一件事,總會有所收獲

在科研方面,姜雪從不認為自己是“天賦型選手”,但她相信天道酬勤。無論是大學四年保持綜測第一,還是一年半發表多篇論文,她将這些都歸為“習慣性努力”帶來的收獲。

姜雪就讀于距離微軟亞洲研究院30公裡遠的中國傳媒大學。從研一下學期開始,為了避免八通線腳不沾地的早高峰,她會在大多數工作日的七點多鐘出現在地鐵站,在地鐵上聽聽歌放空大腦。在研究院的一天裡,她或是在開會,或是在做實驗。晚飯後回到學校,她還會前往實驗室,總結自己一天的收獲。姜雪認為自己最大的優勢就是一旦專注某件事,就會全身心投入,秀蓮和華穎也不約而同地用刻苦勤奮、堅韌不拔來形容她。

科研占據了姜雪生活的絕大部分時間,但她并不是以而疲憊。姜雪喜歡簡單的生活,也越來越習慣在研究院形成的科研節奏。讀博期間,她還打算保持這樣不松不緊的節奏,“否則再想撿起來就比較困難了”,姜雪說。周末的閑暇時間裡,姜雪還會和學校實驗室以及研究院的夥伴們一起約飯、逛街、運動。未來她也計劃在繼續全身心投入科研的同時多多參加活動,豐富自己的讀博生活。

回顧自己在微軟亞洲研究院的時光,姜雪充滿感激。她也希望未來能延續和研究院的緣分,繼續音頻/語音+AI領域的研究,帶着在此培養的科研能力和技術心态繼續自己的研究旅程。

實習派|姜雪:我适合做科研嗎?在微軟亞洲研究院,我找到了答案

生活中的姜雪

Mentor寄語

實習派|姜雪:我适合做科研嗎?在微軟亞洲研究院,我找到了答案

彭秀蓮

微軟亞洲研究院進階研究員

在這一年多的時間裡,姜雪在微軟亞洲研究院多媒體計算組基于深度學習的音頻編碼方向做出了非常優秀的工作。她以第一作者的身份發表了多篇文章,将高品質的實時語音編碼推到了很低的碼率,并不斷地嘗試更多的突破。姜雪身上所展現出來的紮實的态度,勇于探索和永不放棄的精神給我留下了很深的印象,希望未來她繼續努力不斷探索,在音頻/語音+AI 領域做出更大的成就,成為一個傑出的女性研究員!

實習派|姜雪:我适合做科研嗎?在微軟亞洲研究院,我找到了答案

薛華穎

微軟亞洲研究院研究員

在過去短暫的一年半時間裡,姜雪在多媒體計算組做出了一系列優秀的研究工作,并在包括 ICASSP、INTERSPEECH 等在内的語音研究領域頂級會議以第一作者的身份發表多篇學術論文。她參與了組裡多個 Microsoft Teams 語音通信項目,包括抗丢包恢複算法、回聲檢測算法的研究。後期作為主力成員,主導了深度學習的語音編碼器算法研究。

她設計實作了基于 TFNet 架構的新一代實時語音編碼器,性能遠超越傳統語音編碼器,并以此展開了超低碼率及 scalable 語音編碼器研究。她身上所展現出來的對科研的熱情以及無畏科研困難的勤奮刻苦的态度令我印象深刻,祝願姜雪在未來的研究道路中更加自信地前行,做出更有影響力的工作,成為該領域傑出的女性研究員!