天天看點

從海外到西南,“80後”青年專家攻堅克難解鎖人機互動新模式

作為中國汽車制造重鎮,重慶從來不缺汽車品牌。如今,随着科技和産業變革,智能汽車已經成為重慶汽車産業轉型更新的關鍵點。

今年一季度,重慶汽車制造業對工業增長貢獻突出,增幅達16.8%。資料背後,是一批批汽車研發人員的共同努力。在“五四青年節”到來之際,上遊新聞記者專訪科大訊飛智能汽車重慶分中心總經理馬鴻鵬,看“80後”青年科技專家如何帶領團隊攻堅克難乘勢而上,用人工智能賦能智能汽車發展,助力重慶汽車産業轉型發展。

從海外到西南,“80後”青年專家攻堅克難解鎖人機互動新模式

入圈:熱血青年投身海外市場打拼夢想

2004年,計算機專業出身的馬鴻鵬,入職一家日本知名的汽車電子企業,得益于中國汽車市場的快速發展,馬鴻鵬很快被派駐到日本合作車企深造。

“當時,我們去這家日本企業,有着60年的汽車行業曆史背景,其積累沉澱非常豐富。”馬鴻鵬說,此行除了系統性的技術研修外,更重要的是對一款剛引進中國的日系汽車進行新一代智能開發。

彼時才20多歲的馬鴻鵬對智能技術正淩雲意氣,但很快就被潑了冷水。“當時日本的汽車制造技術在全球都是領先的,日方企業覺得我們中方派駐人員隻是來研修的,新一代汽車技術怎麼做還是得跟着他們走。”馬鴻鵬說。

但很快,馬鴻鵬就用實際行動證明了自己。

馬鴻鵬說,當時國内車載智能系統還處在探索階段,在新一代汽車智能系統中,他首要想解決模糊檢索、實時交通等使用者高需求功能,然而那時車機處在封閉系統内,沒有網絡的情況下,汽車系統本身的算法和存儲能力至關重要。

“汽車車機沒有聯網,當你搜尋一個目的地,需要把名稱寫完整,才能檢索到。”馬鴻鵬舉例說,比如檢索“重慶市渝中區行政服務中心”,輸入“渝中區行政中心”并不能檢索出目的地,必須完完整整地輸入。

而要在封閉系統内開發模糊查詢,這在當時頗有挑戰。馬鴻鵬說,這需要提前做好大量的資料,儲存到車機硬碟内。随後,馬鴻鵬和團隊針對全國的道路、位址名稱進行關鍵詞切分,并建立索引資料庫,進行大規模覆寫性測試,并針對不恰當的分詞進行優化。

這項如今看起來習以為常的模糊搜尋功能,在當年卻是創新之舉。“這在當時屬國内首創,我們還申請了國家專利。”成功申報專利,讓馬鴻鵬成就感滿滿,這也讓日本企業刮目相看。

“從擔憂質疑到放心交辦,我們憑着技術征服日方企業,進而也獲得日企的重視尊重。”馬鴻鵬說。

從海外到西南,“80後”青年專家攻堅克難解鎖人機互動新模式

研發:技術攻堅開創人機互動新格局

回國後,馬鴻鵬升任公司中層管理,帶着20多人的團隊幹起平台研發。

2018年,中國車市迎來高速發展時期,各大車企各展所長。随着智能汽車人機互動的發展演變,作為中國汽車重要的産業基地,重慶市場備受關注。

馬鴻鵬與重慶的結緣,也是從2018開始。

2018年智博會上,科大訊飛董事長劉慶峰宣布将西南總部落地重慶,同時落地的還有科大訊飛智能汽車的重慶分中心,馬鴻鵬也成為該中心的總經理。與此同時,科大訊飛還與長安汽車等重慶車企共建聯合實驗室,在汽車電子智能化的技術研發、産品設計以及整車應用領域展開合作。

“小安你好,幫我查一下北京的天氣。”

“好的,北京天氣晴,白天氣溫20攝氏度。”

“再幫我訂一張去那兒的機票。”

……

這樣的對話,在人與人交流中再平常不過,但對于人機互動而言,想要和機器持續對話,并讓機器了解“那兒”就是上文所指的北京,技術難度不言而喻。

“在車内一次喚醒實作多個指令,還要實作上下文了解,這種互動方式是之前沒有的,但卻是使用者的痛點。”馬鴻鵬解釋到,對于機器來說,機器需要記憶和了解目前說話人的意圖和場景,就需要覆寫盡可能多的場景和可能問法,這種會呈幾何級數增長的算法複雜度,使軟體的開發和維護都有較大難度。

為了實作這一智能操作,馬鴻鵬帶領着20多人組成的團隊入駐長安汽車,反複測試形成龐大的場景知識庫,“通常車内常用指令不超過2000種,但我們在車機上内置了常用指令近6000條,不常用指令近2萬條,才精準實作使用者指令。”馬鴻鵬說。

另一項技術難點是,怎樣才能讓語音控制系統保持收音狀态,同時車内對非指令正常交流不作回報?馬鴻鵬說,他們在車内研發設定了聲紋識别、聲源定位等系統,能夠準确識别指令發出者的指令,而非指令者和日常車内交流則不會被接收進語音控制系統,讓車内語音操作更加智能和人性化。

如今,搭載這些技術的飛魚OS已經在長安CS95、CS75等車型上使用,也加速了重慶汽車智能化發展的程序。

從海外到西南,“80後”青年專家攻堅克難解鎖人機互動新模式

攻堅:攻克關鍵技術助力重慶造汽車走出去

重慶以工業立市,汽車産業是重慶工業的重中之重,是重慶經濟的支柱之一。作為傳統汽車重鎮,重慶在“異軍突起”的智能汽車領域如何實作補鍊強鍊?

馬鴻鵬分析,從國際汽車市場來看,歐美等在燃油車領域的技術和持有率上優勢明顯,而國内車企的智能化轉型及造車新勢力的湧入,有望在智能汽車軟體+硬體融合方面引領新賽道。

随着智能汽車産業發展,不少重慶汽車品牌也走向國際市場。馬鴻鵬說,智能汽車在海外使用,必須适用當地的語種,而在過去外語的車載語音識别及合成系統被國外企業壟斷,國内車企隻能使用國外企業的語音技術。比如過去很長一段時間長安汽車在面向中東、南美等海外發行的車型中,語音識别系統一直是采用的國外技術,安全問題是最大的考量。

為了解決這一卡脖子問題,馬鴻鵬團隊聯合科大訊飛研究院展開長安汽車車載外語語音識别及合成系統研發。

“做車載外語識别,不僅需要聽懂,還要了解其他國家的語言文化習慣,甚至同一語種不同地區的口音,這就需要有強大的識别模型和機器學習做支撐。”馬鴻鵬解釋說,車載語音的“識别”分為“語音識别”和“語義識别”兩個技術層次,“語音識别”相當于人的嘴巴和耳朵,負責表達和擷取,而“語義識别”相當于人的大腦,負責思考和資訊處理。為此,團隊開創性地采用實體抽取+動态模闆、融合深度學習的架構,将語音和語義技術剝離,建構出雲+端多語種語義平台,基于該平台可快速實作多語種的語義了解。

2021年,這套車載外語語音識别系統成果實作了國産化,長安汽車海外發行的車型均采用這一國産系統,“關鍵技術的國産化不僅更穩定安全,在生産成本上也實作降低,助力國内自主品牌出海。”馬鴻鵬說。

未來:“語音+視覺”開創人機互動新體驗

近年來,重慶全面落實制造強國戰略,加快推進制造強市、“智造重鎮”建設。“身居汽車行業内,我們也在不斷思考,如何發揮人工智能優勢,通過‘AI+汽車’賦能重慶汽車制造開創新格局。”馬鴻鵬說。

随着新技術産品的釋出,“AI+汽車”又有了新成果。今年3月,重慶車企歐尚汽車智慧快樂座艙在渝釋出,将人工智能技術與汽車使用場景深度融合,打造了全球首發的車外語音互動系統。而這一系統也來自于馬鴻鵬的重慶團隊。

“以前汽車的語音互動都在車内,實際上車外智能互動也是使用者的需求,一門之隔下,研發道阻且長。”馬鴻鵬舉例說,以往使用者在用車場景中,常會有開門難、挪車難等痛點,而這套車外語音互動系統可以讓車主在車外喚醒車輛,比如在擁擠的停車場,可以叫它“把車開出來”,車輛即可自動向前駛出,購物歸來雙手不友善開門,也可以說一聲“打開後備箱”,後備箱即可自動開啟。

“車外語音互動相較車内語音互動來說,難點在于如何保障車外噪音等複雜環境下,機器能聽清楚并執行指令。”馬鴻鵬說,為了實作車外的人車互動,他和團隊獨創神經網絡降噪算法和“冷啟動”系統兩項技術,讓車外語音互動系統做到360度語音降噪和無死角識别覆寫,實作穩定高效的車外語音互動。

未來,汽車智能化轉型更新之路怎麼走?

“汽車革命的下半場是智能化、網聯化、共享化。”馬鴻鵬說,他正在和團隊開發多模态互動的新技術,未來的智能汽車除了在語音互動外,還将增加視覺感應互動。比如,當你看向左邊車窗,發出“打開車窗”指令,那麼車機将隻打開左側車窗;正在通過中控看地圖,說放大一點,車機将為使用者放大地圖。

汽車産業作為重慶重要的支柱産業,從車端、零部件、電池、軟體等全産業鍊聚集,為重慶在智能汽車領域彎道超車奠定基礎。馬鴻鵬表示,科大訊飛将發揮人工智能優勢,進一步從技術提供商,向資訊娛樂系統、音響系統等邁進,走向軟硬一體化發展,助力重慶汽車産業智能制造。

上遊新聞記者 李舒

繼續閱讀