阿裡在人工智能和物聯網領域又落一子。這次,瞄準的是智能語音互動。
今天,阿裡宣布全資收購北京先聲互聯科技有限公司(以下簡稱“先聲互聯”)。同時,先聲互聯創始人、中科院聲學所前研究員付強博士,正式入職阿裡達摩院機器智能技術實驗室,負責語音互動前端處理技術和方案的研發。随付強一同入職的,包括先聲互聯創始團隊的多名資深專家,他們多為付強在中科院的原班人馬,其中一位來自著名的杜比實驗室。
一支能文能武的團隊
先聲互聯是國内最早從事語音增強、遠講語音互動接口技術的團隊,曾為阿裡、百度、小米等多家公司提供遠講語音互動軟硬體的解決方案。
創始人付強擁有二十餘年語音信号處理研發經曆,在美國OGI等語音研究機構從事過博士後工作,回國在中國科學院聲學研究所擔任研究員,曾牽頭完成了國家自然科技基金國家、省部委幾十項科研課題,在包括IEEE Trans.在内的國際權威學術刊物上發表論文近百篇,發明專利近二十項,多項成果被相關部委列裝。
2016年12月12日,付強創辦了先聲互聯,次年便獲阿裡巴巴A輪投資。公司成立一年零五個月後,合作夥伴和客戶已經涵蓋BAT、小米、360、TCL、海信、海爾、地平線機器人等。
“有機會去實作自己的理想,自然也就沒什麼猶豫,選擇創業是這樣,選擇加入阿裡更是這樣。”付強表示,目前國内在語音的前端處理技術上的積累并不落後,隻是由于語音互動技術鍊條很長,在缺乏對端到端互動系統流程把控和優秀的産品設計前提下,一些更好的想法很難展現出來。
付強相信,“在阿裡這個大平台,會有更好的機會發揮價值。”
此次加盟阿裡的,加上付強共有五人。除了一位來自杜比實驗室的資深專家,其餘四人均是聲學所原班人馬。
“共同特點是能文能武,既能寫出IEEE trans.這樣的領域内國際頂級刊物學術文章,又能深入到實際産品研發。”付強說。
助力阿裡IoT場景落地
4月初,阿裡宣布全面進軍物聯網領域。付強帶領聲學團隊加入,将成為阿裡IoT場景落地的關鍵一環。
去年下半年,前寶利通首席工程師馮津偉加入阿裡,進行上海地鐵語音售票機的研發,這是全球首個強嘈雜環境下的語音互動産品。
付強加盟後将整合資源,推動語音識别技術的場景落地,形成軟硬結合、端雲一體的商用方案,他還将籌建兩個實體聲學實驗室。
“短期目标是幫助語音互動技術在多種場景和終端上落地,在複雜環境下保持正确的識别率。”付強表示,物聯網時代對人機自然互動帶來更高的要求,不同的場景給技術帶來了不同的挑戰——比如地鐵機場等場景:有人流聲音、有喇叭音,背景音嘈雜;家庭場景:噪音沒那麼複雜,但涉及到混響、回聲處理;車載場景:不遠不近、混響小,但涉及到胎噪、風噪等擴散場噪聲
“在這些場景中,我們都有不同的終端産品已經或即将落地量産,在此基礎上,我們會在技術深度和方案的可複制性上有更多的布局。”付強透露,針對IoT化的智能家居的需求,團隊正在研發基于小陣列語音增強技術的低功耗、低成本、高內建的端雲一體語音互動技術和硬體方案。
4月20日,阿裡全資收購大陸唯一的自主嵌入式CPU IP Core公司中天微,很多技術也是面向IoT領域。付強表示,“随着阿裡在晶片上的戰略布局,我們也會在語音專用晶片上有更多進展。”
“阿裡IoT戰略必須要做資源可控、技術可控、擁有核心競争力的事情。”阿裡巴巴CTO張建鋒說,這也是達摩院組建以來最重要的研究突破方向之一。
去年10月,阿裡宣布成立以“達摩院”為名的全球研究院,目前已在全球多點設立科研機構,立足基礎科學、颠覆性技術和應用技術研究。
原文釋出時間為:2018-05-3
本文作者:孫茜茜
本文來自雲栖社群合作夥伴“
天下網商”,了解相關資訊可以關注“
”。