天天看點

人工智能專用晶片的五年浪潮,如今怎樣了?

AI晶片應用領域不斷向多元度方向發展,例如CV(計算機視覺)、自動駕駛、智能手機以及語音互動。而在語音互動領域,中國智能語音市場正在維持高速增長。根據德勤報告顯示,預計2030年消費級應用場景超過700億元,企業級場景達到發展空間也預計将達到千億級規模。

為了讓智能終端擁有更好的互動體驗,針對語音算法打造相比對的AI晶片,采用軟硬一體化的解決方案幾乎是目前行業最為普遍的選擇,這也是技術疊代的必然路徑。如今智能語音賽道雲集了衆多玩家,如百度、科大訊飛、雲知聲、思必馳、出門問問、啟英泰倫等都紛紛布局了晶片産業。

解決專用晶片技術問題,企業仍需打破的商業化壁壘

智能語音在技術關聯和資料層次上天生具有更高的複雜度,單單自然語言了解和處理的能力就花費了科學家們數十年的心血才換來今日的互動體驗。而能夠将語音識别、語義了解、自然語言處理、語音合成、聲音降噪等技術實作“雲端芯”一體化,把業務延伸到晶片甚至硬體,才是将技術商業化的合理路徑。

通用晶片架構并非為AI專門設計,天然存在性能、功耗等方面的局限性已是老生常談。近幾年在業内衆多企業的努力下,解決了傳統通用晶片的适配問題,公司也紛紛投入到專用晶片的制造。

在技術問題得到解決後,AI語音晶片在商業化的道路上仍面臨很多挑戰:

l 首先,如何達到在成本限制下的性能最優化。智能語音技術是緊耦合的,東拼西湊的技術無法得到理想的互動效果。需要納入考量的是将全棧式的解決方案搭載到晶片上,同時每多一項功能就意味着成本的增加。低成本、易實施、低功耗的産品特點需要與解決方案密切結合。

l 第二,縱觀布局AI語音晶片公司,它們所選的應用終端都集中在家居、電器、機器人、車載等場景。然而這幾類場景産品品類衆多分散是一大特點,尤其是家居電器,大到一台空調,小到一個插座都有對語音晶片的需求。如何在這些裝置上适配晶片,判斷晶片每一項效用的必要性,都需要對終端産品功能Know-How有着深刻的掌握。

l 第三,由于客戶廠商天然的分散性,标準産品加工具定制是最高效的合作模式。擁有高效的工具鍊,降低定制化所需要的時間以及邊際成本,将會很大程度提升語音晶片商業化程序。

千萬級出貨量,企業是怎麼做到得“芯”應手的?

雲知聲作為行業内第一批布局邊緣側晶片設計并提供軟硬一體産品的企業之一,到如已經基于自研或第三方晶片釋出三代共6款全棧語音AI晶片軟硬一體産品,晶片及模組出貨量已達千萬級水準,積累近800家合作客戶。

早在2015年雲知聲就開始搭建晶片團隊,不僅來自于其行業嗅覺,也是環境使然。雲知聲的晶片方案均内置了為語音識别而優化的深度神經網絡加速方案,實作裝置的語音離線上識别。與此同時,語音互動的核心環節也取得了重大的突破。語音識别環節突破了單點能力,從遠場識别,到語音分析和語義了解也有了巨大提升,呈現出整體的互動方案。

人工智能專用晶片的五年浪潮,如今怎樣了?

2018年,雲知聲第一代UniOne“雨燕”(Swift)晶片第一次流片成功并量産出貨。“雨燕”晶片,是雲知聲針對智能家居語音互動場景推出的高性能、低成本、一體化的晶片解決方案。“雨燕”架構内置的數字信号處理器uDSP,以及AI加速器DeepNet(雲知聲完全自主研發的深度神經網絡處理器,NPU),支援DNN/LSTM/CNN等多種深度神經網絡模型,能實作語音識别、了解、合成所需的深度學習計算加速。和通用CPU相比,這款ASIC晶片的處理速度和效率都有明顯提升。

行業Know-How的積累

對于業務的場景選擇,雲知聲的端側智能語音晶片精準面向小家電市場。這條賽道的選擇契機是始于自2014年與格力、美的等電器廠商的合作。在此領域,雲知聲已經積累了7年有餘的經驗,對于場景和電器産品的特點駕輕就熟。

以麥克風陣列的技術為例,毋庸置疑的是,麥克風越多越容易實作更好的降噪和語音增強效果。但比起行業内炒的如火如荼的多麥克陣列方案,單麥克卻成為了家電産業中出貨量最大的方案。這是因為效果的差别僅對具有聲源定位需求的産品存在影響,而對于家電市場,一些本來就需要靠牆擺放的裝置如空調、電視機等,八麥克風陣列的應用明顯是多餘的。是以考慮到實施成本、結構設計和生産安裝等方面,單雙麥克是該應用場景最适合搭載的方案——這些經驗就來自于對行業功能Know-How的掌握。

于是雲知聲面向小家電市場的二代晶片“蜂鳥”(Hummingbird)在2019年流片成功。“蜂鳥” 晶片是雲知聲專門為離線遠場語音互動場景設計的高性能,高內建度,高成本效益的語音智能IoT晶片。相比語音行業通用晶片“雨燕”,“蜂鳥”晶片定位更輕巧靈活,可以持續降低适配裝置的門檻,為客戶提供成本效益更高的解決方案。

人工智能專用晶片的五年浪潮,如今怎樣了?

蜂鳥系列晶片應用了遠場拾音、高性能識别、低功耗喚醒的功能。配備單雙麥克可實作10米遠場拾音,安靜環境5米識别率達到95%以上。主要面對家居環境下的廚房、客廳、卧室、浴室等在内的白電和小家電(燈具、廚電、智能插座等)産品領域。作為白電和小家電領域領先大規模量産的語音方案,蜂鳥及相關系列的晶片出貨量達到千萬級。覆寫了包括格力、美的、海爾、奧克斯、華帝等國内一線家電廠商。

與此同時,随着大衆對使用者隐私問題的關注,相較于需要系統連接配接上傳資料的雲端服務,特定場景下離線語音互動的需求在逐漸增加。低功耗、低成本、快速響應以及融合離線上的互動模式,系統能智能決策離線上的處理方式都成為研發語音AI晶片的必要條件。是以雲知聲的晶片産品矩陣也布局了面向車載市場的高端晶片。

雲知聲與吉利集團旗下億咖通成立合資公司芯智科技,并推出了一款高性能車規級離線上語音晶片“雪豹”(Leopard),預計搭載該晶片的車型在今年上市。這款晶片也集合了雲知聲的感覺和認知技術。面向車載網絡環境不穩定的特性,在純離線場景下,”雪豹”提供堪比線上體驗的自然語言互動和全國範圍内尋址,以及多麥克風降噪功能。同時雪豹獲得車規級AEC-Q100認證,具有完全自主知識産權,為汽車提供純本地語音解決方案。這種本地化的服務,不僅能讓使用者體驗到流暢的語音互動功能,還可以解決使用者的隐私洩露問題。

人工智能專用晶片的五年浪潮,如今怎樣了?

随着自動駕駛和智能座艙也成為炙手可熱的行業,基于車聯網的以車輛為中心的生态系統建設也是加速智能語音企業發展的戰略方向。将網際網路生态、使用者個性、環境互動等充分融合,毫無疑問也是雲知聲選擇專攻車載晶片的考量。

以便捷的工具賦能高效化産品落地

在物聯網的不同應用場景下,海量終端裝置要實作功能智能化必須雲端配合,即形成邊緣算力和雲端算力的動态平衡。雲端互動的命題需要 AI 晶片的強有力支援,進一步也深刻影響到晶片的設計以及最終的傳遞。

随着2021年Google推出的Switch Transformer模型将小樣本甚至零樣本的學習能力重新整理大衆認知,預訓練大模型也預示着AI技術新風向的爆發。人們可以更加順利地在模型注入需要學習的知識,就意味着複雜和大量定制任務得以實作适配和推理計算。同樣,雲知聲也利用預訓練模型高效地解決物聯網産品定制的痛點,為AIoT産品定制建立了開發者平台。

語音控制、對接IoT控制以及裝置控制,通過平台自助生成能達到算法原廠線下支援和研發人員的編碼實作的效果,将原本需要幾周的工作周期下降到30分鐘。例如,離線标準方案可以進行麥克數量與間距配置、自定義喚醒詞、音色配置、指令詞和應答語自定義并且進行一鍵下載下傳版本燒錄。客戶隻需要專注自己熟悉的電控部分,無需額外的硬體能力即可定制專屬智能語音方案。

标準化的傳遞模式極大降低了用戶端的門檻,通過産品端,雲端一站式開發,快速實作智能語音控制,讓零基礎企業輕松實作智能化。再加上強營運的特點,平台支援上百種可供配置的雲端技能,同時還可自定義技能或者接入第三方技能。截至目前,活躍客戶在該平台已建構超過25000個産品版本。

結語

近十年來,AI技術不斷取得突破性競争,百花齊放的AI行業也将迎來它的後半場。面對現階段繁榮的智能語音市場以及網際網路巨頭的加入,盡管技術水準差不多的企業,在垂直行業和細分場景的取舍也會造成截然不同的導向,AI晶片的落地和場景也需要進行密切結合。

在解決功能限制下的性能最優化、不同場景下自由配置、便捷工具鍊的問題後,以雲知聲為代表的智能語音技術企業需要繼續加速垂直行業進行滲透和布局,讓智能語音賦能多形态的終端,以“中國芯”的力量協同建構全産業生态圈。

雷峰網

繼續閱讀