天天看點

智能音箱借ChatGPT重獲“新生”?

作者:人人都是産品經理
智能音箱市場正在逐漸進入“冷靜期”,從部分資料可以看到,有關智能音箱的市場需求也在逐漸消退中。那麼在這樣的情況下,ChatGPT的出現是否可以為智能音箱帶來新的增長空間,又或者帶來智能應用的新場景?一起來看看作者的解讀。
智能音箱借ChatGPT重獲“新生”?

曾經靠語音助手紅極一時的智能音箱,近年來的市場表現卻欠佳。據洛圖科技釋出的最新《中國智能音箱零售市場月度追蹤》報告顯示,2022年中國智能音箱總銷量為2631萬台,同比下降28%;市場銷售額為75.3億元,同比下降25%。而IDC釋出的2023年中國智能家居市場的十大洞察也透露,智能音箱的市場需求正在逐漸消退,整個市場呈現下滑趨勢。

但随着ChatGPT這種生成式AI技術的快速發展,搭載ChatGPT的智能音箱将有望獲得新的增長空間。據中泰證券分析,目前全球存量智能音箱超7億台,如考慮産品本身3-5年左右的替換周期,本輪ChatGPT帶來的替換需求或在1.4億-2億台每年,有望再次成為市場熱點。在此基礎上,智能音箱的互動水準也将有望再上新台階。

一、ChatGPT或成新變量

一直以來,市場上的智能音箱産品多多少少都存在着互動體驗差、應用場景單一、産品缺乏創新,以及互聯互通差等問題,而當下以ChatGPT為代表的生成式AI技術,則在上下文了解、多輪對話、内容生成等方面,展現出了極高的互動水準,ChatGPT或将為智能音箱帶來新的變量。

一來,依托于ChatGPT在内容生成和了解能力上的優勢,智能音箱的應用場景将進一步被擴充。

ChatGPT具有在對話系統、文本生成、語音識别和文本分類等多種場景中的應用優勢。具體來說,在對話系統中,ChatGPT可以生成自然流暢的對話内容,支援多輪對話;在文本生成中,ChatGPT可以生成高品質的文本内容,支援多種文本生成任務;在語音識别中,ChatGPT支援多語種語音識别,提供全面的語音互動體驗;在文本分類中,ChatGPT可以應用于多種文本分類任務,自動學習特征,提高分類效果和效率。ChatGPT的多領域應用優勢,使得它成為自然語言處理領域的重要工具之一。

也就是說,搭載了ChatGPT的智能音箱可以進一步了解使用者的意圖,讓回答内容的品質能夠更趨向于真人的表現。未來,智能音箱的功能可能并不止于家庭,或許會走進辦公場所成為人們工作的助手等。

二來,ChatGPT也正在帶動智能音箱産業成為資本的焦點。

随着ChatGPT在全球的走紅,作為人工智能互動載體的智能音箱再次成為市場熱點,包括奮達科技、漫步者、惠威科技、國光電器等在内的智能音箱概念股,近期都出現了大漲行情,資金湧入迹象十分明顯。可以說,在智能音箱産業進入瓶頸期的當下,ChatGPT的出現又将智能音箱重新拉回了大衆視野,并為其帶來了全新的可能。

當然,ChatGPT能為智能音箱産業帶來多少新變量,還需等到搭載着ChatGPT的智能音箱真正走進萬千家庭才能知曉。

二、小度更聰明

目前為止,智能音箱與生成式AI技術的結合已經在巨頭玩家中初現雛形。據悉,今年2月9日,小度宣布将融合文心一言,打造針對智能裝置場景的AI模型“小度靈機”,并将其應用到小度全系産品中。借助小度靈機大模型,小度智能音箱中的語音助手可以變成“超級助理”。

其一,借助小度靈機大模型,小度智能音箱擁有了提取和整合複雜資訊的能力。

在官方釋出的測試視訊中,測試員告訴超級助理,他要在周末做各種各樣的事情,而在叙述這些事的時候,測試員會故意提出“修改時間”的要求,比如原定于周日要做的A事件被B事件替換。即使面對測試員的一系列複雜要求,這位超級助理也可以從中提煉出真正有效的資訊,并據此給測試員生成一份正确的時間安排表。

而此前的小度智能音箱并沒有了解和提取整合這樣複雜資訊的能力,可見小度靈機模型的作用展現得比較明顯。

其二,在智能家居場景中的裝置控制環節,小度靈機大模型能更準确地識别出使用者的真實需求。

在智能家居場景中,小度靈機大模型可以化身為“智能管家”,例如在官方的測試中,測試員告訴智能管家他每天早上七點半一定要起床,周末可以晚一些,大概九點,幹脆就九點半,冬天室内溫度不能低于23度,夏天溫度可以定在26度。此時,超級助理就可以根據這些描述,确定要在什麼時候開啟家中的空調、調整到什麼樣的溫度比較合适。

相比傳統智能助手隻會了解“打開空調”這樣簡單、單一的指令,靈機模型則可以認識到使用者到家時,家裡溫度與使用者所期望的不一樣,是以需要打開空調,并且根據現在的季節調節到合适的溫度。顯然,大模型的加入,可以讓智能音箱實作認知能力上的提升。

三、天貓精靈更有溫度

另一智能音箱領域的巨頭玩家天貓精靈,也亮出了其在生成式AI技術領域的成果積累。4月11日,天貓精靈宣布将正式接入阿裡巴巴通義千問。根據官網顯示的資訊,通義千問是一個專門響應人類指令的大模型,目前已經開啟了企業邀請測試,并放出了測試官網。

據阿裡巴巴集團董事會主席兼首席執行官、阿裡雲智能集團首席執行官張勇透露,未來,天貓精靈除了能回答使用者的提問外,還會成為更人性化的智能助手,天貓精靈的政策是針對智能音箱訓練出一個個性更為鮮明的大模型。

一方面,接入通義千問的天貓精靈能夠産生一些特定的人格化特征,滿足使用者的個性化需求。

不同于知識面更為廣泛的通識性大模型,天貓精靈在通義千問這種更加垂直的個性化大模型的加持下,能夠變得更拟人、更聰明,其知識、情感、個性、記憶力等都會得到大幅躍升。比如“鳥鳥分鳥”這一模型,其語氣、語調與脫口秀演員鳥鳥就如出一轍,這樣也增加了天貓精靈的可玩性,使其成為有溫度的智能化助手。

另一方面,新一代的天貓精靈将具備更為靈活的對話能力。

接入通義千問的天貓精靈支援自由對話,使用者可以随時打斷或者切換話題,天貓精靈能根據使用者需求和場景随時生成内容。例如,使用者在跑步過程中,可以要求天貓精靈根據180步頻合成适合跑步的歌單,同時還可以與天貓精靈展開關于文化、人生等領域的深入交流。

得益于通義千問強大的技術支援,天貓精靈的使用者體驗将更具智能化和個性化。而在正式接入通義千問之後,天貓精靈在未來一段時間或許會出現比較大幅度的使用體驗提升,這或許也可以幫助阿裡巴巴進一步鞏固其在智能音箱市場的領先地位。

四、現實壁壘

事實上,不隻是小度和天貓精靈在ChatGPT領域有所布局,華為、小米等也在生成式AI技術以及智能音箱領域均有布局。不過,要想讓搭載着生成式AI技術的智能音箱真正在每一個使用者家中實作普及,其背後還存着一些天然壁壘。

一是,算力成本高昂。從算力層面來看,面對參數規模的大幅增長,“暴力堆疊”(利用大量高性能GPU)已經成為企業提升大模型訓練效果的主要手段,這背後高昂的成本可能将會成為ChatGPT版智能音箱落地普及的門檻。

不過,随着開源大模型的出現,一些企業不需要自己從0到1去訓練大模型,被訓練好的大模型可以直接調用,再在這一基礎上進行優化,這相比于從頭開始訓練的大模型,其成本将少得多。并且,未來随着算法進化,大模型訓練過程中對算力的依賴度也會大大降低。

二是,搭載ChatGPT的智能音箱的使用場景受限。

ChatGPT爆火的很大一部分原因是它可以颠覆式提升生産效率,而這種輸出方式主要是以文字、圖檔、視訊為主,但智能音箱則更注重語音互動。而且在人們的日常生活和工作中,需要音頻回報的内容可能隻占一小部分,是以ChatGPT版智能音箱的普及落地需要尋找更多的适配于語音互動的場景,而使用場景受限則意味着使用ChatGPT版智能音箱可能很快也會褪去熱度。

三是,搭載ChatGPT的智能音箱可能面臨資料安全挑戰。

若想要搭載生成式AI技術的智能音箱能夠更好地了解使用者需求,并給出個性化的解決方案,那麼生成式AI勢必會涉及對使用者個人資訊的收集,而使用者對于個人隐私的收集問題一直都比較敏感。另外,相關的法律法規并不健全,這都将是ChatGPT版智能音箱在普及過程中面臨的挑戰。

此外,ChatGPT對智能音箱整個産業的影響必然是一個長期的過程,而生成式AI技術仍處于發展早期,其對于智能音箱這一産業所産生的切實影響可能還未明确展現出來,但可以預見的是,ChatGPT引爆的熱潮正在加速這一程序。

專欄作家

劉曠,微信公衆号:劉曠(liukuang110),人人都是産品經理專欄作家。海南三車網絡科技有限公司董事長、購團邦資訊創始人、知名自媒體。

題圖來自Unsplash,基于CC0協定。

該文觀點僅代表作者本人,人人都是産品經理平台僅提供資訊存儲空間服務。

繼續閱讀