天天看點

亞馬遜再現新技術突破,語音助手Alexa實作聽聲識人

繼今年4 月Google Home音箱添加了人聲識别功能後,亞馬遜也緊随其後。據雷鋒網了解,亞馬遜近日宣布,其智能助理 Alexa 也添加了相似的功能,賦予其做出個性化回應的能力,并将在未來幾天内推出。這意味着不同的家庭成員将能夠通過Alexa裝置的語音識别獲得個性化的體驗。使用者可以擷取自己的新聞簡報、購物結果、消息和音樂播放清單等。

Alexa為不同使用者提供個性化應答

亞馬遜表示,語音助手Alexa将“變得更智能”,其具有個性化的應答會更受人們歡迎。比如家裡的小孩子向Alexa提問時,Alexa會提供使用者平常愛聽的音樂播放清單。若孩子父母提問時,Alexa則會提供新聞簡訊、日程提醒等。這項功能的設定方式類似于在電話中設定谷歌助手或Siri。使用者隻要使用移動應用程式,在設定中選擇“你的聲音”,随後便可以通過朗讀指定短語對 Echo 進行語音識别設定,Alexa 将使用這些資料建立語音配置檔案。設定完成後,配置檔案可以在使用者的其它 Echo 裝置以及大多數第三方支援 Alexa 的音箱上使用。

據外媒報道,目前亞馬遜 Alexa 的技能已經超過 1.5 萬個,遠遠超過其對手谷歌助手(Google Assistant)和微軟的 Cortana。

在具備的技能類型這方面,新聞簡訊(Flash Briefings)仍然是 Alexa 最受歡迎的技能之一。新聞簡訊的節目時長一般在90秒左右,使用者隻要對 Alexa 說一句“Alexa,給我今天的新聞簡訊”,Echo 就會第一時間播報最新的新聞節目。而且據說這款資訊類技能開發起來相對比較簡單。

根據極客公園從國内相關從業者了解到的資料,在所有使用過 Alexa 的使用者中,有 34% 使用了音樂播放的功能,30% 使用過燈光控制,25% 使用了定時功能,更多的還是一些基礎的控制功能,而像打車、購物這些服務的使用并沒有占據太大的比例。至于使用場景,則有 50% 是發生在廚房中,Alexa的主要使用者是家庭主婦。

亞馬遜對待 Alexa 的态度偏向開放。據雷鋒網了解,去年 6 月亞馬遜将 Alexa 的 API 都開放給了開發者,這令它得以快速地普及和更快的成長。

值得注意的是,亞馬遜還特别設立了 Alexa 基金,計劃投資 1 億美元去資助那些中小型企業和初創公司開發 Alexa 相關的技術。2017 CES 上一家音頻廠商表示,為普通裝置接入 Alexa 的晶片成本較低,同時亞馬遜還為他們提供了非常詳盡的指導,是以可以非常便捷地完成開發工作。

亞馬遜欲與蘋果攜手優化Alexa

亞馬遜負責Alexa和Echo裝置的副總裁Toni Reid表示,如果合作有助于Alexa語音助手的體驗,那麼亞馬遜願意與競争對手蘋果和谷歌合作。

強強聯手總是商界必不可少的定律,但除了擁有強大的合作夥伴,還需要招納賢才。Toni Reid還透露,目前亞馬遜已經有5000名員工投入到Echo智能音箱和Alexa語音助手的研發之中。但這個人員規模對于亞馬遜來說仍需要繼續擴大,他們希望能夠與全世界最優秀的開發者精英攜手完善Alexa的功能。

為開發Alexa語音購物系統,亞馬遜将建以色列研發中心

近幾年來,除了蘋果、微軟以及Facebook在以色列紛紛成立研發基地以外,亞馬遜也在這裡表現活躍 。在2015年1月,亞馬遜收購了以色列晶片技術企業Annapurna Labs,這家公司位于以色列北部城市Yokne’am,約有200名員工,這些人員都在從事AWS雲計算服務的開發,此外還涉及亞馬遜其他的研發項目。亞馬遜最近也專注于Annapurna Labs的業務。

據雷鋒網了解,上周亞馬遜宣布将在以色列成立兩個研發中心,分别位于特拉維夫和北部海濱城市海法,共有100名員工。亞馬遜此舉是為了進一步更新其Alexa語音購物系統,友善使用者以語音完成訂單,省掉打字的煩擾以及提高工作效率,而此次的“聽聲識人”的技術也許将會與語音購物系統進行融合,更精準的為人們提升購物的體驗。

雷鋒網(公衆号:雷鋒網)獲悉,亞馬遜最近聘用了前微軟以色列研發負責人兼董事會成員Eyal Itah,使其上司Alexa語音購物系統開發業務。另外,雅虎前研究負責人Yoelle Maarek也已經被任命為亞馬遜國際研發副總裁。

亞馬遜聲控購物業務副總裁艾瑟夫·羅恩Assaf Ronen對這兩位精英抱有較高評價。他表示,“我們決心利用以色列人才繼續發展研發團隊。尤艾樂和埃亞勒能力出衆,經驗豐富,他們可以上司由研究員和工程師組成的新團隊,為這些聲控産品開創未來。”

對于Alexa,“語音互動技術到底成熟了沒有?”這個質疑的聲音經常出現在關注語音互動技術的人們當中。有業内人士表示,如果僅僅從語音識别這點來看,仍然還有很多的問題需要解決。比如,語音互動的落地首先要解決的是真實場景下的語音識别,要考慮說話者與機器的距離,如果要實作使用者在屋子任何位置的語音指令都能被機器識别,這就需要考慮到對噪聲、混響、回聲等幹擾聲音的處理。盡管業内人士存有質疑,但亞馬遜不斷取得新的技術突破這點依然值得我們關注和期待。

本文作者:欣彤Iris

繼續閱讀