天天看點

百度智能雲曦靈-AI手語平台釋出為聽障人士搭建“有聲橋”

【環球網綜合報道】在剛剛落幕的冰雪賽事中,百度智能雲曦靈為央視新聞打造的AI手語主播正式上崗,她以流暢、專業的手語服務實時傳遞冰雪運動的激情。然而在日常生活中,聽障人士想要友善地擷取資訊仍面臨着衆多困難,無障礙視窗稀缺的問題亟待解決。

3月3日,百度智能雲曦靈正式釋出“AI手語平台”,可實作分鐘級生成手語合成視訊、手語主播實時直播等能力,為手語服務普及的難題提出了科技新解法。同時百度智能雲曦靈還釋出了“AI手語平台一體機”,可以通過規模化部署快速建立無障礙視窗,插電即用、操作簡單,适用于醫院、銀行、車站等多種公共場合,緩解無障礙視窗短缺困境。

百度集團副總裁吳甜表示,人工智能呈現融合創新和降低門檻的新特點,綜合運用多技術的數字人帶來新體驗,AI加持使數字人制作和營運成本與門檻降低,AI手語平台将讓更多聽障人士享受科技帶來的便利。

百度智能雲曦靈-AI手語平台釋出為聽障人士搭建“有聲橋”

(百度集團副總裁吳甜)

AI手語平台+一體機,随時随地建構“無障礙視窗”

目前大陸聽力語言殘障人士達到2780萬以上,而專業的手語翻譯不足1萬人,巨大的需求缺口亟待補足。

在國家釋出的《無障礙環境建設“十四五”實施方案》中,明确提出要完善無障礙基本公共服務體系、加強資訊無障礙服務深度應用。百度智能雲曦靈此次釋出的“AI手語平台”及“AI手語平台一體機”,可以輕松線上上線下不同場景中快速實作手語翻譯服務,助力無障礙環境的建設。

針對線上場景,“AI手語平台”具備“視訊手語合成”、“直播手語合成”、“文本轉手語”、“語音轉手語”四大功能,隻需幾小時的部署,即可實作普通視訊合成為手語視訊、實時直播中增加手語畫面、文字翻譯為手語、語音實時翻譯為手語等多種效果。AI手語平台可搭載在各類APP、網站、小程式中,讓聽障人士也能輕松實作線上社交、娛樂休閑、課程學習等各類需求。

百度智能雲曦靈-AI手語平台釋出為聽障人士搭建“有聲橋”

對于諸如醫院、銀行、機場等線下場景,一體化産品的優勢正在逐漸放大。百度智能雲曦靈此次釋出的全離線一體機V3以及端雲結合一體機P3,搭載了“AI手語平台”的核心功能,可實作ASR語音識别、語音翻譯、人像渲染等多功能,讓“AI手語平台一體機”像手機、電腦一樣可快速、批量的生産,并滲透到生活的各個角落。

百度智能雲曦靈-AI手語平台釋出為聽障人士搭建“有聲橋”

未來通過“AI手語平台一體機”即可将普通服務視窗直接轉換為“無障礙視窗”,聽障人士在醫院可輕松實作挂号、看診、繳費、取藥等全系列流程,在車站、機場可獨立完成值機、托運、改簽、中轉,在法院、警局等特殊場景中也可對各類緊急情況進行實時平等的溝通。

百度智能雲曦靈-AI手語平台釋出為聽障人士搭建“有聲橋”

高可懂度手語表達的背後,是技術的創新與沉澱

和傳統翻譯相比,手語翻譯過程更為複雜,主要在于手語翻譯并非按照日常說話的順序逐字翻譯,而要根據語句意思進行語言精煉和語序調整。手語是真正的小語種,資料量難以支撐訓練,各類場景聲學環境複雜難部署,還需要唇語及表情的配合輔助了解,對AI手語平台的建構提出層層挑戰。

想實作高可懂度的AI手語能力要解決三大技術點:語音識别的清晰度、手語翻譯的準确度、手語動作的流暢度。在經過開幕式、賽事播報等重重考驗,AI手語主播也印證着“AI手語平台”已成功解決這三大難題,以行業領先的全鍊路AI能力實作“聽得清”、“翻得準”、“打得好”的手語服務。

首先,在語音識别清晰度上,百度智能雲曦靈-AI手語平台通過SMLTA語音識别算法模型,實作聲學、語言一體化端到端模組化語音識别,在手機端近場語音識别率可達98%以上。百度語音技術部總監高亮表示,基于百度自研的深度學習算法,還可針對諸如旅遊、醫院、司法等不同領域的詞準率進行針對性訓練,詞準率可達96%,使得AI手語平台一體機更好地應用于不同場景中。

百度智能雲曦靈-AI手語平台釋出為聽障人士搭建“有聲橋”

(百度語音技術部總監高亮)

其次,在手語翻譯的準确度及精煉度上,百度人工智能技術委員會主席何中軍表示,百度研發了首個基于神經網絡的精煉度可控手語翻譯模型,并聯合手語語言學專家、特殊教育專家以及天津理工大學聾人工學院等制定了自然手語标注規範,建設了大規模自然手語翻譯語料庫,使得模型可以從真實資料中學習手語翻譯知識,比如語序的調整、詞語的映射以及長度控制等,進而生成符合聽障人群習慣的自然手語。

百度智能雲曦靈-AI手語平台釋出為聽障人士搭建“有聲橋”

(百度人工智能技術委員會主席何中軍)

天津理工大學聾人工學院副院長袁甜甜在釋出會上分享到,聾人學生更能感同身受,不錯過每一個細節。由于時間緊任務重,學生們還自發呼籲其他各高校近五百名聾人學生共同完成語料庫的标注,以責任感和榮譽感為彌補社會資訊鴻溝做出努力。

百度智能雲曦靈-AI手語平台釋出為聽障人士搭建“有聲橋”

(天津理工大學聾人工學院副院長袁甜甜)

最後,在手語動作的流暢度上, AI手語平台通過“動作融合算法”, 基于《國家通用手語詞典》規範精修近11000多個手語動作,讓每一個動作的起落之間自然銜接,帶來真人手語般地連貫性表達。再配合4D掃描技術訓練,使得AI手語數字人表情自然生動,口型生成準确度高達98.5%。

在會後的體驗中記者看到,隻需要将錄制好的視訊傳輸到 “AI手語平台”,經過處理就能夠輸出已經融合了手語翻譯的視訊,進行傳播十分友善。而在從業人員的示範中,隻需要對着話筒說話,稍後螢幕上的數字人就能以手語将語義翻譯出來。不過從業人員介紹說,這一功能目前還不完善,仍處于繼續開發中。

相關負責人表示,百度智能雲曦靈的 “AI手語平台”現階段還主要以服務機場、火車站、醫院或者媒體機構的公共需求為主,語言與手語的實時翻譯功能還會繼續努力開發,當有最新進展之後會及時向社會公布,希望能夠幫助聽障人群能夠更順暢地進行日常溝通。

無障礙環境建設直接決定着殘障人士的生活品質,也是國家及社會文明的标志。百度智能雲曦靈“AI手語平台”及“AI手語平台一體機”的釋出,将快速解決各類場景中無障礙視窗稀缺的問題,助力社會文明及美好生活的持續建構。

百度智能雲曦靈-AI手語平台釋出為聽障人士搭建“有聲橋”

繼續閱讀