天天看點

教AI主播“說”手語 他們讓更多人“聽見”冬奧

新華社天津2月18日電(記者白佳麗、宋瑞)對聽障人士來說,激烈的賽事往往隻能被看見,卻無法被聽見。而今年的北京冬奧會上,不少聽障人士發現,賽事新聞中出現了一名面容清秀的冬奧新聞AI主播,“她”精準的手語手勢讓聽障人士與健聽人(聽力健全人的簡稱)一樣,可以同步感受冰雪運動的魅力。

“用技術跨越聲音的障礙,讓聽障人士‘聽見’冬奧。”天津理工大學聾人工學院副院長、冬奧新聞AI主播的手語資料庫支援團隊負責人袁甜甜說。

教AI主播“說”手語 他們讓更多人“聽見”冬奧

海報制作:方金洋

用6年時間搭一座“溝通的橋”

袁甜甜身上,有股堅持到底的韌勁。

她帶領團隊用6年時間,為聽障人士搭建了一座與健聽人無障礙溝通的“橋梁”。并在北京冬奧會上,邁出了落地應用的“第一步”。

“我們研發了一套系統,叫作‘複雜場景下中國手語實時翻譯系統’,這套系統能将輸入的手語動作和表情經由計算機視覺技術識别後翻譯成文字或語音。為此,我們共收集了20多萬條語料。”袁甜甜說。

談到做這件事的初衷,袁甜甜表示是為了與聽障學生更好地交流。

教AI主播“說”手語 他們讓更多人“聽見”冬奧

天津理工大學聾人工學院學生通過手機App為手語識别系統進行資料采集。新華社記者 孫凡越 攝

“我16年前來到學院當老師,與聽障學生接觸的過程中,發現他們最渴望也最懼怕的就是與健聽人交流。因為有網絡專業背景,于是我決心通過技術改變這種現狀。”袁甜甜說。

從一個人摸索,到僅有一名聽障學生加入,再到成立無障礙智能科技研發團隊。如今,這支由健聽人與聽障人士組成的“特殊”技術團隊,核心成員達50多人,其中不少是“00後”聽障學生。

随着團隊的發展壯大,技術難關也被層層攻破。“目前,我們實作了在光線充足且穩定的室内,系統對手語的識别率最高達95%,部分場景下可以實作‘同步翻譯’。”袁甜甜自豪地補充,“隻要在攝像頭前打出手語,顯示屏上就會出現語意連貫的文字翻譯。現在已經可以用于教育、法律咨詢、餐飲、交通多個場景。”

讓聽障人士“聽見”冬奧

2021年11月,袁甜甜接到一個緊急任務——教冬奧新聞AI主播“說”手語。

“人工智能深度學習的過程,就像教小孩子學說話,每一個詞、每一個手語動作都需要重複‘學習’才能實作精準無誤。”袁甜甜與同伴們開始一一攻克難題。

第一時間參與其中的聾人工學院教師闵笛對這一過程深有體會。“一個字‘難’。”他說。

首先擺在面前的,就是“冷門”的冬奧詞彙,以及專業新聞語言,怎麼才能轉換為大多數聽障人士能看懂的手語?

團隊成員先把整理出的新詞形成一定的手語打法,再讓手語專家一一判定聽障人士能否看懂。遇到難用手語表示的詞彙時,還需多番讨論。“每個詞至少要經曆這樣兩個來回,就這樣我們共新增了1000多個專業詞彙的手語打法。”闵笛說。

有了過去20多萬條語料做基礎,又增加了新的專業詞彙,本以為工作已接近完成。但很快大家發現,手語語序與普通人說話語序并不相同,即便把這些詞彙通通“灌輸”給AI主播,也無法打出連貫的、聽障人士能夠了解的語句。

“我們通過多年積累的技術經驗,讓AI主播逐漸掌握從普通人語言到手語的流暢直譯,并不斷調試AI主播手語速度,讓聽障人士能夠更清晰地了解。”闵笛說。

用技術破解更多“52赫茲”的密碼

今年22歲的王曉陽,是聾人工學院大三的學生。作為一名聽障學生,他參與了冬奧新聞AI主播“學習”手語的全過程。從冬奧會開幕那天起,他每天都會準時打開手機“盯着”AI主播的每一個手語手勢。

“就怕她沒學好,怕她出錯!”王曉陽用手語解釋。但令他欣慰的是,越來越多聽障朋友發來資訊,告訴他AI主播的手語“看得清楚、清晰”。“手語打得很漂亮,我們為自己驕傲。”一旁的同學魏翔羽用手語補充。

教AI主播“說”手語 他們讓更多人“聽見”冬奧

天津理工大學聾人工學院學生在進行手語識别系統調試。新華社記者 孫凡越 攝

技術越過聲音的障礙,讓更多聽障人士走向更廣闊的世界。

“資訊技術對我們幫助很大。”王曉陽用手語說,以前與健聽人交流,他總覺得不安,有了這些技術手段,讓他更有勇氣融入社會。“以後我想當老師,因為我的家鄉缺少聾人老師。或者我去當程式員,用技術讓更多人聾人‘聽見’。”

對袁甜甜來說,還有很多工作等着她帶領團隊完成。“我們将不斷疊代更新我們的系統,直到它能夠在各種場景下讓聽障人士與我們流暢交流。”

袁甜甜講了一個“52赫茲鲸”的故事——海洋中,有隻叫聲頻率與衆不同的鲸魚,因無法與同類交流而孤獨。這隻鲸魚很像聽障群體,“我們要去破解‘52赫茲’的密碼,用技術把孤獨的鲸魚與其他鲸魚連起,讓它們獲得更多機會與幸福。”