天天看點

特稿丨當速記員遭遇AIGC

作者:王琦 785

21世紀經濟報道 記者郭美婷 實習生林婉娜 麥子浩 廣州報道

在ChatGPT點燃全網熱情的時候,嚴虹并不為所動。

這樣的“狼來了”,在速記這一行已經喊過無數次,“現在都已經無感了。”

速記是一門将稍縱即逝的口語轉化為書面文字的職業。在全國多個大型會議中,常常能看到速記員(業内官方稱速錄師)的身影。但速記的圈子又很小,今天,在一線城市,如北京,有兩百多名速錄師,而在二三線省市,如貴州,這一數字僅為4人。

ChatGPT帶火了AI大模型,而AI大模型正逐漸賦能于具體行業的具體領域。目前來看,語音識别賽道率先有了動作。

6月1日,阿裡雲宣布聚焦音視訊内容的AI新品“通義聽悟”正式上線,成為國内首個開放公測的大模型應用産品。通義聽悟接入了通義千問大模型的了解與摘要能力,能夠完成對音視訊内容的轉寫、檢索、摘要和整理。

6月9日,科大訊飛的軟體産品“訊飛聽見會寫”也迎來了訊飛星火大模型釋出會後的首次大版本更新。據介紹,訊飛聽見會寫不單內建了語音轉文字的能力,還能提煉出會議紀要、生成待辦事項,利用AI編寫稿件等。

不少人預測,ChatGPT的出現标志着新一輪産業革命的開始——這一次,“狼”真的要來了嗎?

“反向宣傳”

速記員會不會被AI取代?十幾年的職業生涯中,李君隔三岔五總得被問一遭。

在大陸,現代速記可以追溯到19世紀90年代末,但行業在2000年後才真正發展起來。2003年,速錄師正式收入《中華人民共和國職業分類大典》,在當時媒體的描述中,速記是一個“新興朝陽職業”,高薪且人才告缺。2013年,北京市速記協會披露資料稱,全國文秘速錄人才缺口已達到25萬左右。

李君就是在那幾年入行的。她出身于貴州貧困山區,因一次扶貧活動進入冰心女兒吳青開設的農家女學校,經過公益教育訓練後,“陰差陽錯”地學了出來。

那時候她還沒有人工智能的概念,也不知道語音識别。“我剛出來工作時買的第一台手機恰好用的是訊飛輸入法,我第一次知道‘訊飛’倆字。”隻是李君不知道,在後續多年中,外界關于她所從事職業的讨論,将始終伴随着以這兩個字被代表的一批智能語音識别企業的崛起。

從2016年李世石慘敗阿爾法狗,到2022年底ChatGPT橫空出世,AI的智能程度一次次颠覆了人們的認知。近期,關于AI取代人類崗位的言論再起,滿城風雨。

但在速錄師自己的圈子裡,AI技術的進步似乎暫時還跟不上他們業務擴充的速度。最早的時候,李君在北京工作,後來回到貴州,開始也隻是給外地同行整理錄音,本地很難接到活計。随着經濟快速發展,數博會、酒博會、生态會等标志性大型活動越來越多地在貴州舉辦,當地會議市場逐漸興起,速記也是以有了更廣闊的“用武之地”。李君感覺,至少在疫情到來之前,速記的發展勢頭是一年比一年猛的。

從報酬來看,據北京速記協會出身的元元介紹,鑒于速錄師的資曆水準、服務的客戶群體、速錄文稿用途等客觀因素不同,收費标準各異,一般在600-3000元/半天。

多位速記從業者向21記者回報,相比于AI,真正給行業帶來切膚之痛的是疫情。疫情前,李君的平均月收入在1.5萬左右,而突如其來的疫情使得大量會議無法線下召開,她的收入在前幾年近乎腰斬,今年市場也許會逐漸回暖。

AI當然也會有影響。來自北京的速錄師嚴虹偶爾會聽到同行抱怨,語音識别讓他們失去了一些大客戶。一些要求不高、難度不大的速錄工作,通過人工智能技術即可完成。

但也存在一些有意思的現象。李君和嚴虹均提到,原本,除北上廣深等一線城市,速記的知名度并不高,很多地方甚至不知道這一行的存在。而AI、語音識别相關企業鋪天蓋地的推廣,竟也反向宣傳和科普了一把速記行業。她們損失了一部分老客戶,同時也結識了許多新客戶,或者有的客戶試用了一段時間的語音識别後,又倒回頭來找了速記。

深圳市黑匣子速記有限公司(下稱“黑匣子速記”)同樣觀察到,部分機關在采購了AI語音識别服務後的使用率并不高,存在閑置現象。

事實上,讓黑匣子速記困擾的還另有因素。這兩年,保密規定趨嚴,限制了第三方速記服務商參與保密性的内部會議的資格,而保密資質又門檻太高,不适合小微速記企業的現狀,對公司業務造成較大沖擊。

大模型再加工

大螢幕上,演講内容由AI語音識别轉寫為字幕,實時呈現給觀衆;台下角落,速錄師手指快速敲擊鍵盤同步記錄,并在會後輸出一份詳盡的速記稿。台上台下,既各司其職,也無言較量。這樣的場景在近兩年的大型論壇上并不鮮見。

多年從事速記的經驗讓李君深刻感受到語音識别技術的變遷,“從連分句、分段等都無法完成,到标點符号的使用越來越規範、能夠區分講話人、過濾‘口水話’,技術的進步加上宣傳造勢,焦慮感還是有的。”但也在這個“切磋”過程中,讓她堅信人類仍有不可替代性。

多位速錄師認為,AI語音識别對環境、口音要求高,“聽到什麼就記錄什麼”,篩選、識别功能弱。有時候,客戶委托整理的錄音檔案中,會附帶一份語音識别文字稿,他們曾嘗試在該稿的基礎上進行加工修改,但所花費的時間往往比從頭聽錄音整理要長。

相比于每句話都原封不動地記錄下來,李君如今可能會在開會前與客戶溝通速記稿的用途,是用作宣傳、存檔還是會議紀要,并根據需求考慮合理的取舍和總結。

“有的情況,客戶要求文稿不僅是準确,而且要做到‘信達雅’,例如用于出書,這樣的話還是人工速錄最嚴謹。”元元補充。

廈門大學資訊學院副教授、智能語音實驗室負責人洪青陽指出,在較理想環境(如近場、相對安靜)下,通用領域的語音識别準确率一般可達95%以上。目前語音識别技術主要在三方面存在難點。

一是特定領域(如電力、醫療等)專業、生僻的術語識别難,需要專門收集語料對原來的模型進行微調訓練,開發有針對性的行業模型;二是重疊語音或複雜場景,如會議場景中的插話、正話反說等,仍是目前的研究難點,需要從軟硬體兩方面入手,如創新算法、增加收音的麥克風,以更好地進行聲源的定位聚焦。三是多語種、語種混雜和方言場景,這也是非常迫切的需求。

以ChatGPT為代表的大模型的接入能夠解決部分問題。目前,國内市面上公布的已經接入了大模型的語音産品,包括阿裡雲通義聽悟和訊飛聽見會寫。

阿裡雲通義聽悟技術負責人鄢志傑向21記者介紹,大模型在語氣詞過濾、分段、提煉改寫等方面,能有效的提高文本的可讀性,同時對一些典型的語音識别錯誤,如同音詞、專屬名詞等進行糾錯。此外,大模型的加入還能延伸出進一步的應用,如分段、摘要等。

但這種優化是在語音識别這一步驟之後。科大訊飛聽見會寫産品經理江嘉輝解釋,目前大模型能接收并了解的資訊還是以文本為主,這意味着語音識别仍然是一個單獨的任務。接入大模型後,可以在語音識别的子產品下,通過語言了解能力和概括表達能力實作動态會議記錄、會議内容自動整理輸出,一鍵生成多種類型的會議文案等功能,助力使用者高效辦公。

“随着大模型将往多模态的方向進一步發展,我們期待下一階段大模型能夠聽懂聲音。”江嘉輝表示,那時就能夠更直覺地知道大模型到底給語音識别的準确率帶來了多大程度的提升。

不過,現階段仍需警惕型生成内容的可靠性。洪青陽提醒,大模型根據語音識别文本再生成新的文本時,可能會存在常識性錯誤,如張冠李戴、了解偏差等,如果上一步語音識别錯誤較多,這種偏差還将進一步加大。

人機耦合

從事速記曾給李君帶來莫大的自豪感和成就感。每一次參會,她都能汲取新的知識,她将這種感受形容為“站在巨人的肩膀上看世界。”

過去一段時間,她密集地接到與法律相關的會議任務,由于會議内容專業性較強,她不得不一次次地上網查詢相關用語,慢慢熟悉了這個領域。趁着疫情期間賦閑在家,她自學通過了法考。

李君這一代速錄師仍然對行業懷有熱忱,然而,他們也能感覺到,學習速記的人越來越少了。

一方面,受到人工智能的影響,很多人擔心未來職位會被取代,不敢貿然入行。另一方面,速記本身學成率低,教育訓練周期長。

“與十幾年前速錄教育訓練行業的火爆場景相比,不可同日而語。”元元提到,之前全國有幾十家教育訓練機構、高等院校開設速錄課程,目前沒剩下幾家。南方的速錄教育訓練行業尚可,但主要就業出口是法院。在速錄行業中,法院并不是最理想的就業選擇,要求的技術水準不是很高,一般速錄求學者還都是朝着能獨立上會的進階速錄師的方向努力。

李君偶爾也感慨,“等我們這撥人老了,貴州就真的沒有速記了。”她帶了兩個小徒弟,其中一個已經在實習,可能明年就能自己上會。“他們兩個就是貴州未來的希望了。”

在采訪中,這種不安并沒有持續太久,很多速錄師表現出了對人工智能技術的歡迎和接納。他們希望AI能夠輔助到他們的工作中。

黑匣子速記認為,速記+AI或許是未來的發展方向。設想,如果速錄師記錄文字的同時,AI可以協助他們稽核校正文字中的錯别字、文法、專有名詞等,那麼工作起來就會更輕松。

嚴虹則提到,最初速記上會是雙人搭檔,或一人主打,一人修改,或兩人交替分開打,但後來普遍變成了一人負責整場會議的速記,這要求速錄師全神貫注,一刻不可松懈。未來AI的發展能否補齊“雙打”中的一員,值得期待。

關于速記行業的人機耦合,技術專家們多數提出AI先識别,人再進一步修正的思路。如鄢志傑認為,未來AI可以将逐字記錄的過程承擔下來,速錄師則從精神高度緊張的中解放出來,關注後續的摘要、提煉、整理等。人工如果對機器生成内容就行了糾錯、總結等,從算法角度講就是一種資料。如果這些資料能夠被提供用于模型進一步訓練,将有效幫助AI進步,進而更好幫助到速錄師。

“這意味着速錄師可能需要更關注一些難點,如專業術語、表達習慣、語種混雜等,稽核修正AI還無法解決的疑難雜症。”洪青陽說。

據江嘉輝了解,目前已經有一部分速錄師在使用科大訊飛的實時錄音功能,以提高效率。結合AI大模型,他建構了“AI語音識别-大模型修正-人工精修-大模型校正”的合作鍊條,“機器對于檢查錯别字有一定的優勢 ,人類在語音了解上更勝一籌,後續如果需要更高效的内容處理 ,如生成摘要、文章或者會議記錄、簡報等,也可以使用大模型輔助生成。”

不過,等到技術真正深刻影響行業,也許還有一段時日。今年以來,速錄師們的工作已經恢複了忙碌。在受訪的前一天,嚴虹在某大學參加了一整天的會議,忙碌到晚上10點,又在第二天7點起床繼續工作。即使不去參會,她仍要整理客戶發來的一批批錄音檔案。

“當初語音識别技術剛出來時,我們擔心速錄師被取代,如今ChatGPT的出現卻讓我們覺得各行各業都可能被取代。當每個行業都處在同一起跑線的時候,我反而不着急了。”談及未來,李君笑言:“(科技)來就來吧,我就想着怎麼讓自己的行業跟科技結合在一起,然後繼續生活下去。其實都是工作,隻是幹的方法不一樣了。”

(文中李君、嚴虹、元元均為化名)

更多内容請下載下傳21财經APP