近日,騰訊音樂娛樂集團(TME)打造的首屆“ROCK N Code,讓技術發聲”TechME技術周盛大啟動。TME技術專家、音樂行業内頂尖學者、優秀技術團隊等齊聚在此分享音樂科技成果、探索前沿音樂技術。其中,來自TME旗下首個音視訊研究實驗室——天琴實驗室的負責人姜博士及其團隊成員分享了《給音樂加點AI-天琴實驗室黑科技揭秘》《前沿音頻技術應用》《視訊AI技術最近實踐》引發了業内關注,而這,也是天琴實驗室的首次重磅亮相。

天琴室實驗室姜博士現場分享《給音樂加點AI-天琴實驗室黑科技揭秘》
天琴實驗室緻力于對音視訊相關AI方向研究,持續推出創新技術,提升集團旗下QQ音樂、全民K歌等平台的音樂視聽體驗。實驗室從前身“多媒體研發中心”更新而來,自創立以來,天琴實驗室不斷攻堅創新,在音頻、視訊技術領域成績斐然,現已掌握384個專利技術,收獲包括Mirex音頻指紋大賽冠軍等多個國内外音視訊重量級獎項,并有多項論文被收錄于ICASSP、IJCNN、INTERSPEECH等各大國際論壇組織。
天琴實驗室技術介紹
正如QQ音樂業務線技術副總裁周文江所分享的“以天穹中浪漫七弦琴星座為名,天琴實驗室不僅展示着他們對探索‘音樂星空’的不懈追求,更秉持着以科技向善為使命,切實用具有溫度的前沿技術如「聽歌識曲」、「翻唱識别」、「AI智能剪輯」、「視訊歌單」等黑科技,為使用者提供更美好的音樂娛樂體驗。”
如今,天琴實驗室的黑科技已化身各種實用功能,應用在騰訊音樂旗下的各個平台中。在音頻方面,QQ音樂「聽歌識曲」已成為廣大樂迷找尋陌生好歌的"必備神器",從此不再錯過心儀好歌。而「聽歌識曲」這一技術,早在2019國際音頻檢索評測大賽(MIREX)上,就曾以平均3秒識别一首歌的成績拿下了"音頻指紋(Audio Fingerprinting)"世界冠軍,至今仍是行業領先水準。
另外,天琴實驗室的「智能修音」則相當于為全民K歌的每位使用者配備了一名專屬的“百萬混音師”,讓使用者輕松完成“一鍵美音”。當使用者完成歌唱作品後,全民K歌的突破性「歌唱評價」技術則實作了從音準、節奏、技巧、氣息,甚至情感五個次元為使用者評價,成為了使用者的“聲音伯樂”,甚至“歌唱成長助手”!這兩大技術,切實降低了使用者K歌、學唱的門檻,真正實作了“全民K歌”!
QQ音樂聽歌識曲和全民K歌智能修音功能
在視訊方面,天琴實驗室同樣成就不凡。針對直播主播的美顔需求,天琴實驗室通過「智能美膚」和「視訊去噪」技術,實作了美顔和視訊品質的雙重保障;而歌曲豎版視訊MV,則來源于「AI智能剪輯」技術,不僅實作橫屏MV向豎屏MV的批量轉化,同時確定智能剪輯後視訊的美感與節奏感,讓美好的音樂被更多使用者“看見”。
QQ音樂歌曲播放視訊頁面
此外,還有如AI語音朗讀、智能音效、視訊歌單、掃一掃MV識别等大量實用技術已應用于騰訊音樂各類音娛app中,而這些科技成果離不開專業科研人員的努力與協作。據了解,天琴實驗室不僅彙聚了30多位來自于清華大學、複旦大學、香港理工大學等國内外頂尖高校和科研機構科的研工作者和技術人員。 早在去年12月,實驗室與西北工業大學教授、人工智能領域專家謝磊等科研團隊在長音頻的語音合成方面就展開了合作,為使用者提供更加真實、有趣的有聲音頻。
QQ音樂業務線技術副總裁周文江為西北工業大學人工智能領域專家謝磊頒發聘任證書
在今年的99公益活動中,QQ音樂推出的國内首張低頻公益專輯——《聽見“聽不見”的音樂》,正是運用天琴實驗室的“聲伴分離、音樂生成、伴奏改編、歌聲合成”等智能化音頻技術,在不破壞、不改變編原版歌曲旋律的同時,對歌曲進行了符合中高頻聽力損失人群聽力範圍的降頻改編,使歌曲完美符合中高頻聽力損失孩子的聽力範圍,讓高頻聽力缺失的孩子們也能在曲聲悠揚裡收獲了溫暖快樂。
深圳市厚樸特需兒童發展中心高頻聽力缺失小朋友聽低頻公益專輯
以音樂科技向善,也不止于溫暖公益中,更在于讓更多人的日常每一天,都能輕松享受到音樂的快樂與美好,如QQ音樂新推出的「Hi-Res」高品質音樂專區無疑正是為使用者提供高品質的聽歌體驗。Hi-Res作為高解析度音頻,以相較于CD音質更豐富的細節、更廣闊的動态,更接近原始資訊的聲音,帶給越來越多使用者身臨其境的音樂體驗。
天琴實驗室以星辰為名,擁有一支創新且具有行業影響力的團隊,未來希望有更多優秀的AI技術人才加入,共同創造美好的音樂新體驗,讓使用者感受音樂的律動與美好!