天天看點

建構企業級語音合成應用,英偉達有超便利工具比對你的GPU

建構企業級語音合成應用,英偉達有超便利工具比對你的GPU

讓計算機能聽、能看、能說、能感覺,是未來人機互動的發展方向,其中語音已成為未來最被看好的人機互動方式,語音比其他的互動方式有更多的優勢。

目前,語音服務存在于各種場景中,包括實時會議記錄、視訊實時直播字幕、呼叫中心語音質檢、實時會議記錄等。想要實作不同的語音服務,這涉及到方方面面的技術,例如,在進行實時會議記錄任務時,需要将會議中的音頻實時轉寫為文字,輔助會議記錄工作,同時适用于電視會議等遠距離場景,這涉及到自動語音識别(ASR)技術。

除此以外,我們在日常生活中,也經常遇到需要将文本轉化成語音的技術(TTS) ,該技術可以通過自然逼真的智能語音,讓機器擁有「說話」的能力。

那麼,有沒有一種技術,可以同時完成自動語音識别、語音合成技術的任務?

今年,英偉達釋出了 NVIDIA Riva,這是一種現成的語音服務,可以輕松部署在任何雲或資料中心。NVIDIA Riva的設計旨在幫助使用者輕松、快速地通路會話 AI 功能,實作開箱即用,通過一些簡單的指令和 API 操作就可以快速建構進階别的語音識别服務。該服務可以處理數百至數千音頻流作為輸入,并以最小延遲傳回文本;還能快速建構進階别的對話式 AI 服務。

NVIDIA Riva是一個使用了 GPU 加速,快速部署高性能會話式 AI 服務的 SDK,可用于快速開發語音 AI 的應用程式。Riva SDK 在 NVIDIA GPU 上運作,在高吞吐量水準下提供最快的推斷響應。

目前,NVIDIA Riva整合了 ASR 和 TTS 等智能算法引擎,使用者可以使用這些功能進行科學研究。

為了深入了解和快速上手 NVIDIA Riva 在建構語音方面的應用,英偉達聯合機器之心推出「詳解對話式AI應用服務架構NVIDIA Riva」三期線上分享,通過英偉達專家的理論解讀和實戰經驗分享,向開發者展示如何使用 NVIDIA Riva 快速建構企業級 ASR 語音識别助手、快速建構企業級 TTS 語音合成助手、使用 Python 快速建構基于 NVIDIA Riva 的智能問答機器人。

2022年1月12日,系列分享第2期:

使用NVIDIA Riva快速建構企業級TTS語音合成助手

建構企業級語音合成應用,英偉達有超便利工具比對你的GPU

語音合成技術又稱為文本轉語音(TTS)技術,它可以将任何文字資訊轉換成标準流暢的語音且進行朗讀,相當于給機器裝了一張人工合成的「嘴巴」。它是聲學、語言學、數字信号處理和計算機科學的一個交叉學科。

本次分享面向有會話式人工智能開發需求的開發者,講主要介紹以下内容:

語音合成簡介

NVIDIA Riva 介紹與特性

啟動 NVIDIARiva 用戶端快速實作文字轉語音功能

使用 Python 快速搭建基于 Riva 的 TTS 語音合成服務應用

直播時間:中原標準時間1月12日19:30-21:00

直播間位址:

繼續閱讀