天天看點

python線上發音-Python如何實作文本轉語音

準備

我測試使用的Python版本為2.7.10,如果你的版本是Python3.5的話,這裡就不太适合了。

使用Speech API

原理

我們的想法是借助微軟的語音接口,是以我們肯定是要進行調用 相關的接口。是以我們需要安裝pywin32來幫助我們完成這一個底層的互動。

示例代碼

import win32com.client

speaker = win32com.client.Dispatch("SAPI.SpVoice")

speaker.Speak("Hello, it works!")

小總結

是的,調用接口來實作語音功能就是這麼簡單,但是我們不得不來聊一聊這種方式的缺點。

對中文支援的不夠好,僅僅是這一點,估計在中國沒幾個用它的了。

還有就是語速不能很好的控制

pyttsx方式

原理

pyttsx 是Python的一個關于文字轉語音方面的很不錯的庫。我們還可以借助pyttsx來實作線上朗讀rfc檔案或者本地檔案等等,最為關鍵的是,它對中文支援的還是不錯的。

示例代碼

# coding:utf-8

import sys

reload(sys)

sys.setdefaultencoding('utf8')

# __author__ = '郭 璞'

# __date__ = '2016/8/6'

# __Desc__ = 文字轉語音輸出

import pyttsx

engine = pyttsx.init()

engine.say('hello world')

engine.say('你好,郭璞')

engine.runAndWait()

# 朗讀一次

engine.endLoop()

小總結

使用pyttsx,我們可以借助其強大的API來實作我們基本的業務需求。很酷吧。

pyttsx深入研究

做完上面的小實驗,你肯定會覺得怎麼這麼不過瘾呢?

别擔心,下面我們就一起走進pyttsx的世界,深入的研究一下其工作原理吧。

語音引擎工廠

類似于設計模式中的"工廠模式”,pyttsx通過初始化來擷取語音引擎。當我們第一次調用init操作的時候,會傳回一個pyttsx的engine對象,再次調用的時候,如果存在engine對象執行個體,就會使用現有的,否則再重新建立一個。

pyttsx.init([driverName : string, debug : bool]) → pyttsx.Engine

從方法聲明上來看,第一個參數指定的是語音驅動的名稱,這個在底層适合作業系統密切相關的。如下:

1.drivename:由pyttsx.driver子產品根據作業系統類型來調用,預設使用目前作業系統可以使用的最好的驅動

sapi5 - SAPI5 on Windows

nsss - NSSpeechSynthesizer on Mac OS X

espeak - eSpeak on every other platform

2.debug:這第二個參數是指定要不要以調試狀态輸出,建議開發階段設定為True

引擎接口

要想很好的運用一個庫,不了解其API是不行的。下面來看看pyttsx。engine.Engine的引擎API。

方法簽名

參數清單

傳回值

簡單釋義

connect(topic : string, cb : callable)

topic:要描述的事件名稱;cb:回調函數

→ dict

在給定的topic上添加回調通知

disconnect(token : dict)

token:回調失聯的傳回标記

Void

結束連接配接

endLoop()

None

→ None

簡單來說就是結束事件循環

getProperty(name : string)

name有這些枚舉值"rate, vioce,vioces,volumn

→ object

擷取目前引擎執行個體的屬性值

setProperty(name : string)

name有這些枚舉值"rate, vioce,vioces,volumn

→ object

設定目前引擎執行個體的屬性值

say(text : unicode, name : string)

text:要進行朗讀的文本資料; name: 關聯發音人,一般用不到

→ None

預設要朗讀的文本資料,這也是"萬事俱備,隻欠東風”中的"萬事俱備”

runAndWait()

None

→ None

這個方法就是"東風”了。當事件隊列中事件全部清空的時候傳回

startLoop([useDriverLoop : bool])

useDriverLoop:是否啟用驅動循環

→ None

開啟事件隊列

中繼資料音調

在pyttsx.voice.Voice中,處理合成器的發音。

age

發音人的年齡,預設為None

gender

以字元串為類型的發音人性别: male, female, or neutral.預設為None

id

關于Voice的字元串确認資訊. 通過 pyttsx.engine.Engine.setPropertyValue()來設定活動發音簽名. 這個屬性總是被定義。

languages

發音支援的語言清單,如果沒有,則為一個空的清單。

name

發音人名稱,預設為None.

更多測試

朗讀文本

import pyttsx

engine = pyttsx.init()

engine.say('Sally sells seashells by the seashore.')

engine.say('The quick brown fox jumped over the lazy dog.')

engine.runAndWait()

事件監聽

import pyttsx

def onStart(name):

print 'starting', name

def onWord(name, location, length):

print 'word', name, location, length

def onEnd(name, completed):

print 'finishing', name, completed

engine = pyttsx.init()

engine.say('The quick brown fox jumped over the lazy dog.')

engine.runAndWait()

打斷發音

import pyttsx

def onWord(name, location, length):

print 'word', name, location, length

if location > 10:

engine.stop()

engine = pyttsx.init()

engine.say('The quick brown fox jumped over the lazy dog.')

engine.runAndWait()

更換發音人聲音

engine = pyttsx.init()

voices = engine.getProperty('voices')

for voice in voices:

engine.setProperty('voice', voice.id)

engine.say('The quick brown fox jumped over the lazy dog.')

engine.runAndWait()

語速控制

engine = pyttsx.init()

rate = engine.getProperty('rate')

engine.setProperty('rate', rate+50)

engine.say('The quick brown fox jumped over the lazy dog.')

engine.runAndWait()

音量控制

engine = pyttsx.init()

volume = engine.getProperty('volume')

engine.setProperty('volume', volume-0.25)

engine.say('The quick brown fox jumped over the lazy dog.')

engine.runAndWait()

執行一個事件驅動循環

engine = pyttsx.init()

def onStart(name):

print 'starting', name

def onWord(name, location, length):

print 'word', name, location, length

def onEnd(name, completed):

print 'finishing', name, completed

if name == 'fox':

engine.say('What a lazy dog!', 'dog')

elif name == 'dog':

engine.endLoop()

engine = pyttsx.init()

engine.say('The quick brown fox jumped over the lazy dog.', 'fox')

engine.startLoop()

使用一個外部的驅動循環

engine = pyttsx.init()

engine.say('The quick brown fox jumped over the lazy dog.', 'fox')

engine.startLoop(False)

# engine.iterate() must be called inside externalLoop()

externalLoop()

engine.endLoop()

總結

以上就是Python如何實作文本轉語音的全部内容,看完了上面的講述,是不是感覺Python實作文本轉語音還是蠻簡單的?那麼,大家快來嘗試嘗試吧。希望本文對大家學習Python有所幫助。

本文标題: Python如何實作文本轉語音

本文位址: http://www.cppcns.com/jiaoben/python/159803.html