天天看點

python漢字轉拼音代碼_python3實作漢字轉拼音

一、簡述

漢字轉語音實作就分為兩步,第一步将漢字轉為拼音,第二步通過拼音調用相比對的音頻檔案。下面是具體的開發執行個體教程

1.環境配置

開發環境:Win7 x64

Python版本:3.x

外置子產品準備:pygame(可直接在cmd指令行中pip install pygame安裝)

python漢字轉拼音代碼_python3實作漢字轉拼音

1

2.轉碼解析

我使用的是将漢字轉為Unicode碼,然後通過查詢一個比對檔案(我使用的是unicode_pinyin.txt)擷取該漢字的拼音,該檔案中列有從4E00-9FA5标準漢字的Unicode編碼所對應的拼音,外加一個落單的3007編碼的“〇”。

python漢字轉拼音代碼_python3實作漢字轉拼音

2

3.代碼分析

源碼如下圖所示:

python漢字轉拼音代碼_python3實作漢字轉拼音

3

在大寫拼音英文後的1,2,3,4,5分别表示一,二,三,四和輕聲(注意到存在有多音字),我們将其封裝成一個函數,參數為一個全是漢字的字元串,傳回是一個拼音字元串。(即chinese_to_pinyin("秋水共長天一色") 傳回的是"QIU1 SHUI3 GONG4 CHANG2 TIAN1 YI1 SE4 ")。說明:将該檔案與"unicode_pinyin.txt"檔案放在同一目錄下。