1 緣起
我本來是要整理一份英語音标的替換表。在cnbook中使用這個替換表可以把金山詞霸的音标轉換到音标對應的Unicode字元,就可以正确顯示了。在整理替換表的過程中,發現網上很多關于音标的文章還是圖檔形式,很多網友還在用特殊字型來輸入和顯示音标。
其實使用Unicode後,我們基本上可以像處理普通字元一樣處理音标。于是我整理了這篇關于英語音标和Unicode的文章。本文假設讀者了解Unicode。如果您不熟悉Unicode,可以參考我以前的一些文章:
- 淺談文字編碼和Unicode(上)
- 淺談文字編碼和Unicode(下)
- 談談Unicode編碼,簡要解釋UCS、UTF、BMP、BOM等名詞
2 特殊字型
目前很多網友使用特殊字型來輸入和顯示音标。例如金山詞霸的Ksphonet.ttf。這些字型把一些普通的ascii字元映射成英語音标。例如将A映射成æ。使用者輸入的其實還是A。安裝過這種字型的使用者可以在Word裡實驗一下:輸入字母A後,将其字型設定為“Kingsoft Phonetic Plain”後,它就被顯示成æ。
我們把這樣輸入的音标複制到其它文本編輯器,其它編輯器按目前字型顯示,就會顯示出這些音标的原形,即普通的ascii字元。例如我在一個網站上看到過如下的DJ音标介紹:
英語音标表(英語國際音标表,dj音标)
單元音 短元音 [E] [O] [u] [V] [e] [Q]
單元音 長元音 [i:] [E:] [O:] [u:] [A:]
雙元音 [ei] [ai] [Oi] [au] [Eu] [iE] [CE] [uE]
清濁成對的輔音 清輔音 [p] [t] [k] [F] [T] [s] [ts] [S] [tS]
清濁成對的輔音 濁輔音 [B] [d] [G] [v] [D] [z] [dz] [dr] [Z] [dZ]
其它輔音 [H] [M] [n] [N] [l] [r] [J] [W]
很容易猜到,編輯是将Word中正常顯示的音标直接複制過來的。編輯在Word中使用了GWIPA字型把這些普通字元顯示成音标。但在網頁上,浏覽器沒有用GWIPA字型顯示這些字元,是以就看到了本來的ascii字元。GWIPA字型采用了以下映射關系:

我按照這個映射關系做一個替換表,将普通字元轉換成對應音标的Unicode字元,就可以得到:
英語音标表(英語國際音标表,dj音标)
單元音 短元音 [ə] [ɔ] [u] [ʌ] [e] [æ]
單元音 長元音 [i:] [ə:] [ɔ:] [u:] [ɑ:]
雙元音 [ei] [ai] [ɔi] [au] [əu] [iə] [ɛə] [uə]
清濁成對的輔音 清輔音 [p] [t] [k] [f] [θ] [s] [ts] [ʃ] [tʃ]
清濁成對的輔音 濁輔音 [b] [d] [g] [v] [ð] [z] [dz] [dr] [ʒ] [dʒ]
其它輔音 [h] [ŋ] [n] [N] [l] [r] [j] [w]
3 Unicode字元的顯示
不是所有字型都能顯示音标對應的Unicode字元。在Windows的預設字型中目前隻有"Lucida Sans Unicode"支援這些音标字元。還有一些字元能很好地支援Unicode,例如"Arial Unicode MS"和網友開發的UniFonts。不過這些字型需要使用者單獨安裝。在設計網頁時不能假設使用者安裝過這些字型。
因為Windows預設支援一些Unicode字型(例如"Lucida Sans Unicode"),是以與前面介紹的特殊字型相比,使用Unicode字元有更好的可移植性。更重要的是我們使用了統一的音标字元編碼。
目前的浏覽器在顯示網頁時,還不能自動選擇支援音标字元的Unicode字型。是以網頁設計者需要用css建議浏覽器選擇可以支援音标字元的字型。例如:
.IPA {
FONT-FAMILY: "Charis SIL", "Doulos SIL", Gentium, GentiumAlt,
"DejaVu Sans", Code2000, "TITUS Cyberbit Basic",
"Arial Unicode MS", "Lucida Sans Unicode",
"Chrysanthi Unicode"
}
在不友善使用css的場合也可以用font标簽,例如:
<font >θ</font>
請注意參數: 。如果沒有這個參數,有些音标不能正确顯示,例如重音符号ˈ和ˌ。在應用css樣式時也應該使用lang參數。
4 IPA符号
4.1 概述
這裡的IPA指的是“International Phonetic Alphabet”。IPA也是International Phonetic Association的縮寫。IPA符号就是這個協會整理的一套用來表示語音的标準符号。根據Wikipedia,在2008年,IPA符号包括107個字母,52個音調符号(diacritics)和4個韻律标記(prosody marks)。有一個關于"The International Phonetic Alphabet in Unicode"的網頁上面有IPA符号對應的Unicode字元的清單。還有個網頁提供了IPA字元輸入功能。隻要點選網頁上的字元,字元就會出現在下方的編輯框中。
關于英語語音有一本很著名的書:"English Pronouncing Dictionary",簡稱EPD。這本書的作者是Daniel JONES,現在經常看到的DJ音标的DJ就來自這位學者。 EPD的第一版是在1917年出版的,以後又陸續出版過很多版本。EPD的第14版首次在1977年出版。1988年,由AC Gimson和SM Ransaran修訂過的EPD第14版又重新出版。 1988年的EPD版本的音标使用IPA符号取代了一些傳統音标符号。以後英語字典的音标系統基本上都使用與EPD 1988版一緻的IPA符号。後面會讨論音标符号的變化。
4.2 英語音标需要的特殊字元
因為英語音标系統需要一些ascii字元以外的符号,這些符号在Unicode出現前沒有統一的編碼和相應的字型,需要用特殊字型實作。是以在音标的輸入和顯示上造成了一定的混亂。那麼英語音标究竟需要哪些特殊字元呢?下表列出了英語音标需要的常用特殊字元。
音标符号 | 10進制Unicode編碼 | 16進制Unicode編碼 |
æ | 230 | 00E6 |
ð | 240 | 00F0 |
ŋ | 331 | 014B |
ɑ | 593 | 0251 |
ɒ | 594 | 0252 |
ɔ | 596 | 0254 |
ə | 601 | 0259 |
ɛ | 603 | 025B |
ɜ | 604 | 025C |
ɡ | 609 | 0261 |
ɪ | 618 | 026A |
ʃ | 643 | 0283 |
ʊ | 650 | 028A |
ʌ | 652 | 028C |
ʒ | 658 | 0292 |
ˈ | 712 | 02C8 |
ˌ | 716 | 02CC |
ː | 720 | 02D0 |
θ | 952 | 03B8 |
5 英語音标
5.1 概述
音标就是記錄英語讀音的符号系統。每個英語字典都會選擇一套這樣的符号系統。字典的編撰者有時會在标準的音标系統基礎上增加自己的音标。新增的音标通常也用IPA符号表示。例如最常見的音标有20個元音和24個輔音,Collins詞典的音标系統有27個元音音标,28個輔音音标。 Collins增加了一些可以更好地表達“r化韻”和其它細節的音标,例如 ər, ə:r, ɔ:r, ɑ:r, ɪər, eər, ʊər, ən, əl, hw
網上有個48個标準音标的說法,就是在44個常見音标基礎上增加了ts,tr,dz,dr這4個輔音。我沒有考證出這個标準究竟是哪個組織的“标準”,标準号是多少,就隻能存疑了。
網上關于英語音标種類的說法有點混亂。一般而言,英語國際音标、IPA音标、DJ音标這3個提法比較接近,本文将其都稱作IPA音标,而且隻讨論其中的44個常見音标。為友善起見,将采用IPA字元前的IPA音标稱作IPA63,把采用IPA字元後的IPA音标稱作IPA88。還有一種出自美語發音字典的KK音标也比較常見,KK的縮寫來自作者John S. Kenyon和Thomas A. Knott。KK音标的表示方法與IPA音标有一些差異。下表顯示了IPA63、IPA88和KK音标在符号上的差異。
單元音短元音 | IPA63 | i | ə | ɔ | u | ʌ | e | æ | |
---|---|---|---|---|---|---|---|---|---|
IPA88 | ɪ | ə | ɒ | ʊ | ʌ | e | æ | ||
KK | ɪ | ə | ɑ | ʊ | ʌ | ɛ | æ | ||
單元音長元音 | IPA63 | i: | ə: | ɔ: | u: | ɑ: | |||
IPA88 | i: | ɜ: | ɔ: | u: | ɑ: | ||||
KK | i | ɜ | ɔ | u | ɑ | ||||
雙元音 | IPA63 | ei | ai | ɔi | au | əu | iə | ɛə | uə |
IPA88 | eɪ | aɪ | ɔɪ | aʊ | əʊ | ɪə | eə | ʊə | |
KK | e | aɪ | ɔɪ | aʊ | o | ɪr | ɛr | ʊr | |
清濁成對輔音 | 清輔音 | p | t | k | f | θ | s | ʃ | tʃ |
濁輔音 | b | d | ɡ | v | ð | z | ʒ | dʒ | |
其它輔音 | h | m | n | ŋ | l | r | j | w |
下面這張截圖看上去可能更清晰一些:
這個網頁讨論了使用IPA字元前後IPA音标的變化。
5.2 IPA63、IPA88、KK音标和Collins音标的例子
我比較習慣IPA63的音标,因為看慣了。不過我最近一直在用Collins詞典。可以把Collins詞典的音标看作IPA88的擴充。除了增加了一些可以更好表達美式發音的音标外,Collins詞典還把 əʊ 寫成 oʊ。oʊ可以更精确地表達美式發音,但更多的英國詞典使用əʊ。 關于英語音标有一個不錯的網頁。這個網頁的音标和IPA88、Collins詞典比較接近。
我整理了一張包括IPA63、IPA88、KK音标和Collins音标示例的表格。
示例單詞 | IPA63 | IPA63示例 | IPA88 | IPA88示例 | KK | KK示例 | Collins | Collins示例 | |
單元音短元音 | sit | i | [sit] | ɪ | [sɪt] | ɪ | [sɪt] | ɪ | /sɪt/ |
---|---|---|---|---|---|---|---|---|---|
about | ə | [əˈbaut] | ə | [əˈbaʊt] | ə | [əˈbaʊt] | ə | /əbaʊt/ | |
forget | [fəˈget] | [fəˈget] | [fəˈgɛt] | ər | /fərget/ | ||||
hot | ɔ | [hɔt] | ɒ | [hɒt] | ɑ | [hɑt] | ɒ | /hɒt/ | |
good | u | [gud] | ʊ | [gʊd] | ʊ | [gʊd] | ʊ | /gʊd/ | |
luck | ʌ | [lʌk] | ʌ | [lʌk] | ʌ | [lʌk] | ʌ | /lʌk/ | |
yes | e | [jes] | e | [jes] | ɛ | [jɛs] | e | /jes/ | |
man | æ | [mæn] | æ | [mæn] | æ | [mæn] | æ | /mæn/ | |
單元音長元音 | week | i: | [wi:k] | i: | [wi:k] | i | [wik] | i: | /wi:k/ |
very | [ˈveri:] | [ˈveri:] | [ˈvɛri] | i | /veri/ | ||||
turn | ə: | [tə:n] | ɜ: | [tɜ:n] | ɜ | [tɜn] | ə:r | /tə:rn/ | |
claw | ɔ: | [klɔ:] | ɔ: | [klɔ:] | ɔ | [klɔ] | ɔ: | /klɔ:/ | |
floor | [flɔ:r] | [flɔ:r] | [flɔr] | ɔ:r | /flɔ:r/ | ||||
school | u: | [sku:l] | u: | [sku:l] | u | [skul] | u: | /sku:l/ | |
actual | [ˈæktʃuəl] | [ˈæktʃʊəl] | [ˈæktʃuəl] | u | /æktʃuəl/ | ||||
calm | ɑ: | [kɑ:m] | ɑ: | [kɑ:m] | ɑ | [kɑm] | ɑ: | /kɑ:m/ | |
card | [kɑ:d] | [kɑ:d] | [kɑd] | ɑ:r | /kɑ:rd/ | ||||
雙元音 | say | ei | [sei] | eɪ | [seɪ] | e | [se] | eɪ | /seɪ/ |
bike | ai | [baik] | aɪ | [baɪk] | aɪ | [baɪk] | aɪ | /baɪk/ | |
boy | ɔi | [bɔi] | ɔɪ | [bɔɪ] | ɔɪ | [bɔɪ] | ɔɪ | /bɔɪ/ | |
house | au | [haus] | aʊ | [haʊs] | aʊ | [haʊs] | aʊ | /haʊs/ | |
coat | əu | [kəut] | əʊ | [kəʊt] | o | [kot] | oʊ | /koʊt/ | |
dear | iə | [diə] | ɪə | [dɪə] | ɪr | [dɪr] | ɪər | /dɪər/ | |
care | ɛə | [kɛər] | eə | [keər] | ɛr | [kɛr] | eər | /keər/ | |
tour | uə | [tuər] | ʊə | [tʊər] | ʊr | [tʊr] | ʊər | /tʊər/ | |
清輔音 | pay | p | [pei] | p | [peɪ] | p | [pe] | p | /pei/ |
talk | t | [tɔ:k] | t | [tɔ:k] | t | [tɔk] | t | /tɔ:k/ | |
king | k | [kiŋ] | k | [kɪŋ] | k | [kɪŋ] | k | /kiŋ/ | |
fit | f | [fit] | f | [fɪt] | f | [fɪt] | f | /fɪt/ | |
thin | θ | [θin] | θ | [θɪn] | θ | [θɪn] | θ | /θɪn/ | |
bus | s | [bʌs] | s | [bʌs] | s | [bʌs] | s | /bʌs/ | |
ship | ʃ | [ʃip] | ʃ | [ʃɪp] | ʃ | [ʃɪp] | ʃ | /ʃɪp/ | |
cheap | tʃ | [tʃi:p] | tʃ | [tʃi:p] | tʃ | [tʃip] | tʃ | /tʃi:p/ | |
濁輔音 | bed | b | [bed] | b | [bed] | b | [bɛd] | b | /bed/ |
done | d | [dʌn] | d | [dʌn] | d | [dʌn] | d | /dʌn/ | |
dog | ɡ | [dɔɡ] | ɡ | [dɒɡ] | ɡ | [dɑɡ] | ɡ | /dɒɡ/ | |
voice | v | [vɔis] | v | [vɔɪs] | v | [vɔɪs] | v | /vɔɪs/ | |
then | ð | [ðen] | ð | [ðen] | ð | [ðɛn] | ð | /ðen/ | |
buzz | z | [bʌz] | z | [bʌz] | z | [bʌz] | z | /bʌz/ | |
measure | ʒ | [ˈmeʒə] | ʒ | [ˈmeʒə] | ʒ | [ˈmɛʒə] | ʒ | /meʒər/ | |
bridge | dʒ | [bridʒ] | dʒ | [brɪdʒ] | dʒ | [brɪdʒ] | dʒ | /brɪdʒ/ | |
其它輔音 | home | h | [həum] | h | [həum] | h | [hom] | h | /houm/ |
mat | m | [mæt] | m | [mæt] | m | [mæt] | m | /mæt / | |
not | n | [nɔt] | n | [nɒt] | n | [nɑt] | n | /nɒt/ | |
hidden | [ˈhidn] | [ˈhɪdn] | [ˈhɪdn] | ən | /hɪdən/ | ||||
sing | ŋ | [siŋ] | ŋ | [sɪŋ] | ŋ | [sɪŋ] | ŋ | /sɪŋ/ | |
late | l | [leit] | l | [leɪt] | l | [leɪt] | l | /leɪt/ | |
handle | [ˈhændl] | [ˈhændl] | [ˈhændl] | əl | /hændəl/ | ||||
run | r | [rʌn] | r | [rʌn] | r | [rʌn] | r | /rʌn/ | |
you | j | [ju:] | j | [ju:] | j | [ju] | j | /ju:/ | |
win | w | [win] | w | [wɪn] | w | [wɪn] | w | /wɪn/ | |
why | [hwai] | [hwaɪ] | [hwaɪ] | hw | /hwaɪ/ |
6 音标符号的輸入
在學習英語時,我更常做的是複制金山詞霸裡的音标,隻要作個替換表将原來的普通字元映射到Unicode字元就可以了,通常不需要手工輸入。輸入音标,我想最簡單的方法就是複制粘貼了。
在office軟體中,可以用自動更正選項輸入音标。例如設定将Yi更正為ɪ。隻要輸入Yi、空格,軟體就會自動将Yi更正為ɪ。隻要在office的一個軟體裡設定了自動更正,其它軟體會共享這個設定。不過office軟體的自動更正是針對單詞的,即Yi不能和其它字母連着。在輸入後面一個空格時,office軟體進行更正。這一點不太友善,因為每次輸入都要删除多餘的空格。
熟悉輸入法碼表的朋友可以把這幾個音标字元加到自定義的碼表中。
我做了一個英語音标輸入的網頁。隻要點選網頁上的音标字元,該字元就會被插入到下方的編輯框中。有興趣的朋友可以試試。
7 結束語
有很多網友使用特殊的音标字型輸入和顯示音标。不同的音标字型對普通字元和音标字元的映射關系通常是不同的。如果讀者沒有安裝對應的字型就無法正确閱讀。使用音标的Unicode字元應該是解決音标輸入和顯示的标準做法。使用統一的資訊編碼,大家可以更好地交流。希望在網上看到更多用Unicode表示的音标。