I18N&L10N
I18N&L10N 的概念:軟體走國際化本地化線路,将一套軟體做成多個語言的版本,來拓展國際市場。它的實作主要有兩個過程。就是I18N(國際化)和L10N(本地化)這兩個過程。
I18N: internationalization國際化。在軟體本地化之前,先作好軟體的國際相容性。
主要是保證軟體在各種語言的環境中,有很好的相容性。軟體在各種支援的國家的作業系統平台中運作能保持和英文版有相同的行為和效果。其主要的目的是要做到,盡量将軟體中所有與國際化本地化相關的資訊元素從基本代碼中都抽離出來,放到資源檔案中。而且要保證運作時,能從資源中正确的調用抽取出來的指定資源。
L10N: localization本地化過程, 對抽離出來的資源進行翻譯。将被調用的資源翻譯正确,確定資源資訊能被正确調用顯示。
字元,字元集,字元集編碼:對于抽取出來的資源(圖檔,文字,對話框,菜單,多媒體檔案等)最主要的就是文字。文字的表示就是字元,字元集,就是code中的data,各種語言的字元集有多種的計算機編碼。常見的編碼有下面:
1. ASCII碼,是對英文字元最常見的8位二進制編碼。
2. ISO-8859-1:西歐語系編碼,大多數英文網站均采用均編碼。
3. GB2312 國标碼, 對6763個漢字集進行了編碼。
4. BIG5碼,是對繁體字進行編碼,目前在台灣、香港的電腦系統中得到普遍應用。
5. Shift_JIS碼,Shift_JIS多用于日文個人電腦。
6. EUC_KR :韓文碼。
7. UTF-8: Unicode。
産品中一般需要抽離的元素:1. 所有需要翻譯的字元,字元串的顯示。
2. 使用者名。西方的First Name和Last Name之間有空格,但亞洲的中文和日文是沒有空格的。
3. 日期時間,貨币,數字的标準格式。
4. 輸入/輸出的本地化資料流。
5. 被翻譯的各語言的字元串在各個界面上顯示的擴充性。
6. 字元串的空間拓展性。
7. 界面顯示異常。
8. Page中的字元集保護。