天天看點

java實作檔案編碼監測(轉)

 chardet是mozilla自動字元集探測算法代碼的java移植。這個算法的最初作者是frank Tang,C++源代碼在http://lxr.mozilla.org/mozilla/source/intl/chardet/,可以從http://www.mozilla.org/projects/intl/chardet.html 得到更多關于這個算法的資訊。

最近在做一個文檔的翻譯項目,可文檔的編碼不知道,聽頭疼的。嘗試了很多方法最後發現JCharDet這個工具可以輕松解決這個問題。于是作此筆記希望日後提醒自己以及幫助又需要的人。