天天看點

csv檔案亂碼

問題描述:

生成的csv檔案,設定為UTF-8格式,在windows上用EXCEL打開的話會亂碼,在linux上用vim或者cat打開檢視正常;設定為GBK格式的話,在windows上用EXCEL打開正常,但在linux上亂碼

解決方法:

在csv檔案頭部的最前面加bom

BOM(Byte Order Mark),是 UTF編碼方案裡用于辨別編碼的标準标記,在 UTF-16裡本來是 FF FE,變成 UTF-8就成了 EF BB BF。這個标記是可選的,因為 UTF8位元組沒有順序,是以它可以被用來檢測一個位元組流是否是 UTF-8編碼的。微軟做這種檢測,但有些軟體不做這種檢測,而把它當作正常字元處理。

代碼如下:

File file = new File(ospFileName);

OutputStream stream = new FileOutputStream(file);

stream.write(newbyte[] { (byte) 0xEF, (byte) 0xBB, (byte) 0xBF });

CsvWriter ospWriter = new CsvWriter(stream, ',', Charset.forName("UTF-8"));

String[] ospHead = new String[]{"No","Comment","server","method","param-exp","response","trace-id"};

ospWriter.writeRecord(ospHead);

這樣的話,在windows上用EXCEL打開就不會是亂碼,linux上也顯示正常;

雖千萬人,吾往矣!