MySQL 解決 emoji表情 的方法,使用utf8mb4 字元集(4位元組 UTF-8 Unicode 編碼)
前段時間做項目遇到APP評論中有 emoji 表情符号,結果導緻插入
MySQL 資料庫失敗,時隔好久了,現在整理一下。
一、基本原則
如果要實作存儲 emoji 表情到 MySQL 執行個體,需要應用用戶端、到 MySQL 執行個體的連接配接、MySQL 執行個體内部 3 個方面統一使用或者支援 utf8mb4 字元集。
注:關于 utf8mb4 字元集,請參考
utf8mb4 字元集(4位元組 UTF-8 Unicode 編碼)二、三個條件的說明
1、應用用戶端
用戶端需要保證輸出的字元串的字元集為 utf8mb4。
注:utf8mb4隻是MySQL中的概念,因為MySQL的UTF-8并不是真正意義上的UTF-8,我們的應用中隻要使用UTF-8就可以了。
2、應用到 RDS MySQL 執行個體的連接配接
以常見的 JDBC 連接配接為例:
對于 JDBC 連接配接,需要使用 MySQL Connector/J 5.1.13(含)以上的版本。
JDBC 的連接配接串中,不配置 characterEncoding 選項。連接配接器會自動比對識别字元集。
注:關于 MySQL Connector/J 5.1.13,請參考 MySQL 官方
Release Notes比如
url=jdbc:mysql://localhost:3306/db_name?useUnicode=true&zeroDateTimeBehavior=convertToNull
3、MySQL 執行個體配置
3.1、修改my.cnf配置檔案
這裡使用VI來修改,輸入指令:vi /usr/my.cnf 回車;打開檔案後按“i”鍵進入編輯狀态;
在“[mysqld]”下面添加“character_set_server=utf8mb4”,按Esc鍵進入指令模式,輸入“:wq”回車(儲存并退出)。
macOS下的路徑可能是:/usr/local/mysql/my.cnf
注意:必須重新啟動 MySQL 執行個體;
3.2、設定庫的字元集為 utf8mb4
可以使用工具來設定資料庫屬性:
3.3、設定表的字元集為 utf8mb4
create table emoji_table (
id int auto_increment primary key,
content varchar(255)
) default charset utf8mb4;
三、通過 set names 指令設定會話字元集
對于 JDBC 連接配接串設定了 characterEncoding 為 utf8 或者做了上述配置仍舊無法正常插入 emoji 資料的情況,建議在代碼中指定連接配接的字元集為 utf8mb4,樣例代碼如下:
String sqlCharset = "set names utf8mb4"
Statement statment = conn.createStatement();
resultSet = statment.executeQuery(sqlCharset);
注: set names utf8mb4; 指令會将 character_set_client、character_set_connection、character_set_results 3個會話字元集相關變量均設定為 utf8mb4,以保證寫入或者讀出的資料使用 utf8mb4 字元集進行解釋。
版權聲明:本文為 testcs_dn(微wx笑) 原創文章,非商用自由轉載-保持署名-注明出處,謝謝。 原文位址
https://blog.csdn.net/testcs_dn/article/details/75533784