天天看点

MySQL中字符集 utf8mb4与utf8的区别

今早发现MySQL 中无法存储emoji表情,查询资料后发现是字符集的问题。

原因:emoji对应的Unicode编码不在utf8对应的Unicode分组平面内,无法直接用MySQL的utf8存储emoji编码格式字符。

解决方法:将数据库默认字符集由utf8 更改为utf8mb4,对应的表默认字符集也更改为utf8mb4。

从MySQL 5.5.3起,utf8mb4字符集每个字符最多使用四个字节,并支持补充字符,而uft8字符每个字符最多使用三个字节,如果遇到四字节的字符就会出现错误了。

参考文章:

MySQL官网—utf8mb4

How to store emoji in a Rails app with a MySQL database