我MySQL数据库用的uft-8字符集,插入数据一直很正常。今天当保存微信的用户信息时,遇到一个很奇葩的错误: Incorrect string value: '\xFD\xDE'。仔细观察微信的用户名,发现其中有表情字符,初步分析表情字符导致,可以为什么呢?
网上查找一下,找到了原因:原来mysql支持的 utf8 编码最大字符长度为 3 字节,如果遇到 4 字节的宽字符就会插入异常了。而 Emoji 表情(Emoji 是一种特殊的 Unicode 编码,常见于 ios 和 android 手机上),和很多不常用的汉字等都是 4 字节的。
知道了原因,就比较好解决了。使用 utf8mb4 字符集即可,但只有 5.5.3 版本以后的才支持!
参考并鸣谢:https://zhidao.baidu.com/question/1949879706369876188.html
补充:
满以为设置字段的字符集就可以了,再次测试,发现还是有问题。最后修改数据库配置文件,将数据库字符集也进行了修改,重新启动数据库,最终解决了问题。(这个问题有点儿奇怪,按说我设置了表中字段的字符集,应该是可以了,一般来讲字段的字符集设置优先级应该最高。可能是没有将数据库字符集设置为utf8mb4时,表、或字段并不支持该字符集。以上为我根据实践结果的猜测。)
[client]
default-character-set=utf8mb4
[mysql]
default-character-set=utf8mb4
[mysqld]
collation-server=utf8mb4_general_ci
character-set-server=utf8mb4
java程序可以使用下面的字符串进行测试:
String emoji="\ud83c\udc02\ud83d\udc02\u2600-\u27ff";