0
点赞
收藏
分享

微信扫一扫

MySQL 8 创建数据库和建表使用字符集和排序规则utf8 utf8mb4 和utf8mb4_general_ci utf8mb4_unicode_ci


新的项目启动后,创建数据库使用的一般需要创建默认字符集(CHARACTER)和排序规则(COLLATE)。

以下是我创建表使用的字符集和排序规则。

CREATE DATABASE `springcloud` DEFAULT CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci ;

 

字符集

排序规则

utf8


utf8_general_ci

utf8_unicode_ci

utf8mb4


utf8mb4_general_ci

utf8mb4_unicode_ci

 

utf8 vs utf8mb4(字符集)

utf8 和utf8mb4 是以unicode字符集使用UTF-8编码输出的不同的字符集。

utf8就是utf8mb3的别称,是unicode字符集使用UTF-8编码用3个字节(bytes)标识一个字符(character)的方式输出的字符集;MySQL官网已经明确说了,utf8mb3 is deprecated 会将之后的版本中移除掉。并且建议使用utf8mb4替换。

utf8mb4是unicode字符集使用UTF-8编码用4个字节(bytes)标识一个字符(character)的方式输出的字符集;在保存内容中有表情符号emoji时,使用utf8会有缺失情况(emoji表情 4 btyes),而utf8mb4天然支持。拓展性、兼容性更好。

Note

The ​​utf8mb3​​​ character set is deprecated and will be removed in a future MySQL release. Please use ​​utf8mb4​​​ instead. Although ​​utf8​​​ is currently an alias for ​​utf8mb3​​​, at some point ​​utf8​​​ will become a reference to ​​utf8mb4​​​. To avoid ambiguity about the meaning of ​​utf8​​​, consider specifying ​​utf8mb4​​​ explicitly for character set references instead of ​​utf8​​.

 

utf8mb4_general_ci vs utf8mb4_unicode_ci(排序规则)

utf8mb4_general_ci在识别上不是那么精准,所以在查询检索效率上更高。

utf8mb4_unicode_ci会更规范,在识别上非常精准,所以对应的查询检索效率上会低一点。

详情可参考官网和外链。

 

​​MySQL官网8.0 charset-unicode-sets​​

​​stackoverflow general_ci unicode_ci 性能对比​​


举报

相关推荐

0 条评论