unicode17个平面,每个平面16位, 17需要5位,共21位。utf8 4个byte可以表示21位,所以目前4byte够了unicode17个平面,大约可以表示110万个字符,已经用了10万左右 常用汉字,如:一汉龥 占用3字节非常用汉字,如: 占用4个字节utf16 前者两个字节,后者4个字节。utf表示ascll码时,只要1个字节,utf16要两个字节