文本文件存储的内容是基于 字符编码 的文件,常见的编码有 ASCII 编码,UNICODE 编码等
ASCII 编码
- 计算机中只有 256 个 ASCII 字符
- 一个 ASCII 在内存中占用 1 个字节 的空间
- 8 个 0/1 的排列组合方式一共有 256 种,也就是 2 ** 8
UTF-8 编码格式
- 计算机中使用 1~6 个字节 来表示一个 UTF-8 字符,涵盖了 地球上几乎所有地区的文字
- 大多数汉字会使用 3 个字节 表示
- UTF-8 是 UNICODE 编码的一种编码格式
微信扫一扫
文本文件存储的内容是基于 字符编码 的文件,常见的编码有 ASCII 编码,UNICODE 编码等
ASCII 编码
UTF-8 编码格式
相关推荐