这篇文章主要介绍一些个人对于HTML的盲区跟误区。
字符实体
- HTML 中的预留字符必须被替换为字符实体。
- 无法在键盘上键入的字符,可以用字符实体代替来显示。
字符实体类似这样:
e.g. <
或 <
用来显示小于号
预留字符
在 HTML 中,某些字符是预留的。
e.g.
不能使用小于号(<)和大于号(>),因为浏览器会误认为它们是标签。
由于浏览器总是会截短 HTML 页面中的空格,所以不间断空格也要用字符实体表示。
无法在键盘上键入的字符
普通键盘上不存在众多数学、技术和货币符号以及表情符号,无法在键盘上键入,但始终可以使用实体编号来显示它们
数学、技术和货币符号
e.g. ∀ ∂ Α © ↑等等
表情符号(Emoji)
e.g.😄 😍 💗
Emoji 类似图像或图标,但它们并不是,它们是来自 UTF-8字符集的字母(字符)。
由于表情符号是字符,因此可以像 HTML 中的其他任何字符一样复制、显示和调整它们的大小。
e.g.
<p style="font-size:48px">
😀 😄 😍 💗
</p>
HTML 中的字符实体
常用的
完整列表
参考HTML符号
e.g.
字符集
为了正确显示 HTML 页面,Web 浏览器必须知道要使用哪个字符集。
e.g. 上文提到的表情符号就是utf-8里的字符
指定
在 <meta>
标签的charset属性中指定
e.g. <meta charset="UTF-8">
从 ASCII 到 UTF-8
ASCII 是第一个字符编码标准。ASCII 定义了 128 种可以在互联网上使用的字符:数字(0-9)、英文字母(A-Z)和一些特殊字符,比如:! $ + - ( ) @ < >。
ISO-8859-1 是 HTML 4 的默认字符集。此字符集支持 256 个不同的字符代码。HTML 4 同时支持 UTF-8。
ANSI(Windows-1252)是原始的 Windows 字符集。 ANSI 与 ISO-8859-1 相同,不同之处在于 ANSI 具有 32 个额外的字符。
HTML5 规范鼓励 Web 开发人员使用 UTF-8 字符集,该字符集涵盖了世界上几乎所有的字符和符号!