目录
udp特点
- 无连接:知道对端IP和端口号就可以直接传输不用建立连接
- 不可靠:没有任何安全机制,发送端发送数据报以后,如果因为网络故障该段数据无法发送到对方,UDP协议层也不会给应用层返回任何错误信息
- 面向数据报:以数据报为单位发送数据,一个数据报里有多少字节就要发送多少字节,接收端就要接收多少字节
- 全双工:一个通信通道,允许双向通信
- UDP只有接收缓冲区,没有发送缓冲区:UDP发送的数据会直接交给内核,由内核将数据传给网络层协议,进行后续传输动作。UDP有接收缓冲区,但是这个接收缓冲区不能保证收到的UDP报的顺序和发送UDP报的顺序一致;如果缓冲区满了,再到达的UDP数据就会被丢弃。
UDP报文格式
如何基于校验和来完成数据校验
- 发送方,把要发送的数据整理好(称为 data1),通过一定的算法,计算出校验和checksum1
- 发送方把data1和checksum1一起通过网络发送出去
- 接收方收到数据(收到的数据称为 data2)和校验和checksum1
- 接收方再根据data2重新计算出一个新的校验和checksum2
- 对比两个校验和checksum1和checksum2是否相同,如果不同则认为data1和data2是不同的(也就是认为在传输过程中出现错误),如果checksum1和checksum2相同,则可以认为data1和data2是相同的(也就是传输成功)
计算校验和的算法
此处UDP使用的是CRC算法(循环冗余算法):
把当前要计算校验和的数据,每个字节,都进行累加,把结果保存到这两个字节的变量(校验和)中,过程中溢出也没关系,如果中间某个数据,出现传输错误,第二次计算的校验和就会和第一次不同(CRC这个算法其实不是特别靠谱,比如如果前一个字节大小少1,后一个字节大小多1,那么最后得到的校验和任然相同,但是数据可能已经不同了)。
MD5算法
MD5算法的特点:
- 计算方式:MD5有一套公式来完成校验和的计算
- 定长:无论原始数据多长,计算得到的MD5都是固定长度
- 分散:给定两个原始数据,就算绝大部分内容都一样,只要其中一个字节不同。得到的MD5就会差别很大(MD5算法也很适合hash算法)
- 不可逆:给定一个原始数据计算出MD5非常容易,但是给定一个MD5,要想还原出他的原始数据,就十分的困难了
- MD5计算出的校验和是一个16进制的整数比如8C831A33CDF18349
如何接收udp报文
接收方接收UDP数据时,会先将整条数据报(带报头)放置到接受缓冲区中(这个接受缓冲区要足够大,否则会因为无法存放下数据,导致数据丢失),然后UDP对报文进行解析,首先会先取出16位报头长度大小字节,之后减去8字节固定报头长度,剩下的就是原始数据大小(正因如此,UDP传输不会出现粘包问题)