0
点赞
收藏
分享

微信扫一扫

LInux中nio的实现原理


我们上一篇文章 《linux中netstat和ss命令详解》中提到了nio 原文:​​https://www.phpmianshi.com/?id=105​​

有一些小伙伴私信想了解什么是nio,我们这篇详细介绍下什么是nio?

 

参考:​​https://www.phpmianshi.com/?id=33​​

全称:non-blocking IO(实际上是 new io),NIO在Linux上使用了epoll这个系统调用,epoll能够做到已注册的连接在消息到来的时候主动通知调度器,将消息加入消息队列。非阻塞io最重要的其实就是解决了read函数的阻塞问题。

从一个文件中读出数据并将数据传到另一台服务器上?

伪代码
 

File.read(file, buf, len);
Socket.send(socket, buf, len);

涉及到几次cpu切换和数据copy?

 

LInux中nio的实现原理_套接字

 

1、应用程序中调用​​read()​​ 方法,这里会涉及到一次上下文切换(用户态->内核态),底层采用DMA(direct memory access)读取磁盘的文件,并把内容存储到内核地址空间的读取缓存区。

2、由于应用程序无法读取内核地址空间的数据,如果应用程序要操作这些数据,必须把这些内容从读取缓冲区拷贝到用户缓冲区。这个时候,​​read()​​ 调用返回,且引发一次上下文切换(内核态->用户态),现在数据已经被拷贝到了用户地址空间缓冲区,这时,如果有需要,应用程序可以操作修改这些内容。

3、我们最终目的是把这个文件内容通过Socket传到另一个服务中,调用Socket的​​send()​​方法,这里又涉及到一次上下文切换(用户态->内核态),同时,文件内容被进行第三次拷贝,被再次拷贝到内核地址空间缓冲区,但是这次的缓冲区与目标套接字相关联,与读取缓冲区没有半点关系。

4、​​send()​​调用返回,引发第四次的上下文切换,同时进行第四次的数据拷贝,通过DMA把数据从目标套接字相关的缓存区传到协议引擎进行发送。

"在整个过程中,过程1和4是由DMA负责,并不会消耗CPU,只有过程2和3的拷贝需要CPU参与

 

如果在应用程序中,不需要操作内容,过程2和3就是多余的,如果可以直接把内核态读取缓存冲区数据直接拷贝到套接字相关的缓存区,是不是可以达到优化的目的?

LInux中nio的实现原理_套接字_02

这种实现,可以有以下几点改进:

  • 上下文切换的次数从四次减少到了两次
  • 数据拷贝次数从四次减少到了三次(其中DMA copy 2次,CPU copy 1次)

 

"确实改善了很多,但还没达到零拷贝的要求,还有其它黑技术吗?"

"对的,如果底层网络接口卡支持收集操作的话,就可以进一步的优化。"

"怎么优化?"

在 Linux 内核 2.4 及后期版本中,针对套接字缓冲区描述符做了相应调整,DMA自带了收集功能,对于用户方面,用法还是一样的,但是内部操作已经发生了改变:

LInux中nio的实现原理_数据_03

 

 

  • 第一步,transferTo() 方法引发 DMA 将文件内容拷贝到内核读取缓冲区。
  • 第二步,把包含数据位置和长度信息的描述符追加到套接字缓冲区,避免了内容整体的拷贝,DMA 引擎直接把数据从内核缓冲区传到协议引擎,从而消除了最后一次 CPU参与的拷贝动作。

 

举报

相关推荐

0 条评论