当我们在网络中发送数据时，用write来发送，用read来读取。但是有没有发现一个问题，之前说过在应用层调用 write，并不是直接将数据发送到网络中，而是将数据从应用层拷贝到传输层中的发送缓冲区中，所以write的本质是拷贝；当然调用 read 也并不是直接从网络中读取数据，而是将数据从传输层的接收缓冲区中拷贝到应用层，所以read也是拷贝函数。

那么问题来了，你想拷贝就拷贝吗？这句话什么意思呢？比如说调用read，你就一定能读取到数据吗？

答案是不一定，比如接收缓冲区里并没有数据，那么read 去读取时并不能读到数据，并且read还会被阻塞住。我们知道读取和发送的本质是拷贝，但是拷贝是有条件的，以读取为例，接收缓冲区中要有数据，read才能把数据从内核空间拷贝到用户空间并返回。

那什么是阻塞呢？ 阻塞的核心本质就是在等待资源就绪。

那么等待什么资源就绪呢？以read为例，就是等待接收缓冲区中有资源。

这里我们不能简简单单的认为读取就是拷贝，因为还需要等待资源就绪，而发送/写入也一样。

那么可以得出一个结论：IO的本质就是等 + 数据拷贝 。

什么是高效IO呢？

因为数据拷贝是操作系统做的事，没有特殊情况的话数据拷贝的时间一般都是固定的。所以高效IO的本质就是减少等的比重 。

有哪些IO的的方式呢？

举例子：

那么有个问题，你认为谁的效率高呢？

这里我们认为一段时间内谁钓的鱼多，谁的效率就高，那么无论是张三、李四、王五、还是田七，他都只有一个鱼竿，而赵六有很多个鱼竿，那么赵六的效率就一定比其他人要高很多。为什么？前面说过我们认为钓鱼就两个动作：等 + 上鱼；因为赵六等的时间比重比较低，所以他的效率就高。

这几个人分别对应的IO模型是：

张三：阻塞式IO

李四：非阻塞式IO

王五：信号驱动IO

赵六：IO多路转接

田七：异步IO

五种IO模型

阻塞IO：在内核将数据准备好之前，系统调用会一直等待。所有的套接字，默认都是阻塞方式。阻塞IO是最常见的IO模型。

非阻塞IO：如果内核还未将数据准备好，系统调用仍然会直接返回，并且返回EWOULDBLOCK错误码。非阻塞IO往往需要程序员循环的方式反复尝试读写文件描述符，这个过程称为轮询。这对CPU来说是较大的浪费，一般只有特定场景下才使用。

信号驱动IO：内核将数据准备好的时候，使用SIGIO信号通知应用程序进行IO操作。

IO多路转接：虽然从流程图上看起来和阻塞IO类似，实际上最核心在于IO多路转接能够同时等待多个文件描述符的就绪状态。

异步IO：由内核在数据拷贝完成时，通知应用程序(而信号驱动是告诉应用程序何时可以开始拷贝数据)。

别看有这么多的模型，常用的还是阻塞式IO。

这五种模型在特性有什么差别呢？

阻塞IO、非阻塞IO、信号驱动IO，这三个在效率上没有差别，为什么这么说，因为在某种事件就绪前，它们三个都在等；而事件就绪之后，它们都做出了相应的动作；那么它们三个在其他方面有差别吗？当然有，从整体来看非阻塞IO 和信号驱动IO 它们两在等的时候可以做其他事情。
阻塞IO、非阻塞IO、信号驱动IO、IO多路转接，这四个它们都参与了IO的过程，也就是等 + 数据拷贝(它们是切身实地的在河边)，所以这几个统称同步IO。
异步IO并没有参与 IO 两个阶段中的任意一个阶段；它只是发起事件，并没有参与事件，所以他被叫做异步IO。

阻塞IO、非阻塞IO有什么差别呢？

共同点：都进行了数据拷贝
不同点：等待的方式不同

这里的同步IO和多进程/多线程的同步有什么关系吗？

没有任何关系，所以以后看到同步时要看前提条件是什么，线程同步：让多线程执行具有一定的顺序性；IO同步：是否参与IO的过程。

其他高级IO

非阻塞IO，纪录锁，系统V流机制， I/O多路转接（也叫I/O多路复用），readv和writev函数以及存储映射IO（mmap），这些统称为高级IO。

本篇文章重点说明IO多路转接

非阻塞IO

fcntl

操作文件描述符，默认方式是阻塞IO。

传入的cmd的值不同，后面追加的参数也不相同。

我们这里只用第三种功能，获取/设置文件状态标记，就可以将一个文件描述符设置为非阻塞。

用read读取数据时，默认是阻塞式，所以内核的接收缓冲区中没有数据，read会被阻塞。

实现函数SetNonBlock

基于fcntl，我们实现一个SetNoBlock函数，将文件描述符设置为非阻塞。

使用F_GETFL将当前的文件描述符的属性取出来(这是一个位图)，然后再使用F_SETFL将文件描述符设置回去，设置回去的同时，加上一个O_NONBLOCK参数。

#include <iostream>
#include <unistd.h>
#include <fcntl.h>
#include <cstring>
#include <cerrno>
#include <cstdio>
#include <functional>

using namespace std;
void SetNoBlock(int fd)
{
    int fl = fcntl(fd, F_GETFL);//获取文件描述符属性
    if(fl < 0)
    {
        std::cerr << "fcntl: " << strerror(errno) << std::endl;
    }
    fcntl(fd, F_SETFL, fl | O_NONBLOCK);   //将该文件描述符fd，设置为非阻塞
}
int main()
{

    SetNoBlock(0);
    while (true)
    {
        printf(">>> ");
        fflush(stdout);
        char buffer[1024];
        int n = read(0, buffer, sizeof(buffer) - 1);
        if (n > 0)
        {
            buffer[n] = 0;
            cout << "echo#" << buffer << endl;
        }
        else if (n == 0)
        {
            cout << "read end" << endl;
            break;
        }
        else
        {
            // 1.当我不输入时，底层没有数据算错误吗？ 不算，只是以错误的形式返回
            // 2.我又如何区分是真的错了还是底层没数据？ 单靠返回值无法区分，

            if(errno == EAGAIN)
            {
                cout << "底层没数据，请再读一次 " << endl;
            }
            else if(errno == EINTR) //因为某些原因，中断读取，所以重新读取
            {
                continue;
            }
            else
            {
                cout << "result:" << n  << "errno:" << strerror(errno) << endl;
                break;
            }
        }
        sleep(1);
    }
    return 0;
}

I/O多路转接之select

初识select

系统提供select函数来实现多路复用输入/输出模型。select系统调用是用来让我们的程序监视多个文件描述符的状态变化的，程序会停在select这里等待，直到被监视的文件描述符有一个或多个发生了状态改变。

select函数

参数说明：

关于timeval结构

timeval结构用于描述一段时间长度，如果在这个时间内，需要监视的描述符没有事件发生则函数返回，返回值为0。

函数返回值：

那么select未来要关心的事件只有三类：1.读 2.写 3.异常，对于任何一个fd都是这三种。

关于fd_set结构

其实这个结构就是一个整数数组，更严格的说，是一个 "位图"。使用位图中对应的位来表示要监视的文件描述符。

因为参数是输入输出型，所以输入代表的是用户告诉内核，这个集合上的设置文件描述符事件你要关心；输出代表内核告诉用户，你让我关心的多个文件描述符中哪个就绪了。这个输入输出型参数是为了让用户和内核之间的相互沟通，互相知晓对方要的或关心的。

操作系统也提供了一组操作fd_set的接口，来比较方便的操作位图。

理解select执行过程

理解select模型的关键在于理解fd_set，为说明方便，取fd_set长度为1字节， fd_set中的每一bit可以对应一个文件描述符fd，则1字节长的fd_set最大可以对应8个fd。

基于select实现一个从网络中读取数据并反显的服务器(只关心读取)：因为代码分了几个文件不好直接体现，所以有兴趣的自己去Gitee上看吧。

lesson15/2_select_server · 晚风不及你的笑/MyCodeStorehouse - 码云 - 开源中国 (gitee.com)

这里用telnet充当客户端。

select的特点

I/O多路转接之poll

poll也是一种Linux中多路转接的方案。poll 的作用和select的作用也是一样的：等待。

但是poll解决了一些问题：

1. poll解决了select的fd有上限的问题；

2.poll解决了select每次调用都要重新设置关心的fd的问题。

poll函数接口

参数说明：

fds是一个poll函数监听的结构列表，每一个元素中，包含了三部分内容：文件描述符、监听的事件集合(输入)、返回的事件集合(输出)。
nfds表示fds数组的长度；
timeout表示poll函数的超时返回的时间，单位是毫秒(ms)；timeout > 0：在timeout内阻塞，超出timeout返回一次，timeout == 0：非阻塞等待，timeout < 0：阻塞等待。

从第一个参数的结构可以看到输入输出是分离的，代表poll不需要对参数重新设定了。

为什么说它解决了select的fd有上限的问题呢？因为这里传的是数组的长度，也就是说只要你想，数组有多大，这个fd就可以有多少。那么有人说了这不还是有上限嘛，这个上限属于是你系统的上限而不是像select那样的上限。

events和revents的取值:

返回结果：

在之前select的服务器基础上进行修改：

lesson15/3_poll_server · 晚风不及你的笑/MyCodeStorehouse - 码云 - 开源中国 (gitee.com)

poll的优点

poll的缺点

I/O多路转接之epoll

epoll初识

按照man手册的说法: 是为处理大批量句柄而作了改进的poll。
它是在2.5.44内核中被引进的(epoll(4) is a new API introduced in Linux kernel 2.5.44) 它几乎具备了之前所说的一切优点，被公认为Linux2.6下性能最好的多路I/O就绪通知方法。

epoll的相关系统调用

epoll 有3个相关的系统调用

头文件： #include <sys/epoll.h>

epoll_create

说明：

epoll_ctl

epoll的事件注册函数，它不同于select，select是在监听事件时告诉内核要监听什么类型的事件，而是在这里先注册要监听的事件类型。

参数说明：

第一个参数是epoll_create()的返回值(epoll的句柄)；
第二个参数表示动作，用三个宏来表示。

        EPOLL_CTL_ADD ：注册新的fd到epfd中；
        EPOLL_CTL_MOD ：修改已经注册的fd的监听事件；
        EPOLL_CTL_DEL ：从epfd中删除一个fd；

第三个参数是需要监听的fd；
第四个参数是告诉内核需要监听什么事。

struct epoll_event结构如下：

events可以是以下几个宏的集合：

返回值：成功返回0，失败返回-1，错误码被设置。

epoll_wait

收集在epoll监控的事件中已经就绪的事件。

参数说明：

函数返回值：

和select、poll函数的返回值一样，如果函数调用成功，返回对应I/O上已准备好的文件描述符数目，如返回0表示已超时，返回小于0表示函数调用失败。

epoll工作原理

当某一进程调用epoll_create方法时， Linux内核会创建一个eventpoll结构体，这个结构体中有两个成员与epoll的使用方式密切相关：

struct eventpoll{
    ....
    /*红黑树的根节点，这颗树中存储着所有添加到epoll中的需要监控的事件*/
    struct rb_root rbr;
    /*双链表中则存放着将要通过epoll_wait返回给用户的满足条件的事件*/
    struct list_head rdlist;
    ....
};

每一个epoll对象都有一个独立的eventpoll结构体，用于存放通过epoll_ctl方法向epoll对象中添加进来的事件；这些事件都会挂载在红黑树中，如此，重复添加的事件就可以通过红黑树而高效的识别出来(红黑树的插入时间效率是lgn，其中n为树的高度)。而所有添加到epoll中的事件都会与设备(网卡)驱动程序建立回调关系，也就是说，当响应的事件发生时会调用这个回调方法。
这个回调方法在内核中叫ep_poll_callback，它会将发生的事件添加到rdlist双链表(就绪队列)中。在epoll中，对于每一个事件，都会建立一个epitem结构体。

struct epitem{
    struct rb_node rbn;//红黑树节点
    struct list_head rdllink;//双向链表节点
    struct epoll_filefd ffd; //事件句柄信息
    struct eventpoll *ep; //指向其所属的eventpoll对象
    struct epoll_event event; //期待发生的事件类型
}

当调用epoll_wait检查是否有事件发生时，只需要检查eventpoll对象中的rdlist双链表(就绪队列)中是否有epitem元素即可。如果rdlist不为空，则把发生的事件复制到用户态，同时将事件数量返回给用户，这个操作的时间复杂度是O(1)。

细节：

在前面代码的基础上进行修改，也只支持连接和读取，LT模式：

lesson15/4_epoll_server · 晚风不及你的笑/MyCodeStorehouse - 码云 - 开源中国 (gitee.com)

什么叫做事件就绪？

底层IO条件满足了，可以进行某种IO行为了，就叫做事件就绪。

那么select、poll、epoll的这些多路转接的方式都叫做IO就绪事件的通知机制，那么这个通知机制有没有策略呢？有，下面接着看。

epoll工作方式

epoll有2种工作方式-水平触发(LT)和边缘触发(ET)。epoll默认状态下就是LT工作模式。

举个例子：有个快递员叫张三，今天给你送快递，你的快递很多，他给你打电话叫你下楼取快递，你满口答应，但是手头上的事还没做完，想等做完再下去；过了一小会，张三见你没下来，又给你打电话叫你赶紧下来取快递，你答应着，但是继续忙着自己的事，张三就一直给你打电话，直到你下楼取快递，但是快递很多，一次取不完；你刚到家，老板打来电话，叫你改东西，要的很急；你只好赶紧改东西，过了一小会，张三电话打来了，你快递没取完呢，赶紧下来取，你又继续答应着，然后忙自己的事，张三就跟之前一样过一会给你打一个电话，直到你把快递取完才不给你打电话了。这个张三就是水平触发，用代码演示一下，比如我们监听listen套接字，但是有连接到来时，并不对这个连接 accept ，此时就会一直报有事件就绪了(如下图)，直至你把你把就绪事件捞走。

又有一个快递员叫李四，也同样给你送快递，到了你楼下，给你打了一个电话，说你这次不下来，我就不给你打电话了，你后面要是再想取快递就等下一次或者别人给你送了；然后你忙着呢，哪有空管快递，然后李四等了一会你没下来，他就走了，给别人送快递去了；然后今天你又有新快递到驿站了，李四送完一车，回到站点取下一车快递发现有你的，就会又给你送一次，依旧是同样的话，你不下来我就走了；这次你知道你不下来的话，这快递你就只能等明天送或者有新快递了才送，然后你赶紧下来把快递去了。李四就叫做边缘触发。也就是说有事件就绪只会通知一次，倒逼着你赶紧把所有的就绪事件捞走，这次不拿只能等下一次有新事件就绪了才会在通知你。

就这么来看的话ET的效率要比LT效率高，因为它只通知一次，倒逼着你必须把数据一次性读完。