I/O模型——select、poll、epoll

操作系统处理I/O为两个阶段：

1、等待数据传到I/O设备

2、I/O设备将数据复制到user space

或者同样理解为：

1、等到数据传到kernel内核space

2、kernel内核区域将数据复制到user space（理解为进程或者线程的缓冲区）

阻塞I/O模型
非阻塞I/O模型
I/O多路复用模型——select、poll、epoll

一、阻塞I/O模型

下面两个阶段都被阻塞

1、应用层数据到kernel

2、kernel复制到user space

应用层有数据发来，会调用recvfrom方法，但应用层的数据还没有复制到内核中，所以将应用层的数据复制到内核中的这个阶段，recvfrom方法会被阻塞。当内核中的数据准备好后，会发起一个系统调用将内核中的数据复制到进程的缓存区(user space)，最后recvfrom返回，并解除阻塞。

二、非阻塞I/O模型

应用层数据到kernel的阶段不被阻塞。应用层数据到kernel的过程中，recvfrom会轮询检查，如果kernel数据没有准备还，就返回一个EWOULDBLOCK错误。不断的轮询检查，直到发现kernel中的数据准备好了，就返回。然后进行系统调用，将数据从kernel拷贝到进程缓冲区中。有點類似busy-waiting的方法。

三、I/O多路复用模型

当有多个socket fd(文件描述符)时，前面的fd没有准备好，后面的fd即便准备好了也不能处理。会造成客户端的严重延迟。而如果用多线程来处理多个socket fd，又会启动大量的线程，造成资源浪费。

所以出现了I/O多路复用模型，用一个进程来处理多个fd的请求。

应用：适用于针对大量的io请求的情况，对于服务器必须在同时处理来自客户端的大量的io操作的时候，就非常适合

1、select

单个进程就可以同时处理多个网络连接的io请求（同时阻塞多个io操作）。

基本原理：程序呼叫select，然后整个程序就阻塞了，这时候，kernel就会轮询检查所有select负责的fd，当找到一个client中的数据准备好了，select就会返回，这个时候程序就会系统调用，将数据从kernel复制到进程缓冲区。

2、poll

poll的原理与select非常相似，差别如下：

描述fd集合的方式不同，poll使用 pollfd 结构而不是select结构fd_set结构，所以poll是链式的，没有最大连接数的限制
poll有一个特点是水平触发，也就是通知程序fd就绪后，这次没有被处理，那么下次poll的时候会再次通知同个fd已经就绪。

select缺点

1、根据fd_size的定义，它的大小为32个整数大小（32位机器为32*32，所有共有1024bits可以记录fd），每个fd一个bit，所以最大只能同时处理1024个fd

2、每次要判断【有哪些event发生】这件事的成本很高，因为select（polling也是）采取主动轮询机制

1.每一次呼叫 select( ) 都需要先从 user space把 FD_SET复制到 kernel（约线性时间成本）

为什么 select 不能像epoll一样，只做一次复制就好呢?

每一次呼叫 select()前，FD_SET都可能更动，而 epoll 提供了共享记忆存储结构，所以不需要有 kernel 与 user之间的数据沟通

2.然后kernel还要轮询每个fd，约线性时间

假设现实中，有1百万个客户端同时与一个服务器保持着tcp连接，而每一个时刻，通常只有几百上千个tcp连接是活跃的，这时候我们仍然使用select/poll机制，kernel必须在搜寻完100万个fd之后，才能找到其中状态是active的，这样资源消耗大而且效率低下。

对于select和poll的上述缺点，就引进了一种新的技术，epoll技术

3、epoll

epoll 提供了三个函数：

int epoll_create(int size);

建立一個 epoll 对象，并传回它的id

int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event);

事件注册函数，将需要监听的事件和需要监听的fd交给epoll对象

int epoll_wait(int epfd, struct epoll_event *events, int maxevents, int timeout);

等待注册的事件被触发或者timeout发生

epoll解决的问题：

1、epoll没有fd数量限制

epoll没有这个限制，我们知道每个epoll监听一个fd，所以最大数量与能打开的fd数量有关，一个g的内存的机器上，能打开10万个左右

2、epoll不需要每次都从user space 将fd set复制到内核kernel

epoll在用

epoll_ctl

函数进行事件注册的时候，已经将fd复制到内核中，所以不需要每次都重新复制一次

3、select 和 poll 都是主动轮询机制，需要拜访每一个 FD；

epoll是被动触发方式，给fd注册了相应事件的时候，我们为每一个fd指定了一个回调函数，当数据准备好之后，就会把就绪的fd加入一个就绪的队列中，

epoll_wait

的工作方式实际上就是在这个就绪队列中查看有没有就绪的fd，如果有，就唤醒就绪队列上的等待者，然后调用回调函数。

4、虽然epoll、poll、epoll都需要查看是否有fd就绪，但是epoll之所以是被动触发，就在于它只要去查找就绪队列中有没有fd，就绪的fd是主动加到队列中，epoll不需要一个个轮询确认。

换一句话讲，就是select和poll只能通知有fd已经就绪了，但不能知道究竟是哪个fd就绪，所以select和poll就要去主动轮询一遍找到就绪的fd。而epoll则是不但可以知道有fd可以就绪，而且还具体可以知道就绪fd的编号，所以直接找到就可以，不用轮询。

4、总结

1、select, poll是为了解決同时大量IO的情況（尤其网络服务器），但是随着连接数越多，性能越差

2、epoll是select和poll的改进方案，在 linux 上可以取代 select 和 poll，可以处理大量连接的性能问题

I/O模型——select、poll、epoll

一、阻塞I/O模型

二、非阻塞I/O模型

三、I/O多路复用模型

1、select

2、poll

3、epoll

4、总结

继续阅读

c# select数据库数据

C#泛型列表List<T>基本用法总结

实验楼sql进阶之简化数据操作提升性能(window)

【prometheus】-08 图解云原生服务发现机制Prometheus服务发现机制之Kubernetes

乐透ＴＶ技术分析 nginx+mysql+php sphinx/coreseek

mysql5.7官网直译SQL语句优化--where条件查询优化

互联网创业的准备——web server：apache、nginx、lighttpd与php module、fastcgi

网络编程之IO复用机制(多路IO转接)之epoll的ET非阻塞092 总结

Android系统--输入系统（十六）APP跟输入系统建立联系_InputChannel和Connection

1、nginx入门篇之--安装

30个Python常用极简代码，拿走就用点击上方“机器学习与生成对抗网络”，关注"星标"获取有趣、好玩的前沿干货！

20个Python常用极简代码，拿走就能用

老师布置的几道SQL语句练习题

五分钟帮您理解Linux网络核心知识点——socket和epoll

【IO事件】【io多路复用】epoll的事件驱动；从多线程模型到单线程模型，再到IO多路复用模型的过程；

两年多的社招经验分享，我的跳槽经验总结(含阿里滴滴美团快手头条)前言面试轮廓面试准备怎么投简历知识复习项目我的面试经验汇总SpringCloudRedisJVMMySQLZookeeperKafkaDubbospringRabbitmqspringboot最后