#ifndef _ASM_GENERIC_ERRNO_BASE_H
#define _ASM_GENERIC_ERRNO_BASE_H
#define EPERM 1
#define ENOENT 2
#define ESRCH 3
#define EINTR 4
#define EIO 5
#define ENXIO 6
#define E2BIG 7
#define ENOEXEC 8
#define EBADF 9
#define ECHILD 10
#define EAGAIN 11
#define ENOMEM 12
#define EACCES 13
#define EFAULT 14
#define ENOTBLK 15
#define EBUSY 16
#define EEXIST 17
#define EXDEV 18
#define ENODEV 19
#define ENOTDIR 20
#define EISDIR 21
#define EINVAL 22
#define ENFILE 23
#define EMFILE 24
#define ENOTTY 25
#define ETXTBSY 26
#define EFBIG 27
#define ENOSPC 28
#define ESPIPE 29
#define EROFS 30
#define EMLINK 31
#define EPIPE 32
#define EDOM 33
#define ERANGE 34
#endif
假如accept返回EMFILE该如何应对?这意味着本进程打开的文件描述符已经打到上限,无法为新连接创建socket文件描述符。但是,既然没有sockt文件描述符来表示这个连接,我们无法close它。程序会继续运行,回到再次调用的epoll_wait。这个时候epoll_wait会立刻返回,因为有新连接还等待处理,listenning fd 还是可读的(POLLIN事件)。这样程序会陷入busy loop状态,CPU占有率接近100%,会影响本系统的其他服务,也会影响同一机器上的其他服务。
如何处理那?
1、调高进程的文件描述符数目。治标不治本,因为只要有足够多的客户端,就一定能把一个服务进程的文件描述符用户
2、死等。鸵鸟算法(传说中鸵鸟看到危险就把头埋在地底下。当你对某一件事情没有一个很好的解决方法时,那就忽略它,就像鸵鸟面对危险时会把它深埋在沙砾中,装作看不到。这样的算法称为“鸵鸟算法“。鸵鸟算法,是平衡性能和复杂性而选择的一种方法。)
3、退出程序。似乎小题大做,为这种暂时的错误而中断现有的服务似乎不值得
4、关闭监听listenning fd。那么什么时候重新打开那
5、改用edge trigger。如果漏掉了一次accept(2),程序再也不会收到连接
6、准备一个空闲的文件描述符。如遇到这种情况,先关闭这个空闲的文件,获得了一个文件描述符的名额;再accept拿到新socket连接的描述符;随后立刻关闭close它,这样就优雅的断开了客户端连接;最后重新打开一个空闲的文件,把“坑”占住,已被再次出现这种情况时使用。
7、file descriptor是hard limit,我们可以自己设一个稍微第一点的soft limit,如果超过soft limit 就主动关闭新连接,这样就避免触及“file descriptor耗尽”这种边界条件。比方说当前进程的max file descriptor是1024,那么我们可以在连接数打到1000的时候进入“拒绝新连接”的状态
第2、5种做法会导致客户端认为连接已经建立,但是无法获取服务,因为服务端程序没有拿到连接的文件描述符
代码形式如下:
int idleFd_=::open("/dev/null", O_RDONLY | O_CLOEXEC);
int connfd = acceptSocket_.accept();
if (connfd >= 0)
{
.............................
}
else
{
if (errno == EMFILE)
{
::close(idleFd_);
idleFd_ = ::accept(acceptSocket_.fd,NULL,NULL)
:close(idleFd_);
idleFd_ = ::open("/dev/null", O_RDONLY | O_CLOEXEC);
}
}