I/O复用使得程序能同时监听多个文件描述符,这对提高程序的性能至关重要。通常,网络程序在下列的情况下需要使用I/O复用技术:
- 客户端程序要同时处理多个socket。
- 客户端程序要同时处理用户输入和网络连接。
- TCP服务器要同时处理监听socket和连接socket。这是I/O多路复用使用最多的场合。
- 服务器要同时处理TCP请求和UDP请求。
- 服务器要同时监听多个端口,或者处理多种服务。
需要指出的是,I/O复用虽然能同时监听多个文件描述符,但它本身是阻塞的。
select系统调用的用途是:在一段指定时间内,监听用户感兴趣的文件描述符上的可读,可写和异常等事件。
select()系统调用原型:
#include<sys/select.h>
int select(int nfds,fd_set* readfds,fd_set* writefds,fd_set* exceptfds,struct timeval* timeout);
系统调用select()会一直阻塞,直到一个或多个文件描述符集合成为就绪态。
文件描述符何时满足就绪态,后面我们会讲到。
nfds参数:
nfds参数指定被监听的文件描述符的总数。它通常被设置为select监听的所有文件描述符中的最大值加1,因为文件描述符是从0开始计数的。
该参数让select()变的更有效率,因为此时内核就不用去检查大于这个值的文件描述符号是否属于这些文件描述符集合。
文件描述符集合:
参数readfds,writefds以及exceptfds都是指向文件描述符集合的指针,所指向的数据类型是fd_set结构体。
fd_set结构体定义如下:
//每个ulong型可以表示多少个bit
#define __NFDBITS (8 * sizeof(unsigned long))
//socket最大取值为1024
#define __FD_SETSIZE 1024
//bitmap一共有1024个bit,共需要多少个ulong
#define __FDSET_LONGS (__FD_SETSIZE/__NFDBITS)
typedef struct {
unsigned long fds_bits [__FDSET_LONGS]; //用ulong数组来表示bitmap
} __kernel_fd_set;
typedef __kernel_fd_set fd_set;
由以上定义可见,fd_set结构体仅包含一个整型数组,该数组的每个元素的每一位(bit)标记一个文件描述符。fd_set能容纳的文件描述符数量由FD_SETSIZE指定,在linux上,该常量的值为1024,这就限制了select能同时处理的文件描述符的数量。
数据类型fd_set以位掩码的形式来实现。但是,我们并不需要知道这些细节,因为所有关于文件描述符集合的操作都是通过四个宏来完成的:FD_ZERO(),FD_SET(),FD_CLR(),FD_ISSET()。
#include<sys/select.h>
void FD_ZERO(fd_set *fdset); //清除fdset的所有位
void FD_SET(int fd,fd_set *fdset); //设置fdset的位fd
void FD_CLR(int fd,fd_set *fdset); //清除fdset的位fd
int FD_ISSET(int fd,fd_set *fdset); //测试fdset的位fd是否被设置
- readfds是用来检测输入是否就绪的文件描述符集合
- writefds是用来检测输出是否就绪的文件描述符集合
- exceptfds是用来检测异常情况是否发生的文件描述符集合
参数readfds,writefds和exceptfds所指向的结构体都是保存结果值的地方。在调用select()之前,这些参数指向的结构体必须初始化(通过FD_ZERO()和FD_SET()),以包含我们感兴趣的文件描述符集合。之后select()调用会修改这些结构体,当select()返回时,它们包含的就是已处于就绪态的文件描述符集合了(就是将三个文件描述符集合中不满足就绪态的文件描述符去掉,留下的都是已经处于就绪态的文件描述符了)。
由于这些结构体会在调用中被修改,如果要在循环中重复调用select(),我们必须保证每次都要重新初始化它们。
之后通过调用FD_ISSET()遍历每个类型的文件描述符集合,找出处于就绪态的文件描述符。
如果我们对某一类型的事件不感兴趣,那么相应的类型文件描述符集合参数可以指定为NULL。
timeout参数:
参数timeout控制着select()的阻塞行为。该参数可指定为NULL,此时select()会一直阻塞。又或者指向一个timeval结构体。
timeval结构体定义如下:
struct timeval{
time_t tv_sec; //seconds
suseconds_t tv_usec; //microseconds(long int) 微秒
如果结构体timeval的两个域都为0的话,此时select()不会阻塞,它只是简单地轮询指定的文件描述符集合,看看其中是否有就绪的文件描述符并立刻返回。否则,timeout将为select()指定一个等待时间的上限值。
当timeout设为NULL,或其指向的结构体字段非零时,select()将阻塞直到有下列事件发生:
- readfds,writefds或exceptfds中指定的文件描述符中至少有一个成为就绪态;
- 该系统调用被信号处理例程中断;
- timeout中指定的时间上限已超时。
select()的返回值:
- 返回-1表示有错误发生
- 返回0表示在任何文件描述符成为就绪态之前select()调用已经超时。此时,每个返回的文件描述符集合将被清空
- 返回一个正整数表示有1个或多个文件描述符已经到达就绪态。如果同一个文件描述符在readfds,writefds和exceptfds中同时被指定,且它对于多个I/O时间都处于就绪态的话,那么就会被统计多次
文件描述符就绪条件:
在网络编程中,下列情况下socket可读:
- socket内核接收缓冲区中的字节数大于或等于其低水位标记SO_RCVLOWAT。此时我们可以无阻塞地读该socket,并且读操作返回的字节数大于0。
- socket通信的对方关闭连接。此时对该socket的读操作将返回0。
- 监听socket上有新的连接请求。
- socket上有未处理的错误。
下列情况下socket可写:
- socket内核发送缓冲区中的可用字节数大于或等于其低水位标记SO_SNDLOWAT。此时我们可以无阻塞地写该socket,并且写操作返回的字节数大于0。
- socket的写操作被关闭。对写操作被关闭的socket执行写操作将触发一个SIGPIPE信号。
- socket使用非阻塞connect连接成功或者失败(超时)之后。
- socket上有未处理的错误。
异常情况就绪:
术语“异常情况”常常被误解为在文件描述符上出现了一些错误,这并不正确。在Linux上,一个异常情况只会在下面两种情况发生:- 连接到处于信包模式下的伪终端主设备上的从设备状态发生了改变。
- 流式套接字上接收到了带外数据。
代码示例:
上面我们提到过,socket上接收到普通数据和带外数据都将使select返回,但处于不同的就绪状态:前者处于可读状态,后者处于异常状态。
下面的代码使用select同时处理两者数据的一个简单示例。
#include <sys/types.h>
#include <sys/socket.h>
#include <netinet/in.h>
#include <arpa/inet.h>
#include <assert.h>
#include <stdio.h>
#include <unistd.h>
#include <errno.h>
#include <string.h>
#include <fcntl.h>
#include <stdlib.h>
int main( int argc, char* argv[] )
{
if( argc <= 2 )
{
printf( "usage: %s ip_address port_number\n", basename( argv[0] ) );
return 1;
}
const char* ip = argv[1];
int port = atoi( argv[2] );
printf( "ip is %s and port is %d\n", ip, port );
int ret = 0;
struct sockaddr_in address;
bzero( &address, sizeof( address ) );
address.sin_family = AF_INET;
inet_pton( AF_INET, ip, &address.sin_addr );
address.sin_port = htons( port );
int listenfd = socket( PF_INET, SOCK_STREAM, 0 );
assert( listenfd >= 0 );
ret = bind( listenfd, ( struct sockaddr* )&address, sizeof( address ) );
assert( ret != -1 );
ret = listen( listenfd, 5 );
assert( ret != -1 );
struct sockaddr_in client_address;
socklen_t client_addrlength = sizeof( client_address );
int connfd = accept( listenfd, ( struct sockaddr* )&client_address, &client_addrlength );
if ( connfd < 0 )
{
printf( "errno is: %d\n", errno );
close( listenfd );
}
char remote_addr[INET_ADDRSTRLEN];
printf( "connected with ip: %s and port: %d\n", inet_ntop( AF_INET, &client_address.sin_addr, remote_addr, INET_ADDRSTRLEN ), ntohs( client_address.sin_port ) );
char buf[1024];
fd_set read_fds;
fd_set exception_fds;
FD_ZERO( &read_fds );
FD_ZERO( &exception_fds );
int nReuseAddr = 1;
setsockopt( connfd, SOL_SOCKET, SO_OOBINLINE, &nReuseAddr, sizeof( nReuseAddr ) );
while( 1 )
{
memset( buf, '\0', sizeof( buf ) );
//每次调用select前都要重新在read_fds和exception_fds中设置文件描述符connfd,因为事件发生之后,文件描述符集合将被内核修改
FD_SET( connfd, &read_fds );
FD_SET( connfd, &exception_fds );
ret = select( connfd + 1, &read_fds, NULL, &exception_fds, NULL );
printf( "select one\n" );
if ( ret < 0 )
{
printf( "selection failure\n" );
break;
}
//对于可读事件,采用普通的recv函数读取数据
if ( FD_ISSET( connfd, &read_fds ) )
{
ret = recv( connfd, buf, sizeof( buf )-1, 0 );
if( ret <= 0 )
{
break;
}
printf( "get %d bytes of normal data: %s\n", ret, buf );
}
//对于异常事件,采用带MSG_OOB标志的recv函数读取带外数据
else if( FD_ISSET( connfd, &exception_fds ) )
{
ret = recv( connfd, buf, sizeof( buf )-1, MSG_OOB );
if( ret <= 0 )
{
break;
}
printf( "get %d bytes of oob data: %s\n", ret, buf );
}
}
close( connfd );
close( listenfd );
return 0;
}
select存在的问题:
I/O多路复用这个概念被提出来以后, select是第一个实现的。
select 被实现以后,很快就暴露出了很多问题。
- select 会修改传入的参数数组,这个对于一个需要调用很多次的函数,是非常不友好的。
- select 如果任何一个sock(I/O stream)出现了数据,select 仅仅会返回,但是并不会告诉你是那个sock上有数据,于是你只能自己一个一个的找,10几个sock可能还好,要是几万的sock每次都找一遍,效率可想而知。
- select 只能监视1024个链接,参见FD_SETSIZE。
因此,select现在很少有人在使用,更多的被poll和epoll取代。
推荐文章:I/O多路复用之poll