下图以Web浏览器为例,客户与服务器之间的信息流在其中一端是向下通过协议栈的,跨越网络后,在另一端是向上通过协议栈的.另外,客户与服务器通常是用户进程,而TCP和IP协议通常是内核协议栈的一部分.
对于一次IO访问(以read举例),数据会先被拷贝到操作系统内核的缓冲区中,然后才会从操作系统内核的缓冲区拷贝到应用程序的地址空间。所以说,当一个read操作发生时,它会经历两个阶段:
- 等待数据准备
- 将数据从内核拷贝到进程中
正式因为这两个阶段,linux系统产生了下面五种网络模式的方案。
- 阻塞 I/O
- 非阻塞 I/O
- I/O 多路复用
- 异步 I/O
- 信号驱动 I/O
1. 阻塞 I/O
kernel就开始准备数据这个过程需要等待,也就是说数据被拷贝到操作系统内核的缓冲区中是需要一个过程的。而在用户进程这边,整个进程会被阻塞.
2. 非阻塞 I/O(nonblocking IO)
当用户进程发出read操作时,如果kernel中的数据还没有准备好,那么它并不会block用户进程,而是立刻返回一个error。从用户进程角度讲 ,它发起一个read操作后,并不需要等待,而是马上就得到了一个结果。用户进程判断结果是一个error时,它就知道数据还没有准备好,于是它可以再次发送read操作。一旦kernel中的数据准备好了,并且又再次收到了用户进程的system call,那么它马上就将数据拷贝到了用户内存,然后返回。
当一个应用进程像这样对一个非阻塞描述符循环调用recvfrom时,我们称之为轮询.应用进程持续轮询内核,以查看某个操作是否就绪.这么做往往耗费大量CPU时间,不过这种模型偶尔也会遇到,通常是在专门提供某一种功能的系统中才有.
3. I/O 多路复用( IO multiplexing)
select,poll,epoll 好处就在于单个process就可以同时处理多个网络连接.
允许进程指示内核等待多个事件中的任何一个发生,并只有在一个或多个事件发生或经历一段指定时间后才能唤醒.
描述符不局限于套接字,任何描述符都可以使用select来测试.
4. 信号驱动 I/O( signal driven IO)
用户进程开启套接字的信号驱动式I/O功能,并通过sigaction系统调用安装一个幸好处理函数.该系统调用将立即返回,我们的进程继续工作,也就是说它没有被阻塞.当数据报准备好时,内核就为该进程产生一个SIGIO信号.
这种模板的优势在于等待数据报到达期间进程不被阻塞.主循环可以继续执行,只要等待来自信号处理函数的通知;既可以是数据准备好被处理,也可以是数据报准备好被读取.
5. 异步 I/O(asynchronous IO)
用户进程发起read操作之后,立刻就可以开始去做其它的事。而另一方面,从kernel的角度,当它受到一个asynchronous read之后,首先它会立刻返回,所以不会对用户进程产生任何block。然后,kernel会等待数据准备完成,然后将数据拷贝到用户内存,当这一切都完成之后,kernel会给用户进程发送一个signal,告诉它read操作完成了。
能看出前四种模型的主要区别在于第一阶段,因为他们的第二阶段是一样的:在数据从内核复制到调用者的缓冲区期间,进程阻塞于recvfrom调用.相反,异步I/O模型在这两个阶段都要处理,从而不同于其他四种模型.
同步I/O和异步I/O对比
- 同步I/O操作: 导致请求进程阻塞,直到I/O操作完成
- 异步I/O操作:不导致请求进程阻塞