首先socket在默认情况下是阻塞状态的,这就使得发送以及接收操作处于阻塞的状态,即调用不会立即返回,而是进入睡眠等待操作完成。下面把讨论点分为发送以及接收。
一.发送选用send(这里特指TCP)以及sendto(这里特指UDP)来描述
首先需要说明的是,不管阻塞还是非阻塞,在发送时都会将数据从应用缓冲区拷贝到内核缓冲区(SO_RCVBUF选项声明,除非缓冲区大小为0)。我在网络上看到某些人说,阻塞就是将数据真正发送给对方,并且阻塞是发生在需要把前面的所有数据全部发送出去,然后再发送本次的,而非阻塞则是拷贝到发送缓冲区。我不得不说,上面的这种说法是错误的。
在阻塞模式下send操作将会等待所有数据均被拷贝到发送缓冲区后才会返回。
例如:如果当前发送缓冲总大小为8192,已经拷贝到缓冲的数据为8000,那剩余的大小为192,现在需要发送2000字节数据,那阻塞发送就会等待缓冲区足够把所有2000字节数据拷贝进去,如第一次拷贝进192字节,当缓冲区成功发送出1808字节后,再把应用缓冲区剩余的1808字节拷贝到内核缓冲,而后send操作返回成功发送字节数。
从上面的过程不难看出,阻塞的send操作返回的发送大小,必然是你参数中的发送长度的大小。
man 一下 send,发现man里有描述容易误导,send) shall fail.应该是需要自己判断的,会返回实际发送成功的字节,想全部成功发送,需要自己实现一遍阻塞循环发送的逻辑,当多端口*大包发送的时候,可以非阻塞拆包发送(循环每个端口send一次小包,避免单个端口阻塞很久),效果会比阻塞的好很多。
关于拆分大包的一些实施方法,(一般是图片和视频),有人在应用层分片,针对50K的默认发送缓冲区和4k以上的滑动窗口来做文章,动态调整每次send的size在4K到50k间浮动,来减少发包的分片,通过减少分片重组的次数来优化网络服务的总延时。至于MSS一般是1460字节,为何选4k,而不是1.4k起,是因为这会造成多次RTT消耗以及用户态和内核态切换,得不偿失。
在阻塞模式下的sendto操作不会阻塞。
关于这一点的原因在于:UDP并没有真正的发送缓冲区,它所做的只是将应用缓冲区拷贝给下层协议栈,在此过程中加上UDP头,IP头,所以实际不存在阻塞。
在非阻塞模式下send操作调用会立即返回。
例如:当缓冲区只有192字节,但是却需要发送2000字节时,此时调用立即返回,并得到返回值为192。从中可以看到,非阻塞send仅仅是尽自己的能力向缓冲区拷贝尽可能多的数据,因此在非阻塞下send才有可能返回比你参数中的发送长度小的值。
如果缓冲区没有任何空间时呢?这时肯定也是立即返回,但是你会得到WSAEWOULDBLOCK/E WOULDBLOCK 的错误,此时表示你无法拷贝任何数据到缓冲区,你最好休息一下再尝试发送。
在非阻塞模式下sendto操作 不会阻塞(与阻塞一致,不作说明)。
二.接收选用recv(这里特指TCP)以及recvfrom(这里特指UDP)来描述
在阻塞模式下recv,recvfrom操作将会阻塞 到缓冲区里有至少一个字节(TCP)或者一个完整UDP数据报才返回。
在没有数据到来时,对它们的调用都将处于睡眠状态,不会返回。
在非阻塞模式下recv,recvfrom操作将会立即返回。
如果缓冲区 有任何一个字节数据(TCP)或者一个完整UDP数据报,它们将会返回接收到的数据大小。而如果没有任何数据则返回错误 WSAEWOULDBLOCK/E WOULDBLOCK。