您现在的位置是:首页 >技术教程 >Linux Socket 分包 和 粘包 问题 - 解决方案网站首页技术教程
Linux Socket 分包 和 粘包 问题 - 解决方案
分包和粘包在TCP网络编程中是非常常见的,分包会造成 接收端 接收的数据不全的问题,粘包会造成接收多余的数据的文件。
这里做一个举例,例如客户端A要发送字符串“helloworld”给服务器B,A是一次性发送,但TCP有可能会将其分成两个包去发送,如分成“hello”和“world”,当服务器不知道数据已经被分成两个包去发送了,它只是接收也一个包,即只接收了“hello”,造成数据接收不全的问题!
或者说,当发送的数据过小时,却连续发送多次时,TCP会将他们同时打包,一起发送,接收时如果也是一次性接收,那么就会接收了多余的数据了!
目录
一、TCP分包
场景:发送方发送字符串”helloworld”,接收方却分别接收到了两个数据包:字符串”hello”和”world”;
发送端发送了数量较多的数据,接收端读取数据时候数据分批到达,造成一次发送多次读取;
造成分包的原因:
TCP是以段(Segment)为单位发送数据的,建立TCP链接后,有一个最大消息长度(MSS).如果应用层数据包超过MSS,就会把应用层数据包拆分,分成两个段来发送.
这个时候接收端的应用层就要拼接这两个TCP包,才能正确处理数据。
相关的,路由器有一个MTU( 最大传输单元)一般是1500字节,除去IP头部20字节,留给TCP的就只有MTU-20字节。所以一般TCP的MSS为MTU-20=1460字节;
当应用层数据超过1460字节时,TCP会分多个数据包来发送。
二、TCP粘包
场景:发送方发送字符串”helloworld”,接收方却接收到了两个字符串”hello”和”world”;
发送端发送了几次数据,接收端一次性读取了所有数据,造成多次发送一次读取;通常是网络流量优化,把多个小的数据段集满达到一定的数据量,从而减少网络链路中的传输次数;
造成TCP粘包的原因:
TCP为了提高网络的利用率,会使用一个叫做Nagle的算法.该算法是指,发送端即使有要发送的数据,如果很少的话,会延迟发送.如果应用层给TCP传送数据很快的话,就会把两个应用层数据包“粘”在一起,TCP最后只发一个TCP数据包给接收端.
三、分包和粘包的解决方案
发送数据前,给数据附加固定的头部长度:
1. 包标识: 包头部的特殊标识,用来标识包的开始;
2. 数据长度:数据包的大小,固定长度,2、4 或者8字节;
3. 数据内容:数据内容,长度为数据头定义的长度大小;
假设包标识是FBEB,即,如果发送的数据是helloworld,则组合发送的数据为:FBEB10helloworld
实际操作如下:
a)发送端:先发送包表示和长度,再发送数据内容。
b)接收端:先解析本次数据包的大小N,再读取N个字节,这N个字节就是一个完整的数据内容。
具体流程如下:
按照这种思路,就可以解决分包和粘包的问题了!
1. 组合数据关键代码
#define DATA_LEN_BYTES 4
const char *TAG = "FBEB";
char *message = "helloworld";
int ms_len = strlen(message);
int tag_len = strlen(TAG);
// 组装数据包
char *buf = (char*)malloc(ms_len + tag_len + DATA_LEN_BYTES);
memset(buf, '