标签:
杂谈 |
分类: CPP/C |
tcp中close_wait状态出现的原因
http://blog.csdn.net/lllxy/article/details/1779866
CLOSE_WAIT
我的问题是:
(1) 对于C/S的双方,是不是其中一方的socket句柄处于"主动关闭连接或者网络异常导致连接中断",那么另一方就自动变成CLOSE_WAIT状态? 这个是TCP/IP协议栈自动完成的?
(2) 变成"CLOSE_WAIT"的一方,VC程序的Wait函数是否一定能检测到"现在应该关闭连接"这种状态? 如果我创建的是异步的socket(overlapped绑定了一个event句柄),会不会可能检测不到?
我现在看的一个系统,用的就是异步socket,用wait函数来侦测所有的io和close事件.
但是现在发生了问题,一方断开了连接,一方过了几个小时以后才检测到close状态事件。这可能会是什么原因呢?
---------------------------------------------
我的Wait函数响应之后调用我自己写的这么一个函数。
。。。。。
- C/C++ code
-
{ WSANETWORKEVENTS evts; ZeroMemory( &evts, sizeof(evts) ); // // grab the network events that have happenned // WSAEnumNetworkEvents( m_hSocket, m_evtAsync, &evts ); if( evts.iErrorCode[ FD_CLOSE_BIT ] != 0 || evts.iErrorCode[ FD_READ_BIT ] != 0 || evts.iErrorCode[ FD_WRITE_BIT ] != 0 || evts.lNetworkEvents & FD_CLOSE ) { Close(); m_pSink->OnIpcIOClose(); return false; // no more events please } // // 先处理read再处理write(可能同时有),所以下面的代码不是else // if( evts.lNetworkEvents & FD_READ ) { .... } if( evts.lNetworkEvents & FD_WRITE ) { .... } return true; // we want more events }
模拟这样一个环境:服务器192.168.1.112:4500在接收到一个客户端的连接后,休眠五秒后,服务器关闭与客户 端通讯的socket后正常退出,而客户端在连接服务器后,等待用户输入字符后,发送给客户端。现在有这样几个问题:
1.
2.
3.
4.
int nRet = recv(sockConnected, szRecvBuffer,sizeof(szRecvBuffer),0);
///
/// 当对方调用closesocket的时候,我的程序正在recv,
/// 这时候有可能对方发送的FIN包我没有收到,而是由TCP代回了一个ACK包,
/// 所以我这边程序进入CLOSE_WAIT状态。
/// 所以建议在这里判断是否已出错,是就主动closesocket。
/// 因为前面已经设置了recv超时时间为30秒,那么如果真的是超时了,
/// 这里收到的错误应该是WSAETIMEDOUT,这种情况下也可以关闭连接的
if (nRet == SOCKET_ERROR)
{
}
///
允许重用本地地址和端口:
///
这样的好处是,即使socket断了,调用前面的socket函数也不会占用另一个,而是始终就是一个端口
///
这样防止socket始终连接不上,那么按照原来的做法,会不断地换端口。
int
nREUSEADDR = 1;
setsockopt(sockConnected,
|
linger m_sLinger;
m_sLinger.l_onoff = 1;
// (在closesocket()调用,但是还有数据没发送完毕的时候容许逗留)
m_sLinger.l_linger = 0;
// (容许逗留的时间为0秒)
setsockopt(sockConnected,
|
Feedback
# 回复:[Socket]尴尬的CLOSE_WAIT状态以及应对策略 2005-01-30 3:41 PM
yun.zheng
回复人: elssann(臭屁虫和他的开心果) ( ) 信誉:51 2005-01-30 14:00:00 得分: 0
我的意思是:当一方关闭连接后,另外一方没有检测到,就导致了CLOSE_WAIT的出现,上次我的一个朋友也是这样,他写了一个客户端和
APACHE连接,当APACHE把连接断掉后,他没检测到,出现了CLOSE_WAIT,后来我叫他检测了这个地方,他添加了调用
closesocket的代码后,这个问题就消除了。
如果你在关闭连接前还是出现CLOSE_WAIT,建议你取消shutdown的调用,直接两边closesocket试试。
另外一个问题:
比如这样的一个例子:
当客户端登录上服务器后,发送身份验证的请求,服务器收到了数据,对客户端身份进行验证,发现密码错误,这时候服务器的一般做法应该是先发送一个密码错误的信息给客户端,然后把连接断掉。
如果把
m_sLinger.l_onoff = 1;
m_sLinger.l_linger = 0;
这样设置后,很多情况下,客户端根本就收不到密码错误的消息,连接就被断了。
# 回复:[Socket]尴尬的CLOSE_WAIT状态以及应对策略 2005-01-30 3:41 PM
yun.zheng
elssann(臭屁虫和他的开心果) ( ) 信誉:51 2005-01-30 13:24:00 得分: 0
出现CLOSE_WAIT的原因很简单,就是某一方在网络连接断开后,没有检测到这个错误,没有执行closesocket,导致了这个状态的实现,这在TCP/IP协议的状态变迁图上可以清楚看到。同时和这个相对应的还有一种叫TIME_WAIT的。
另外,把SOCKET的SO_LINGER设置为0秒拖延(也就是立即关闭)在很多时候是有害处的。
还有,把端口设置为可复用是一种不安全的网络编程方法。
# 回复:[Socket]尴尬的CLOSE_WAIT状态以及应对策略 2005-01-30 3:42 PM
yun.zheng
elssann(臭屁虫和他的开心果) ( ) 信誉:51 2005-01-30 14:48:00 得分: 0
能不能解释请看这里
http://blog.csdn.net/cqq/archive/2005/01/26/269160.aspx
再看这个图:
http://tech.ccidnet.com/pub/attachment/2004/8/322252.png
断开连接的时候,
当发起主动关闭的左边这方发送一个FIN过去后,右边被动关闭的这方要回应一个ACK,这个ACK是TCP回应的,而不
是应用程序发送的,此时,被动关闭的一方就处于CLOSE_WAIT状态了。如果此时被动关闭的这一方不再继续调用closesocket,那么他就不会
发送接下来的FIN,导致自己老是处于CLOSE_WAIT。只有被动关闭的这一方调用了closesocket,才会发送一个FIN给主动关闭的这一
方,同时也使得自己的状态变迁为LAST_ACK。
# 回复:[Socket]尴尬的CLOSE_WAIT状态以及应对策略 2005-01-30 3:54 PM
yun.zheng
elssann(臭屁虫和他的开心果) ( ) 信誉:51 2005-01-30 15:39:00 得分: 0
比如被动关闭的是客户端。。。
当对方调用closesocket的时候,你的程序正在
int nRet = recv(s,....);
if (nRet == SOCKET_ERROR)
{
// closesocket(s);
return FALSE;
}
很多人就是忘记了那句closesocket,这种代码太常见了。
我的理解,当主动关闭的一方发送FIN到被动关闭这边后,被动关闭这边的TCP马上回应一个ACK过去,同时向上面应用程序提交一个ERROR,导 致上面的SOCKET的send或者recv返回SOCKET_ERROR,正常情况下,如果上面在返回SOCKET_ERROR后调用了 closesocket,那么被动关闭的者一方的TCP就会发送一个FIN过去,自己的状态就变迁到LAST_ACK.
# 回复:[Socket]尴尬的CLOSE_WAIT状态以及应对策略 2005-01-30 4:17 PM
yun.zheng
int nRecvBufLength =
recv(sockConnected,
szRecvBuffer,
sizeof(szRecvBuffer),
0);
/// zhengyun 20050130:
/// elssann举例说,当对方调用closesocket的时候,我的程序正在
/// recv,这时候有可能对方发送的FIN包我没有收到,而是由TCP代回了
/// 一个ACK包,所以我这边程序进入CLOSE_WAIT状态。
/// 所以他建议在这里判断是否已出错,是就主动closesocket。
/// 因为前面我们已经设置了recv超时时间为30秒,那么如果真的是超时了,
/// 这里收到的错误应该是WSAETIMEDOUT,这种情况下也可以关闭连接的
if (nRecvBufLength == SOCKET_ERROR)
{
TRACE_INFO(_T("=用recv接收发生Socket错误="));
closesocket(sockConnected);
continue;
}
网络连接无法释放—— CLOSE_WAIT
关键字:TCP ,CLOSE_WAIT, Java, SocketChannel
问题描述:最 近性能测试碰到的一个问题。客户端使用NIO,服务器还是一般的Socket连接。当测试进行一段时间以后,发现服务器端的系统出现大量未释放的网络连 接。用netstat -na查看,连接状态为CLOSE_WAIT。这就奇怪了,为什么Socket已经关闭而连接依然未释放。
解决:Google了半天,发现关于CLOSE_WAIT的问题一般是C的,Java似乎碰到这个问题的不多(这有一篇不错的,也是解决CLOSE_WAIT的,但是好像没有根本解决,而是选择了一个折中的办法)。接着找,由于使用了NIO,所以怀疑可能是这方面的问题,结果找到了这篇。顺着帖子翻下去,其中有几个人说到了一个问题—— 一端的Socket调用close后,另一端的Socket没有调用close.于是查了一下代码,果然发现Server端在某些异常情况时,没有关闭Socket。改正后问题解决。
时间基本上花在Google上了,不过也学到不少东西。下面为一张TCP连接的状态转换图:
说明:虚线和实线分别对应服务器端(被连接端)和客户端端(主动连接端)。
结合上图使用netstat -na命令即可知道到当前的TCP连接状态。一般LISTEN、ESTABLISHED、TIME_WAIT是比较常见。
分析:
上面我碰到的这个问题主要因为TCP的结束流程未走完,造成连接未释放。现设客户端主动断开连接,流程如下