我有一个客户端连接到一个服务器,在空闲时,它会在几个小时后超时。 我添加了 setsockopt(socket, SOL_SOCKET, SO_KEEPALIVE...) 每秒设置一次 但这似乎没有任何作用。 为什么keepalive不起作用?有什么线索吗? 如果我使用SOL_TCP而不是SOL_SOCKET,是否会有所不同? 这是在Linux上进行的。
我有一个客户端连接到一个服务器,在空闲时,它会在几个小时后超时。 我添加了 setsockopt(socket, SOL_SOCKET, SO_KEEPALIVE...) 每秒设置一次 但这似乎没有任何作用。 为什么keepalive不起作用?有什么线索吗? 如果我使用SOL_TCP而不是SOL_SOCKET,是否会有所不同? 这是在Linux上进行的。
int val = 1;
setsockopt(socket, SOL_SOCKET, SO_KEEPALIVE, &val, sizeof val)
只需启用Keepalives。您将获得保持活动探测的默认计时器,您可以使用以下命令查看:
sysctl net.ipv4.tcp_keepalive_time
通常,默认时间是几个小时。
如果您想更改默认计时器,可以使用以下内容:
struct KeepConfig cfg = { 60, 5, 5};
set_tcp_keepalive_cfg(fd, &cfg);
使用这里的辅助函数:
struct KeepConfig {
/** The time (in seconds) the connection needs to remain
* idle before TCP starts sending keepalive probes (TCP_KEEPIDLE socket option)
*/
int keepidle;
/** The maximum number of keepalive probes TCP should
* send before dropping the connection. (TCP_KEEPCNT socket option)
*/
int keepcnt;
/** The time (in seconds) between individual keepalive probes.
* (TCP_KEEPINTVL socket option)
*/
int keepintvl;
};
/**
* enable TCP keepalive on the socket
* @param fd file descriptor
* @return 0 on success -1 on failure
*/
int set_tcp_keepalive(int sockfd)
{
int optval = 1;
return setsockopt(sockfd, SOL_SOCKET, SO_KEEPALIVE, &optval, sizeof(optval));
}
/** Set the keepalive options on the socket
* This also enables TCP keepalive on the socket
*
* @param fd file descriptor
* @param fd file descriptor
* @return 0 on success -1 on failure
*/
int set_tcp_keepalive_cfg(int sockfd, const struct KeepConfig *cfg)
{
int rc;
//first turn on keepalive
rc = set_tcp_keepalive(sockfd);
if (rc != 0) {
return rc;
}
//set the keepalive options
rc = setsockopt(sockfd, IPPROTO_TCP, TCP_KEEPCNT, &cfg->keepcnt, sizeof cfg->keepcnt);
if (rc != 0) {
return rc;
}
rc = setsockopt(sockfd, IPPROTO_TCP, TCP_KEEPIDLE, &cfg->keepidle, sizeof cfg->keepidle);
if (rc != 0) {
return rc;
}
rc = setsockopt(sockfd, IPPROTO_TCP, TCP_KEEPINTVL, &cfg->keepintvl, sizeof cfg->keepintvl);
if (rc != 0) {
return rc;
}
return 0;
}
尽管它的名称是keep-alive,但它并不是用于保持连接的活跃性,而是用于定期交换数据包,以确保对等方之间存在网络路径。它会终止那些在空闲时可以幸存于长时间网络中断的连接。
由于这种行为,除非有充分的理由(如telnet或SSH连接,在客户端无法访问时结束会话),否则不应使用keep-alive。
很可能是服务器根据某些连接处理策略,在n小时后关闭连接,无论keepalive是否使用。
更新:Dror Harari的评论增加了这种情况的另一个问题:NAT中间路由器。完全空闲的连接将被它们关闭,而主机却认为它们仍然具有连接,实际上已经没有了。使用一些形式的keepalive(无论是在TCP还是应用程序协议级别)是一种有效的解决方法。