我在Linux下的服务器套接字上遇到了问题。由于我不知道的某些原因,服务器套接字消失了,并且在等待传入连接的select调用中出现“坏文件描述符”错误。当我在不同的线程中关闭一个无关的套接字连接时,这个问题总是发生。这在具有2.6.36内核的嵌入式Linux上发生。
有人知道为什么会发生这种情况吗?一个服务器套接字突然消失导致“坏文件描述符”是正常的吗?
编辑:其他套接字代码实现了VNC服务器并在完全不同的线程中运行。那个代码中唯一特殊的是使用setjmp / longjmp,但那应该不是问题。
创建服务器套接字的代码如下:
有人知道为什么会发生这种情况吗?一个服务器套接字突然消失导致“坏文件描述符”是正常的吗?
编辑:其他套接字代码实现了VNC服务器并在完全不同的线程中运行。那个代码中唯一特殊的是使用setjmp / longjmp,但那应该不是问题。
创建服务器套接字的代码如下:
int server_socket = socket(PF_INET, SOCK_STREAM, IPPROTO_TCP);
struct sockaddr_in saddr;
memset(&saddr, 0, sizeof(saddr));
saddr.sin_family = AF_INET;
saddr.sin_addr.s_addr = htonl(INADDR_ANY);
saddr.sin_port = htons(1234);
const int optionval = 1;
setsockopt(server_socket, SOL_SOCKET, SO_REUSEADDR, &optionval, sizeof(optionval));
if (bind(server_socket, (struct sockaddr *) &saddr, sizeof(saddr)) < 0) {
perror("bind");
return 0;
}
if (listen(server_socket, 1) < 0) {
perror("listen");
return 0;
}
我使用下面的代码等待传入连接:
static int WaitForConnection(int server_socket, struct timeval *timeout)
{
fd_set read_fds;
FD_ZERO(&read_fds);
int max_sd = server_socket;
FD_SET(server_socket, &read_fds);
// This select will result in 'EBADFD' in the error case.
// Even though the server socket was not closed with 'close'.
int res = select(max_sd + 1, &read_fds, NULL, NULL, timeout);
if (res > 0) {
struct sockaddr_in caddr;
socklen_t clen = sizeof(caddr);
return accept(server_socket, (struct sockaddr *) &caddr, &clen);
}
return -1;
}
编辑: 当问题出现时,我目前只是重新启动服务器,但我不明白为什么服务器套接字ID会突然变成无效的文件描述符:
int error = 0;
socklen_t len = sizeof (error);
int retval = getsockopt (server_socket, SOL_SOCKET, SO_ERROR, &error, &len );
if (retval < 0) {
close(server_socket);
goto server_start;
}
select
操作中试图关闭同一个 socket。 - David Schwartzstrace -f -e accept,socket,close,shutdown ./yourserver
并查看是否曾经使用与侦听套接字相同的文件描述符值调用close(),或者是否突然开始传递不同的文件描述符给accept()。 - nos