什么可能导致sock send()命令出现“资源暂时不可用”的错误?

105

在套接字的send()命令中,什么会导致资源暂时不可用错误?该套接字设置为AF_UNIX,SOCK_STREAM。它大部分时间都工作正常,但偶尔会出现此错误。套接字的接收端似乎工作正常。

我知道这不是非常详细,但我只是想了解一般的想法。谢谢!


这和这个有关吗?https://dev59.com/KFbTa4cB1Zd3GeqP-m0n - paddy
4
你是否将套接字设置为 O_NONBLOCK 非阻塞模式? - Deepankar Bajpeyi
我不认为它与那篇文章有关。 我的套接字是SOCK_STREAM,我相信它们是阻塞的,这正是我想要的。 - giroy
3
一个流是阻塞的还是非阻塞的与它是SOCK_STREAM还是SOCK_DGRAM无关。那里给出的答案是相关的。 - Barmar
4个回答

116
"Resource temporarily unavailable"是与EAGAIN相应的错误消息,它意味着操作将会被阻塞,但请求的是非阻塞操作。对于send(),这可能是由以下任何一种情况引起的:
  • 使用 fcntl() 明确地将文件描述符标记为非阻塞的;或者
  • MSG_DONTWAIT 标志传递给 send();或者
  • 使用 SO_SNDTIMEO socket 选项设置发送超时。

1
我的问题原因是设置了发送超时。谢谢你的帮助! - giroy
@caf,在我的情况下,两端不同的MTU大小配置导致在高速数据包交换时sctp关联Txqueue溢出。使两个系统的MTU相同可以解决问题。 但是有人能否解释一下问题背后的原因? - Codename_DJ
1
为什么设置SO_SNDTIMEO会导致错误发生?如何正确使用该标志? - Gabriel Fernandez
2
@GabrielFernandez:因为这就是SO_SNDTIMEO的要求:发送操作不能阻塞超过超时时间。如果发送操作没有完成且超时时间到期,则返回EAGAIN以指示此情况。如何处理取决于您的应用程序,需要注意的是您尝试发送的数据尚未被发送。 - caf

59

这是因为您正在使用一个非阻塞套接字,而输出缓冲区已满。

来自send()手册页。

   When the message does not fit into  the  send  buffer  of  the  socket,
   send() normally blocks, unless the socket has been placed in non-block-
   ing I/O mode.  In non-blocking mode it  would  return  EAGAIN  in  this
   case.  

EAGAIN是与"Resource temporarily unavailable"相关联的错误代码。

考虑使用select()来更好地控制这种行为。


@giroy:但实际上并不正确...实际上是一个阻塞套接字,带有SO_SNDTIMEO - EML
酷,但我们如何使用其他连接来管理数据库中的同时读取? - MUY Belgium

18

让我举个例子:

  1. 客户端连接到服务器,并每秒向服务器发送1MB的数据。

  2. 服务器端接受连接,然后休眠20秒钟,没有从客户端接收消息。因此,客户端侧的 tcp send buffer 将会被填满。

客户端代码:

#include <arpa/inet.h>
#include <sys/socket.h>
#include <stdio.h>
#include <errno.h>
#include <fcntl.h>
#include <stdlib.h>
#include <string.h>
#define exit_if(r, ...)                                                                          \
    if (r) {                                                                                     \
        printf(__VA_ARGS__);                                                                     \
        printf("%s:%d error no: %d error msg %s\n", __FILE__, __LINE__, errno, strerror(errno)); \
        exit(1);                                                                                 \
    }

void setNonBlock(int fd) {
    int flags = fcntl(fd, F_GETFL, 0);
    exit_if(flags < 0, "fcntl failed");
    int r = fcntl(fd, F_SETFL, flags | O_NONBLOCK);
    exit_if(r < 0, "fcntl failed");
}

void test_full_sock_buf_1(){
    short port = 8000;
    struct sockaddr_in addr;
    memset(&addr, 0, sizeof addr);
    addr.sin_family = AF_INET;
    addr.sin_port = htons(port);
    addr.sin_addr.s_addr = INADDR_ANY;


    int fd = socket(AF_INET, SOCK_STREAM, 0);
    exit_if(fd<0, "create socket error");

    int ret = connect(fd, (struct sockaddr *) &addr, sizeof(struct sockaddr));
    exit_if(ret<0, "connect to server error");
    setNonBlock(fd);

    printf("connect to server success");

    const int LEN = 1024 * 1000;
    char msg[LEN];  // 1MB data
    memset(msg, 'a', LEN);

    for (int i = 0; i < 1000; ++i) {
        int len = send(fd, msg, LEN, 0);
        printf("send: %d, erron: %d, %s \n", len, errno, strerror(errno));
        sleep(1);
    }

}

int main(){
    test_full_sock_buf_1();

    return 0;
}

服务器端的代码:

    #include <arpa/inet.h>
    #include <sys/socket.h>
    #include <stdio.h>
    #include <errno.h>
    #include <fcntl.h>
    #include <stdlib.h>
    #include <string.h>
    #define exit_if(r, ...)                                                                          \
        if (r) {                                                                                     \
            printf(__VA_ARGS__);                                                                     \
            printf("%s:%d error no: %d error msg %s\n", __FILE__, __LINE__, errno, strerror(errno)); \
            exit(1);                                                                                 \
        }
void test_full_sock_buf_1(){

    int listenfd = socket(AF_INET, SOCK_STREAM, 0);
    exit_if(listenfd<0, "create socket error");

    short port = 8000;
    struct sockaddr_in addr;
    memset(&addr, 0, sizeof addr);
    addr.sin_family = AF_INET;
    addr.sin_port = htons(port);
    addr.sin_addr.s_addr = INADDR_ANY;

    int r = ::bind(listenfd, (struct sockaddr *) &addr, sizeof(struct sockaddr));
    exit_if(r<0, "bind socket error");

    r = listen(listenfd, 100);
    exit_if(r<0, "listen socket error");

    struct sockaddr_in raddr;
    socklen_t rsz = sizeof(raddr);
    int cfd = accept(listenfd, (struct sockaddr *) &raddr, &rsz);
    exit_if(cfd<0, "accept socket error");

    sockaddr_in peer;
    socklen_t alen = sizeof(peer);
    getpeername(cfd, (sockaddr *) &peer, &alen);

    printf("accept a connection from %s:%d\n", inet_ntoa(peer.sin_addr), ntohs(peer.sin_port));

    printf("but now I will sleep 15 second, then exit");
    sleep(15);
}

先启动服务器端,然后启动客户端。

服务器端可能会输出:

accept a connection from 127.0.0.1:35764
but now I will sleep 15 second, then exit
Process finished with exit code 0

enter image description here

客户端可能输出:

connect to server successsend: 1024000, erron: 0, Success 
send: 1024000, erron: 0, Success 
send: 1024000, erron: 0, Success 
send: 552190, erron: 0, Success 
send: -1, erron: 11, Resource temporarily unavailable 
send: -1, erron: 11, Resource temporarily unavailable 
send: -1, erron: 11, Resource temporarily unavailable 
send: -1, erron: 11, Resource temporarily unavailable 
send: -1, erron: 11, Resource temporarily unavailable 
send: -1, erron: 11, Resource temporarily unavailable 
send: -1, erron: 11, Resource temporarily unavailable 
send: -1, erron: 11, Resource temporarily unavailable 
send: -1, erron: 11, Resource temporarily unavailable 
send: -1, erron: 11, Resource temporarily unavailable 
send: -1, erron: 11, Resource temporarily unavailable 
send: -1, erron: 104, Connection reset by peer 
send: -1, erron: 32, Broken pipe 
send: -1, erron: 32, Broken pipe 
send: -1, erron: 32, Broken pipe 
send: -1, erron: 32, Broken pipe 
send: -1, erron: 32, Broken pipe 

在此输入图片描述

由于服务器端未从客户端接收数据,因此当客户端tcp缓冲区已满,但您仍然发送数据时,可能会出现资源暂时不可用的错误。


0

还有另一种情况可能会导致错误11 资源暂时不可用

默认情况下,如果应用层协议是http,在第一次成功接收http响应后,tcp连接不会关闭,再次调用recv将被阻塞,并且当SO_RCVTIMEO过期时,从recv返回-1,errno将被设置为11


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接