在C语言中读取一个变长字符串用户输入

6

我正在尝试读取变量长度的用户输入,并执行一些操作(比如在字符串中搜索子字符串)。

问题是我不知道我的字符串有多大(文本可能会有3000-4000个字符)。

我附上了我尝试过的样例代码和输出:

char t[],p[];
int main(int argc, char** argv) {
    fflush(stdin);
    printf(" enter a string\n");
    scanf("%s",t);

    printf(" enter a pattern\n");
    scanf("%s",p);

    int m=strlen(t);
    int n =strlen(p);
    printf(" text is %s %d  pattrn is %s %d \n",t,m,p,n);
    return (EXIT_SUCCESS);
}

并且输出结果为:
enter a string
bhavya
enter a pattern
av
text is bav 3  pattrn is av 2

8
请注意,在C语言中,在stdin(或任何输入流)上使用fflush是未定义的行为。因此,它可能会导致您的计算机停止运行并着火。来自ISO 9899:1999 7.19.5.2的信息。 - Lundin
4个回答

11
请不要使用像scanf("%s")或我个人不喜欢的gets()这样的不安全方法 - 对于这些方法,无法防止缓冲区溢出。
您可以使用更安全的输入方法,例如:
#include <stdio.h>
#include <string.h>

#define OK       0
#define NO_INPUT 1
#define TOO_LONG 2
static int getLine (char *prmpt, char *buff, size_t sz) {
    int ch, extra;

    // Get line with buffer overrun protection.
    if (prmpt != NULL) {
        printf ("%s", prmpt);
        fflush (stdout);
    }
    if (fgets (buff, sz, stdin) == NULL)
        return NO_INPUT;

    // If it was too long, there'll be no newline. In that case, we flush
    // to end of line so that excess doesn't affect the next call.
    if (buff[strlen(buff)-1] != '\n') {
        extra = 0;
        while (((ch = getchar()) != '\n') && (ch != EOF))
            extra = 1;
        return (extra == 1) ? TOO_LONG : OK;
    }

    // Otherwise remove newline and give string back to caller.
    buff[strlen(buff)-1] = '\0';
    return OK;
}

你可以设置最大大小,如果输入的数据超过此大小,它将检测到并清空该行剩余的数据,以确保不会影响下一次输入操作。

你可以使用以下命令进行测试:

// Test program for getLine().

int main (void) {
    int rc;
    char buff[10];

    rc = getLine ("Enter string> ", buff, sizeof(buff));
    if (rc == NO_INPUT) {
        // Extra NL since my system doesn't output that on EOF.
        printf ("\nNo input\n");
        return 1;
    }

    if (rc == TOO_LONG) {
        printf ("Input too long [%s]\n", buff);
        return 1;
    }

    printf ("OK [%s]\n", buff);

    return 0;
}

fgets 返回一个没有字符的缓冲区的情况是有可能发生的。如果这种情况发生,getLine 函数中的代码将尝试访问 buffer[-1],这是未定义的行为。 - pmg
@pmg,如果您像传递一个缓冲区大小指示您不想要任何字符这样的愚蠢操作,那么可能会发生这种情况,但我甚至都不确定。在正常情况下,您要么始终有数据,要么将返回NULL(以便您不检查缓冲区)。该函数已经通过了我能想到的所有情况的测试(空行、文件结尾、大于所需行、短行、精确大小等),并且没有问题。如果您发现它无法处理的边缘情况,请告诉我,我会修复它,特别是因为它在我编写的生产代码中使用得非常频繁 :-) - paxdiablo
你可以通过将 strlen(buff) 存储在本地变量中并在尝试访问最后一个字符之前检查它是否为零来轻松避免风险并使函数更快。这样,您也不需要两次调用 strlen() - Ilmari Karonen
@pax非常感谢您提供的代码,但我想知道的是,如果有时我想读取超过5000个字符,我是否仍然可以使用类似的方法? - bhavs
1
@Bhavya,是的,你只需要创建一个足够大的buff(如果它非常大,可能需要将其移出堆栈到全局变量或堆上分配)。 - paxdiablo

2

实际上,您无需过于精确。给自己一些余地来在堆栈上存储一些内存并对其进行操作。一旦您想将数据传递到更远的地方,可以使用 strdup(buffer) 并将其放在堆上。了解自己的限制。 :-)

int main(int argc, char** argv) {
    char text[4096]; 
    char pattern[4096]; 
    fflush(stdin);
    printf(" enter a string\n");
    fgets(text, sizeof(text), stdin);

    printf(" enter a pattern\n");
    fgets(pattern, sizeof(pattern), stdin);

    int m=strlen(text);
    int n =strlen(pattern);
    printf(" text is %s %d  pattrn is %s %d \n",text,m,pattern,n);
    return (EXIT_SUCCESS);
}

0
你的主要问题是拥有未知大小的字符数组。在声明时指定数组大小即可解决。
int main(int argc, char** argv) {
    int s1[4096], s2[4096];
    fflush(stdin);
    printf(" enter a string\n");
    scanf("%s", s1);

    printf(" enter a pattern\n");
    scanf("%s", s2);

    int m = strlen(s1);
    int n = strlen(s2);
    printf(" text is %s of length %d, pattern is %s of length %d \n", s1, m, s2, n);
    return (EXIT_SUCCESS);
}

0
不要使用 scanfgets,因为正如您所说,没有真正的方法知道输入的长度有多长。相反,应该使用 fgets 函数,并将其最后一个参数设为 stdinfgets 允许您指定应读取的最大字符数。如果需要,您可以随时返回并读取更多字符。 scanf(%s)gets 一直读取,直到找到终止字符,并且可能会超出缓冲区的长度,导致一些难以修复的问题。

4
使用宽度限制符的scanf函数可以安全地使用:char name[40]; if (scanf("%39s", name) != 1) /* error */; - pmg

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接