为什么strdup被认为是邪恶的？

Question

为什么strdup被认为是邪恶的？

cc-strings

33

我看到一些海报声称strdup是邪恶的。对此是否有共识？我已经使用它而没有任何罪恶感，并且看不出为什么它比使用malloc/memcpy更糟。

唯一能想到会让strdup声名狼藉的事情可能是调用者可能会误用它（例如，没有意识到他们必须释放返回的内存；尝试将字符串连接到 strdup'ed 字符串的末尾）。但是，malloc 的字符串也无法免受误用的可能性。

感谢回复并为认为问题无益而道歉（投票关闭）。总之，回复中似乎没有普遍认为strdup本身就是邪恶的感觉，但是普遍的共识是它可以像 C 的许多其他部分一样被不当或不安全地使用。

其实没有“正确”的答案，但是为了接受一个答案，我接受了@nneoneo的答案 - 它也可以是@R..'s的答案。

- William Morris

这个问题不会是因为我之前的评论而引起的吧？ - Seth Carnegie

关于 Can a loop cause issues with assignment in C 的评论。 - dmckee --- ex-moderator kitten

@SethCarnegie 是的，但我在其他地方看到了相同的观点，这就是为什么我创建了一个问题，而不仅仅是问你。 - William Morris

7个回答

23

我的回答是支持strdup，它不比C语言中的其他任何函数更差。

POSIX是一个标准，如果可移植性成为问题，实现strdup并不太困难。
是否释放strdup分配的内存不应该成为一个问题，如果有人花点时间阅读手册并理解strdup的工作原理，就不会是一个问题。如果一个人不了解一个函数的工作原理，很可能会出错，这适用于任何函数，而不仅仅是strdup。
在C语言中，内存和大多数其他东西都由程序员管理，所以strdup不比忘记释放malloc分配的内存、未对字符串进行空终止、在scanf中使用错误的格式字符串（从而导致未定义行为）、访问悬挂指针等更差。

（我真的想把这个作为评论发布，但不能只发布一个评论。因此，我将其作为答案发布）。

- P.P

11

我并没有听说过strdup被描述为邪恶，但是一些人不喜欢它的可能原因有：

它不是标准的C语言（但在POSIX中可以使用）。然而我认为这个理由很愚蠢，因为只需添加一个几乎是一行的函数即可在缺少它的系统上使用。
盲目地在各处复制字符串，而不是尽可能在原地使用它们，浪费时间和内存，并引入可能本来没有失败的代码中出现错误的情况。
当您确实需要复制字符串时，很可能实际上需要更多的空间来修改或构建它，而strdup并不能提供这种功能。

- R.. GitHub STOP HELPING ICE

5

我认为大多数对strdup的关注来自于安全方面的担忧，涉及缓冲区溢出和格式不正确的字符串。如果向strdup传递非空终止的字符串，则可能会分配未定义长度的字符串。我不知道这是否可以被具体利用成攻击，但一般来说，只使用具有最大长度限制的字符串函数而不仅是依赖于空字符，这是很好的安全编码实践。

- john-charles

5

如果程序员将一个非以空字符结尾的字符串传递给期望以空字符结尾的函数，那么就犯了一个很大的错误。请注意不要改变原本的意思，只需使其更通俗易懂。 - Jonathan Leffler

1

然而，这种情况确实会发生，这就是在安全性是一个严重问题时使用strncpy而不是strcpy的原因。这也可能发生在意外的用户输入或损坏的文件中。通常最好的安全实践是依赖于显式长度而不是字符串的空终止符。 - john-charles

3

在大多数实际情况下，我不使用 strncpy() 函数。它不能保证空字符的插入。如果你将一个5字节的单词复制到一个20 KiB的缓冲区中，它会写入20475个空字符。这两种行为对我来说都是不可接受的。通常情况下，我确保自己知道字符串的长度，然后使用 memmove() 或者（偶尔）memcpy() 函数；有时我也会犯错误并使用 strcpy()，但只有在我知道有足够的空间的情况下才这样做。（如果你需要安慰一下，strncat() 比 strncpy() 更糟糕；我从不使用它！）如果我不知道字符串的最大长度，我无法安全地操作它。我甚至无法确定它何时被截断。 - Jonathan Leffler

2

一个没有空终止符的字符数组在定义上不是一个“字符串”。当你给fopen()一个http URL而不是文件路径时，你不会期望它能工作。任何把普通字符数组传递给期望字符串的函数的程序员都应该阅读文档或者不被允许靠近任何生产代码100米以内。他们很可能也会忘记检查malloc()的返回值是否为NULL。 - Secure

1

如果你关心字符串处理的安全性（这是你应该一直关注的），那么最好不要在代码中随意抛出原始的 str* 调用。编写一个关注所有典型问题的字符串处理库，并且专门使用它。当然，如果你更关心使用 strlen() 而不是 my_strlen() 这样的愚蠢事情时的“性能考虑”，那么你会得到你应得的结果。 - Secure

我不确定这个答案是否有意义。strdup保证分配足够的空间来包含终止符。另一种选择是程序员编写news = malloc(strlen(olds) + 1); strcpy(news,olds)，并可能忘记了+1（如果他忘记考虑到空字符的需要，使用strncpy也不一定有帮助）。 - dmckee --- ex-moderator kitten

3

许多人显然不这样认为，但是我个人认为strdup有几个问题：

主要问题在于它隐藏了内存分配。其他的str*函数和大多数标准函数后面都不需要free，所以strdup看起来很无害，你可能会忘记清理它。dmckee建议将其添加到需要清理的函数列表中，但是为什么？我并没有看到将两行中等长度缩短为一行的优势。
它总是在堆上分配内存，在C99（是99吗？）的可变长度数组中，你又有了一个使用strcpy（甚至不需要malloc）的理由。你并不总是能这样做，但是当你能够这样做时，你应该这样做。
它不是ISO标准的一部分（但它是POSIX标准的一部分，感谢Wiz），但这只是一个小问题，因为R..提到它可以很容易地被添加。如果你编写可移植的程序，我不确定你如何判断它是否已经定义了......

当然，这些只是我的原因，别人的想法可能不同。回答你的问题，我没有听说过一致的意见。

如果你只是为自己编写程序，并且认为strdup没问题，那么使用它的理由比编写供许多技能水平和年龄段的人阅读的程序要少得多。

- Seth Carnegie

1

你的第一个观点基本上否定了整个C语言？如果你不释放strdup()，你就没有释放自己的东西。为什么会有区别呢？对于VLA，特别是在任意大小的字符串上，会带来麻烦和未定义的行为，而且没有警告。至于最后一条：它不是标准的：是的，它是。它是POSIX标准的一部分。它只是ISO C标准的一部分 - 对于大多数人来说足够可移植。 - Wiz

1

@Wiz，你自己的东西很引人注目，而strdup则融入其中。这就是重点。感谢你提到标准性的问题。 - Seth Carnegie

7

我非常想点个踩，因为我不同意你说的大部分内容。虽然我不会这么做，但我要说的是，我认为你的反对意见并不是很相关。考虑到人们模拟strdup()时犯错误的次数之多——通常是忘记为终止空字符分配足够的空间——拥有一个库函数比让每个人都重新发明（7行）函数更加明智。 - Jonathan Leffler

7行代码？我一直认为只有一两行... char *new = malloc(strlen(old)+1); return new ? strcpy(new, old) : 0; - R.. GitHub STOP HELPING ICE