使用std::string存储二进制数据是否不合适？

Question

3

我在这个问题中看到有人修改了一个有效的代码片段，原因是第二个答案的作者说：

我认为使用std::string对象存储二进制数据不太合适。

那么，我为什么不能这样做呢？

- qdii

1

你有什么理由会这样做，而不是使用 std::vector<char> ？ - juanchopanza

1

因为在C++03中，std::string允许进行写时复制，并在数据块末尾添加\0吗？它并不是设计用于存储任意二进制数据块。它的设计目的是实现字符字符串的概念。 - juanchopanza

@juanchopanza COW（被证明在这里大多数情况下都不好）在C++11中已经不再允许，那么添加的零终止符如何妨碍我？唯一的好处是在没有真正文本时不使用字符串。 - Deduplicator

@juanchopanza：你完全掌控。所以在你的数据后面存储了一个0（不包括在计数中），这会如何阻碍你？它也可能是垃圾，谁在乎呢？ - Deduplicator

例如，在某些情况下，使用&s[0]访问底层数据块可能不安全，而在使用std::vector时则可以。 - juanchopanza

显示剩余4条评论

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- 6502 · Accepted Answer

在处理二进制数据时，我认为最好的选择是使用std::vector<unsigned char>。

虽然使用std::string在技术上可以工作，但会给用户传递错误的信息，让他们误以为正在处理的是文本数据。

另一方面，能够接受字符串中的任何字节非常重要，因为有时您知道内容是文本，但编码方式未知。强制std::string仅包含有效和解码文本将成为现实世界应用的重大限制。

这种限制是我不喜欢QString的少数几件事之一：这种限制使得例如使用文件选择对话框打开文件变得不可能，如果文件名具有“错误”的（意外的）编码或编码实际上无效（其中包含错误）。