C++将字符串转换为十六进制数以及反向转换

78

在C++中,将字符串转换为十六进制以及将十六进制转换为字符串的最佳方法是什么?

例如:

  • 将类似于 "Hello World" 的字符串转换为十六进制格式:48656C6C6F20576F726C64
  • 并将十六进制 48656C6C6F20576F726C64 转换为字符串:"Hello World"

1
你所说的“to hex”具体是什么意思?难道字符串不已经是十六进制了吗? - fredoverflow
@FredOverflow:将类似于“Hello World”的字符串转换为十六进制格式:48656C6C6F20576F726C64。 - Sebtm
@0A0D:一个跨平台解决方案。 - Sebtm
14个回答

109

将类似于“Hello World”的字符串转换为十六进制格式:48656C6C6F20576F726C64。

好的,这里是:

#include <string>

std::string string_to_hex(const std::string& input)
{
    static const char hex_digits[] = "0123456789ABCDEF";

    std::string output;
    output.reserve(input.length() * 2);
    for (unsigned char c : input)
    {
        output.push_back(hex_digits[c >> 4]);
        output.push_back(hex_digits[c & 15]);
    }
    return output;
}

#include <stdexcept>

int hex_value(unsigned char hex_digit)
{
    static const signed char hex_values[256] = {
        -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1,
        -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1,
        -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1,
         0,  1,  2,  3,  4,  5,  6,  7,  8,  9, -1, -1, -1, -1, -1, -1,
        -1, 10, 11, 12, 13, 14, 15, -1, -1, -1, -1, -1, -1, -1, -1, -1,
        -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1,
        -1, 10, 11, 12, 13, 14, 15, -1, -1, -1, -1, -1, -1, -1, -1, -1,
        -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1,
        -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1,
        -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1,
        -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1,
        -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1,
        -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1,
        -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1,
        -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1,
        -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1,
    };
    int value = hex_values[hex_digit];
    if (value == -1) throw std::invalid_argument("invalid hex digit");
    return value;
}

std::string hex_to_string(const std::string& input)
{
    const auto len = input.length();
    if (len & 1) throw std::invalid_argument("odd length");

    std::string output;
    output.reserve(len / 2);
    for (auto it = input.begin(); it != input.end(); )
    {
        int hi = hex_value(*it++);
        int lo = hex_value(*it++);
        output.push_back(hi << 4 | lo);
    }
    return output;
}

(这里假设一个char占8位,因此这种方法不太具有可移植性,但你可以从这里开始。)


2
我必须掩盖移位后的LUT索引,即 (c >> 4) & 0x0F,以使其对我起作用。 - liwp
1
@liwp:即使正确转换为unsigned char,您仍需要该掩码吗? - yau

34
string ToHex(const string& s, bool upper_case /* = true */)
{
    ostringstream ret;

    for (string::size_type i = 0; i < s.length(); ++i)
        ret << std::hex << std::setfill('0') << std::setw(2) << (upper_case ? std::uppercase : std::nouppercase) << (int)s[i];

    return ret.str();
}

int FromHex(const string &s) { return strtoul(s.c_str(), NULL, 16); }

3
+1,但我建议使用istringstream来实现第二个功能——因为strtoul不是标准库函数。 - Billy ONeal
1
为什么 FromHex 返回 int 类型?应该返回字符串类型。 - Sebtm
@Sebtm:如果你调用FromHex("10");它将返回16,因为十六进制中的10是16。 - Krevan
1
“toHex”函数给了我奇怪的结果。原来应该将字节转换为无符号8位整数(在Windows中为“UINT8”)。 - atoMerz
1
你可以使用强制类型转换(int)(unsigned char)来代替特定平台的UINT8 - slawekwin

20

使用查找表等方法虽然可行,但有些复杂。下面是一些非常简单的将字符串转换为十六进制和将十六进制转回字符串的方法:

#include <stdexcept>
#include <sstream>
#include <iomanip>
#include <string>
#include <cstdint>

std::string string_to_hex(const std::string& in) {
    std::stringstream ss;

    ss << std::hex << std::setfill('0');
    for (size_t i = 0; in.length() > i; ++i) {
        ss << std::setw(2) << static_cast<unsigned int>(static_cast<unsigned char>(in[i]));
    }

    return ss.str(); 
}

std::string hex_to_string(const std::string& in) {
    std::string output;

    if ((in.length() % 2) != 0) {
        throw std::runtime_error("String is not valid length ...");
    }

    size_t cnt = in.length() / 2;

    for (size_t i = 0; cnt > i; ++i) {
        uint32_t s = 0;
        std::stringstream ss;
        ss << std::hex << in.substr(i * 2, 2);
        ss >> s;

        output.push_back(static_cast<unsigned char>(s));
    }

    return output;
}

VS2013 抱怨 uint32_t - 必须添加 <cstdint> - thomthom
1
我发现每次读取后<< std::setw(2)都会被重置,所以我必须在for循环内部使用它。我查阅了文档,发现在许多情况下宽度都会被重置:http://en.cppreference.com/w/cpp/io/manip/setw - thomthom
有趣的是,我在使用这个函数时从未遇到过这个问题,但看了文档后发现你是正确的。感谢修复 :-) - X-Istence
1
它能正确处理 '\0' 吗?当字符串包含空字节时,我似乎得到了错误的结果。 - allo
这个函数可以正确处理二进制数据,但是为了输入这些数据,你需要使用带有两个参数的std::string构造函数版本(参见https://en.cppreference.com/w/cpp/string/basic_string/basic_string):std::string(const char* s, size_type count);否则,你的测试字符串将在第一个空字节处被截断:string_to_hex(std::string("\x00\x01", 2)) == "0001" // 正确,而string_to_hex("\x00\x01") == "" // 你实际上是在向函数输入一个空字符串 - muxator

16

从C++17开始,还有std::from_chars。以下函数接受一个十六进制字符的字符串,并返回一个T类型的向量:

#include <charconv>

template<typename T>
std::vector<T> hexstr_to_vec(const std::string& str, unsigned char chars_per_num = 2)
{
  std::vector<T> out(str.size() / chars_per_num, 0);

  T value;
  for (std::size_t i = 0; i < str.size() / chars_per_num; i++) {
    std::from_chars<T>(
      str.data() + (i * chars_per_num),
      str.data() + (i * chars_per_num) + chars_per_num,
      value,
      16
    );
    out[i] = value;
  }

  return out;
}

9
我喜欢浏览C/C++98的答案直到找到现代C++的答案。 :) - Leśny Rumcajs

16

我认为有一种更简单、更优雅的解决方案。一些上述方法甚至在某些情况下可能会抛出未处理的异常。这是一个百分之百可靠(永远不会出错)和非常快速的代码。只需尝试一下,比较其速度和紧凑性的结果:

#include <string>

// Convert string of chars to its representative string of hex numbers
void stream2hex(const std::string str, std::string& hexstr, bool capital = false)
{
    hexstr.resize(str.size() * 2);
    const size_t a = capital ? 'A' - 1 : 'a' - 1;

    for (size_t i = 0, c = str[0] & 0xFF; i < hexstr.size(); c = str[i / 2] & 0xFF)
    {
        hexstr[i++] = c > 0x9F ? (c / 16 - 9) | a : c / 16 | '0';
        hexstr[i++] = (c & 0xF) > 9 ? (c % 16 - 9) | a : c % 16 | '0';
    }
}

// Convert string of hex numbers to its equivalent char-stream
void hex2stream(const std::string hexstr, std::string& str)
{
    str.resize((hexstr.size() + 1) / 2);

    for (size_t i = 0, j = 0; i < str.size(); i++, j++)
    {
        str[i] = (hexstr[j] & '@' ? hexstr[j] + 9 : hexstr[j]) << 4, j++;
        str[i] |= (hexstr[j] & '@' ? hexstr[j] + 9 : hexstr[j]) & 0xF;
    }
}

测试代码

#include <iostream>
int main()
{
    std::string s = "Hello World!";
    std::cout << "original string: " << s << '\n';
    stream2hex(s, s);
    std::cout << "hex format: " << s << '\n';
    hex2stream(s, s);
    std::cout << "original one: " << s << '\n';
}

结果是:

original string: Hello World!
hex format: 48656C6C6F20576F726C6421
original one: Hello World!

不支持包含二进制字符(如0)的字符串。 - 43.52.4D.
@43.52.4D。它完美地工作。请参见实时示例 - polfosol ఠ_ఠ
不,我的意思是实际的二进制。当我在文件上尝试这个算法时,一些字符没有被正确地转换为十六进制。 - 43.52.4D.
2
你是认真的吗?在第二个示例中,该字符串有8个NULL字符。@43.52.4D. - polfosol ఠ_ఠ
1
好的,我很高兴它能正常工作 :) 也许我的代码里有个bug。 - 43.52.4D.
显示剩余4条评论

14

你可以尝试这个。它有效...

#include <algorithm>
#include <sstream>
#include <iostream>
#include <iterator>
#include <iomanip>

namespace {
   const std::string test="hello world";
}

int main() {
   std::ostringstream result;
   result << std::setw(2) << std::setfill('0') << std::hex << std::uppercase;
   std::copy(test.begin(), test.end(), std::ostream_iterator<unsigned int>(result, " "));
   std::cout << test << ":" << result.str() << std::endl;
}

这很不错。你怎么用另一种方式做呢? - Timmmm
这在处理小字符值时无法正常工作(例如,如果您的字符串是\x01\x02\x03) - BatchyX
它可以工作,将您的字符串更改为“\x01\x02\x03”。因为编译器不会编译“\x”字符。 - Mahmut EFE
2
它似乎适用于小字符值,但不适用于大字符值。test="\xf0" 应该编码为 "f0",但它给出了 "fffffff0"。 - richvdh
2
我收回之前的说法,它在小字符值上也会失败。std::setw() 只对下一次写入有效。 - richvdh
1
@richvdh - 你找到为什么会返回 fffffff0的原因了吗?编辑:在下面找到了解决方案:https://dev59.com/_XA75IYBdhLWcg3wSm24#16125797 需要进行双重静态转换。 - thomthom

8

使用标准库的最简单示例。

#include <iostream>
using namespace std;

int main()
{
  char c = 'n';
  cout << "HEX " << hex << (int)c << endl;  // output in hexadecimal
  cout << "ASC" << c << endl; // output in ascii
  return 0;
}

为了检查输出结果,codepad 返回值为:6e。
在线ascii-to-hexadecimal conversion tool 也是返回值为 6e。所以这样可以工作。
你也可以这样做:
template<class T> std::string toHexString(const T& value, int width) {
    std::ostringstream oss;
    oss << hex;
    if (width > 0) {
        oss << setw(width) << setfill('0');
    }
    oss << value;
    return oss.str();
}

我喜欢最简单的答案在底部...在将ASCII转换为十六进制的作业中使用了第一个代码块中描述的方法,没有遇到任何问题。 - Joe
4
我将此评为负分,因为问题明显是在谈论“字符串”,而非像'a'这样的单个字符值。后者很简单,而前者则不然。 - Multisync

6

这个稍微快一些:

static const char* s_hexTable[256] = 
{
    "00", "01", "02", "03", "04", "05", "06", "07", "08", "09", "0a", "0b", "0c", "0d", "0e", "0f", "10", "11",
    "12", "13", "14", "15", "16", "17", "18", "19", "1a", "1b", "1c", "1d", "1e", "1f", "20", "21", "22", "23",
    "24", "25", "26", "27", "28", "29", "2a", "2b", "2c", "2d", "2e", "2f", "30", "31", "32", "33", "34", "35",
    "36", "37", "38", "39", "3a", "3b", "3c", "3d", "3e", "3f", "40", "41", "42", "43", "44", "45", "46", "47",
    "48", "49", "4a", "4b", "4c", "4d", "4e", "4f", "50", "51", "52", "53", "54", "55", "56", "57", "58", "59",
    "5a", "5b", "5c", "5d", "5e", "5f", "60", "61", "62", "63", "64", "65", "66", "67", "68", "69", "6a", "6b",
    "6c", "6d", "6e", "6f", "70", "71", "72", "73", "74", "75", "76", "77", "78", "79", "7a", "7b", "7c", "7d",
    "7e", "7f", "80", "81", "82", "83", "84", "85", "86", "87", "88", "89", "8a", "8b", "8c", "8d", "8e", "8f",
    "90", "91", "92", "93", "94", "95", "96", "97", "98", "99", "9a", "9b", "9c", "9d", "9e", "9f", "a0", "a1",
    "a2", "a3", "a4", "a5", "a6", "a7", "a8", "a9", "aa", "ab", "ac", "ad", "ae", "af", "b0", "b1", "b2", "b3",
    "b4", "b5", "b6", "b7", "b8", "b9", "ba", "bb", "bc", "bd", "be", "bf", "c0", "c1", "c2", "c3", "c4", "c5",
    "c6", "c7", "c8", "c9", "ca", "cb", "cc", "cd", "ce", "cf", "d0", "d1", "d2", "d3", "d4", "d5", "d6", "d7",
    "d8", "d9", "da", "db", "dc", "dd", "de", "df", "e0", "e1", "e2", "e3", "e4", "e5", "e6", "e7", "e8", "e9",
    "ea", "eb", "ec", "ed", "ee", "ef", "f0", "f1", "f2", "f3", "f4", "f5", "f6", "f7", "f8", "f9", "fa", "fb",
    "fc", "fd", "fe", "ff"
};

// Convert binary data sequence [beginIt, endIt) to hexadecimal string
void dataToHexString(const uint8_t*const beginIt, const uint8_t*const endIt, string& str)
{
    str.clear();
    str.reserve((endIt - beginIt) * 2);
    for(const uint8_t* it(beginIt); it != endIt; ++it)
    {
        str += s_hexTable[*it];
    }
}

@Erik Hvatum这个函数可以把std::string转换成16进制字符串吗?我不明白你所说的“二进制数据序列”的含义。您能否提供调用此函数的示例? - 43.52.4D.
@43.52.4D dataToHexString函数接受3个参数。第一个参数是指向内存中要呈现为十六进制的第一个字节的指针,第二个参数是指向您希望作为文本的最后一个字节之后的内存字节的指针。第三个参数是一个字符串,它被修改以包含文本。例如:vector<uint8_t> a; a.push_back(1); a.push_back(255); string s; dataToHex(a.data(), a.data()+a.size(), s); cout << s << '\n'; // "00ff" - Erik Hvatum
有人在1990年使用了类似的技巧,当时编译器很小,空间仅限于64K - 编译器已经用完了字符串空间!通过从循环中初始化数组,它神奇地成功编译了。 - cup

3
这将把“Hello World”转换为48656c6c6f20576f726c64并打印出来。
#include <iostream>
#include <cstring>

using namespace std;

int main()
{
    char hello[20]="Hello World";

    for(unsigned int i=0; i<strlen(hello); i++)
        cout << hex << (int) hello[i];
    return 0;
}

有人能解释一下为什么我们必须用其他复杂的方法吗?我觉得这个解决方案已经足够了。 - Sean
这个要简单得多,因为它是在函数内部打印的。其他答案更复杂,因为它们返回一个解决方案,而不打印任何东西。 - theicfire
1
@sea 你会发现增加的复杂性部分是由于正确性要求而导致的。这个解决方案忽略了这个要求。一旦你的输入是,比如说,"Hello\nWorld",就会发现这一点。这会产生一串十六进制数字,无法再被明确地转换回来。的确,对于每个问题,都有一个看似简单、直观,但实际上是错的解决方案。 - IInspectable

3
这里是另一种解决方案,很大程度上受到@fredoverflow的启发。
/**
 * Return hexadecimal representation of the input binary sequence
 */
std::string hexitize(const std::vector<char>& input, const char* const digits = "0123456789ABCDEF")
{
    std::ostringstream output;

    for (unsigned char gap = 0, beg = input[gap]; gap < input.length(); beg = input[++gap])
        output << digits[beg >> 4] << digits[beg & 15];

    return output.str();
}

在预期的使用中,长度是必需的参数。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接