如何从长十六进制字符串创建Python字节对象?

126

我有一个长的十六进制数字字符串,例如

000000000000484240FA063DE5D0B744ADBED63A81FAEA390000C8428640A43D5005BD44

只是要长得多,几千字节。在Python 2.6/3中,是否有内置的方法将其转换为字节对象?


4
请注意,下面的答案可能看起来相似,但它们返回不同类型的值。s.decode('hex') 返回一个字符串,unhexlify(s) 也是如此。bytearray.fromhex(s) 返回一个字节数组。考虑到这个问题的措辞,我认为应该在 bytearray.fromhex(s) 上放置大绿色勾号,而不是在 s.decode('hex') 上。 - Paul Hoffman
2
可能是Python中十六进制字符串转字节数组的重复问题 - Ciro Santilli OurBigBook.com
2
它怎么可能是一个比两年后创建的问题的副本? - recursive
2
@LarsH 好的。@recursive:日期不是主要因素:https://meta.stackexchange.com/questions/147643/should-i-vote-to-close-a-duplicate-question-even-though-its-much-newer-and-ha - Ciro Santilli OurBigBook.com
5个回答

143
result = bytes.fromhex(some_hex_string)

3
这似乎是实现原帖所要求的最直接的方法。为什么这不是被采纳的答案? - Bash
2
fromhex()方法(适用于bytes和bytearray)在十六进制数字之间带有空格时也能正常运行。非常方便! - Klaws
2
这真的应该成为被接受的答案。当前被接受的答案并没有完成问题所要求的任务。它返回一个可变的字节数组,而不是一个字节串。 - Mike Martin
7
@MikeMartin 我接受了这个答案,只是在它发布12年后才这样做。 - recursive

121

适用于Python 2.7及更高版本,包括python3:

result = bytearray.fromhex('deadbeef')

注意: Python 2.6中的bytearray.fromhex()函数似乎存在一个错误。 python.org文档说明该函数接受一个字符串作为参数,但是在应用程序时会抛出以下错误:

>>> bytearray.fromhex('B9 01EF')
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: fromhex() argument 1 must be unicode, not str`

10
另外还需要一步,我想要一个字节串(例如Python 3中的b'\x04\xea[...]'),你可以通过使用bytes(bytearray.fromhex('deadbeef'))从一个bytearray获得。 - berto
6
在这种情况下,有一种更直接的方法,即使用binascii.unhexlify()函数。 - Martijn Pieters
1
谢谢,@MartijnPieters,我会尝试一下。 - berto
1
这个答案并没有完成问题所要求的任务。它返回了一个可变的字节数组,而不是 Python 的字节串。这就像返回一个字符串数组而不是一个字符串。 - Mike Martin
2
@LarsH:在旧版的Python 2中,该方法不可用。虽然这在今天已经不再重要,但在2016年曾是一个问题。 - Martijn Pieters
显示剩余2条评论

46

你可以使用十六进制编解码来实现。例如:

>>> s='000000000000484240FA063DE5D0B744ADBED63A81FAEA390000C8428640A43D5005BD44'
>>> s.decode('hex')
'\x00\x00\x00\x00\x00\x00HB@\xfa\x06=\xe5\xd0\xb7D\xad\xbe\xd6:\x81\xfa\xea9\x00\x00\xc8B\x86@\xa4=P\x05\xbdD'

20
codecs.decode('0a0a0a', 'hex_codec') 可以用于2.x和3.x版本的Python :-) - Abbafei

39

尝试使用binascii模块

from binascii import unhexlify
b = unhexlify(myhexstr)

11
2.x有两种方法可以做到,3.x有三种方法。所以“只有一种方法可以做到”就不成立了。 - technomalogical
1
其他两种方式更加“内置”,所以我实际上会使用其中一种。 - Crescent Fresh
@technomalogical:你的评论与答案无关,也许你应该将其删除并改为发布到comp.lang.python。 - tzot
1
@technomalogical:我同意ΤΖΩΤΖΙΟΥ的观点。而且,你说错了。正确的短语是:应该有一种——最好只有一种——显而易见的方法来做到这一点。 - nosklo
2
请注意,在Python 3.2中(无论是设计还是错误,我不确定),unhexlify现在不再接受字符串,而只接受字节。这真的很愚蠢,但这意味着您需要使用b = unhexlify(bytes(myhexstr, 'utf-8')) - Scott Griffiths

2
import binascii

binascii.a2b_hex(hex_string)

最初的回答:这是我做的方式。

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接