十六进制数字的按位异或

46

在Python中,我们如何对十六进制数进行异或操作?例如,我想要对'ABCD''12EF'进行异或操作,得到的结果应该是'B922'

我使用了下面的代码,但结果不正确。

# xor two strings of different lengths
def strxor(a, b):
    if len(a) > len(b):
        return "".join(["%s" % (ord(x) ^ ord(y)) for (x, y) in zip(a[:len(b)], b)])
    else:
        return "".join(["%s" % (ord(x) ^ ord(y)) for (x, y) in zip(a, b[:len(a)])])

key = '12ef'
m1 = 'abcd'
print(strxor(key, m1))

2
对于 zip,只需一个提示:它会自动剥离较长的参数。无论如何,@unwind 的简短解决方案是正确的。 - eumiro
5个回答

119

哇哦,你复杂化了它并且离真正的简单相差甚远。试试这个:

>>> print(hex(0x12ef ^ 0xabcd))
0xb922

至少有以下这些有用的信息需要注意:

  • Python原生支持十六进制整数字面量,使用前缀0x
  • “十六进制”只是一种表示方式;算术运算是在二进制下完成的,然后将结果以十六进制形式打印出来。
  • 输入格式(十六进制字面量)与输出之间没有联系,在Python变量中不存在所谓的“十六进制数”。
  • hex()函数可用于将任何数字转换为十六进制字符串进行显示。

如果您已经拥有数字字符串,可以使用int()函数将其转换为数字,提供期望的基数(十六进制数字为16)即可:

>>> print(int("12ef", 16))
4874

所以你可以进行两次转换,执行XOR操作,然后再转回十六进制:

>>> print(hex(int("12ef", 16) ^ int("abcd", 16)))
0xb922

5
当然,如果@pratibha只有字符串字面值,则另一种选择是hex(int('12ef', 16) ^ int('abcd', 16)) - Jon Clements
@unwind,第二个数字应该是0xabcd,因此期望的答案是0xB922。 - DaV

11

如果两个十六进制字符串长度相同且您想要一个十六进制字符串输出,则可以尝试以下方法。

def hexxor(a, b):    # 对长度相同的两个十六进制字符串进行异或操作
    return "".join(["%x" % (int(x,16) ^ int(y,16)) for (x, y) in zip(a, b)])

5

这是一个更好的函数

def strxor(a, b):     # xor two strings of different lengths
    if len(a) > len(b):
        return "".join([chr(ord(x) ^ ord(y)) for (x, y) in zip(a[:len(b)], b)])
    else:
        return "".join([chr(ord(x) ^ ord(y)) for (x, y) in zip(a, b[:len(a)])])

11
似乎是Coursera上密码学1课程某个作业中的精确代码。;) - Rahil Arora

5
如果字符串长度相同,我会选择使用内置的异或 (^) 的格式化字符串 '%x' % ()
示例 -
>>>a = '290b6e3a'
>>>b = 'd6f491c5'
>>>'%x' % (int(a,16)^int(b,16))
'ffffffff'
>>>c = 'abcd'
>>>d = '12ef'
>>>'%x' % (int(a,16)^int(b,16))
'b922'

如果字符串长度不相同,则使用切片将较长的字符串截断为较短字符串的长度 longer = longer[:len(shorter)]


2

为了达到更好的性能,以下是一个小代码段,用于对这两种选择进行基准测试:

#!/bin/python

def hexxorA(a, b):
    if len(a) > len(b):
        return "".join(["%x" % (int(x,16) ^ int(y,16)) for (x, y) in zip(a[:len(b)], b)])
    else:
        return "".join(["%x" % (int(x,16) ^ int(y,16)) for (x, y) in zip(a, b[:len(a)])])

def hexxorB(a, b):
    if len(a) > len(b):
        return '%x' % (int(a[:len(b)],16)^int(b,16))
    else:
        return '%x' % (int(a,16)^int(b[:len(a)],16))

def testA():
    strstr = hexxorA("b4affa21cbb744fa9d6e055a09b562b87205fe73cd502ee5b8677fcd17ad19fce0e0bba05b1315e03575fe2a783556063f07dcd0b9d15188cee8dd99660ee751", "5450ce618aae4547cadc4e42e7ed99438b2628ff15d47b20c5e968f086087d49ec04d6a1b175701a5e3f80c8831e6c627077f290c723f585af02e4c16122b7e2")
    if not int(strstr, 16) == int("e0ff3440411901bd57b24b18ee58fbfbf923d68cd88455c57d8e173d91a564b50ce46d01ea6665fa6b4a7ee2fb2b3a644f702e407ef2a40d61ea3958072c50b3", 16):
        raise KeyError
    return strstr

def testB():
    strstr = hexxorB("b4affa21cbb744fa9d6e055a09b562b87205fe73cd502ee5b8677fcd17ad19fce0e0bba05b1315e03575fe2a783556063f07dcd0b9d15188cee8dd99660ee751", "5450ce618aae4547cadc4e42e7ed99438b2628ff15d47b20c5e968f086087d49ec04d6a1b175701a5e3f80c8831e6c627077f290c723f585af02e4c16122b7e2")
    if not int(strstr, 16) == int("e0ff3440411901bd57b24b18ee58fbfbf923d68cd88455c57d8e173d91a564b50ce46d01ea6665fa6b4a7ee2fb2b3a644f702e407ef2a40d61ea3958072c50b3", 16):
        raise KeyError
    return strstr

if __name__ == '__main__':
    import timeit
    print("Time-it 100k iterations :")
    print("\thexxorA: ", end='')
    print(timeit.timeit("testA()", setup="from __main__ import testA", number=100000), end='s\n')
    print("\thexxorB: ", end='')
    print(timeit.timeit("testB()", setup="from __main__ import testB", number=100000), end='s\n')

以下是结果:
Time-it 100k iterations :
    hexxorA: 8.139988073991844s
    hexxorB: 0.240523161992314s

看起来'%x' % (int(a,16)^int(b,16))比zip版本更快。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接