将二进制转换为ASCII码,反之亦然

97

使用以下代码将字符串转换为二进制:

bin(reduce(lambda x, y: 256*x+y, (ord(c) for c in 'hello'), 0))

这将输出:

0b110100001100101011011000110110001101111

我将其输入这个网站(右侧),它返回了我的消息hello。 我想知道它使用的方法。我知道我可以将二进制字符串拆分成8位,然后将其与对应值匹配为bin(ord(character))或其他方式。但是我真的在寻找更简单的方法。


1
那么你的问题是,“除了显而易见的方法,是否有更简洁的方法来执行我的代码的反向操作?” - tripleee
1
相关:b2a_bin扩展在Cython中允许直接从字节串创建二进制字符串("01"),而无需创建中间的Python整数。 - jfs
8个回答

175

对于 Python 2 中范围在 [ -~] 的 ASCII 字符:

>>> import binascii
>>> bin(int(binascii.hexlify('hello'), 16))
'0b110100001100101011011000110110001101111'

相反地:

>>> n = int('0b110100001100101011011000110110001101111', 2)
>>> binascii.unhexlify('%x' % n)
'hello'
在Python 3.2及以上版本中:
>>> bin(int.from_bytes('hello'.encode(), 'big'))
'0b110100001100101011011000110110001101111'

倒序:

>>> n = int('0b110100001100101011011000110110001101111', 2)
>>> n.to_bytes((n.bit_length() + 7) // 8, 'big').decode()
'hello'

如何在 Python 3 中支持所有 Unicode 字符:

def text_to_bits(text, encoding='utf-8', errors='surrogatepass'):
    bits = bin(int.from_bytes(text.encode(encoding, errors), 'big'))[2:]
    return bits.zfill(8 * ((len(bits) + 7) // 8))

def text_from_bits(bits, encoding='utf-8', errors='surrogatepass'):
    n = int(bits, 2)
    return n.to_bytes((n.bit_length() + 7) // 8, 'big').decode(encoding, errors) or '\0'

以下是一个单源Python 2/3兼容的版本:

import binascii

def text_to_bits(text, encoding='utf-8', errors='surrogatepass'):
    bits = bin(int(binascii.hexlify(text.encode(encoding, errors)), 16))[2:]
    return bits.zfill(8 * ((len(bits) + 7) // 8))

def text_from_bits(bits, encoding='utf-8', errors='surrogatepass'):
    n = int(bits, 2)
    return int2bytes(n).decode(encoding, errors)

def int2bytes(i):
    hex_string = '%x' % i
    n = len(hex_string)
    return binascii.unhexlify(hex_string.zfill(n + (n & 1)))

示例

>>> text_to_bits('hello')
'0110100001100101011011000110110001101111'
>>> text_from_bits('110100001100101011011000110110001101111') == u'hello'
True

3
@J.F.Sebastian,我尝试了您提供的方法,但在使用当前版本的Python时似乎不起作用。 TypeError: 'str' does not support the buffer interface 请更新您的答复。 - hamza
3
它可以在Python 2上运行。在Python 3上,您应该首先将字符串转换为字节,例如your_string.encode('ascii', 'strict') - jfs
1
@J.F.Sebasitian:谢谢,但是当我尝试反过来时,unhexlify函数返回一个错误消息:binascii.Error: Odd-length string。 - hamza
3
如果十六进制字符串的长度不是偶数,就在前面添加“0”。如果原始字符串的第一个字符的ASCII码小于16(例如,“\n”或“\t”),就会发生这种情况。奇数长度永远不会出现在ASCII字母“[ -~]”中。 - jfs

33

仅限内置 python

这里是一个纯python方法用于简单的字符串操作,留存在此以备后人参考。

def string2bits(s=''):
    return [bin(ord(x))[2:].zfill(8) for x in s]

def bits2string(b=None):
    return ''.join([chr(int(x, 2)) for x in b])

s = 'Hello, World!'
b = string2bits(s)
s2 = bits2string(b)

print 'String:'
print s

print '\nList of Bits:'
for x in b:
    print x

print '\nString:'
print s2

String:
Hello, World!

List of Bits:
01001000
01100101
01101100
01101100
01101111
00101100
00100000
01010111
01101111
01110010
01101100
01100100
00100001

String:
Hello, World!

10

除了逐个字符地处理,我不确定你如何能够完成它——这本质上就是一个逐个字符的操作。当然有可以为您完成此操作的代码,但没有比逐个字符更简单的方法。

首先,你需要去掉0b前缀,并在左侧填充零,以使字符串的长度可被8整除,从而方便将比特串分成字符:

bitstring = bitstring[2:]
bitstring = -len(bitstring) % 8 * '0' + bitstring

然后你将字符串分成八个二进制数字的块,将它们转换为ASCII字符,并将它们重新连接成一个字符串:

string_blocks = (bitstring[i:i+8] for i in range(0, len(bitstring), 8))
string = ''.join(chr(int(char, 2)) for char in string_blocks)

如果你确实想把它当作一个数字来处理,那么你仍然需要考虑到最左边的字符最多只有七位数字长,如果你想从左向右而不是从右向左处理。


2
这是我解决您任务的方法:
str = "0b110100001100101011011000110110001101111"
str = "0" + str[2:]
message = ""
while str != "":
    i = chr(int(str[:8], 2))
    message = message + i
    str = str[8:]
print message

为什么要在 str = "0" + str[2:] 中添加 '0'?这里需要删除 0b,因为它是开头。 - bimlesh sharma

2

如果您不想导入任何文件,可以使用以下方法:

with open("Test1.txt", "r") as File1:
St = (' '.join(format(ord(x), 'b') for x in File1.read()))
StrList = St.split(" ")

将文本文件转换为二进制文件。

您可以使用以下方法将其转换回字符串:

StrOrgList = StrOrgMsg.split(" ")


for StrValue in StrOrgList:
    if(StrValue != ""):
        StrMsg += chr(int(str(StrValue),2))
print(StrMsg)

希望这对您有所帮助,我曾使用此方法与自定义加密一起发送TCP。


1
你是在寻找代码还是理解算法? 这个是否满足你的需求?特别是 a2b_uub2a_uu?如果不是你想要的,那里面还有很多其他选项。
(注意:我不是 Python 的专家,但这似乎是一个显而易见的答案)

我已经研究了一段时间,但binascii对我没有用,主要是在寻找代码,如果我能看到它,我就能理解它。谢谢你的帮助。编辑:使用binascii a2b_uu将ASCII转换为二进制时,“h”的结果是\x00\x00\x00\x00\x00\x00\x00\x00,这不是我需要的,我需要“hello”和实际的1和0,而不是外壳代码形式的ASCII,而且它只逐个字符工作。 - sbrichards
@Jaxidian,这对我的用途非常有帮助。有人将一些数据存储在字符串中,我现在已经拥有了它。由于填充,我相当确定它是一个64位二进制数。我可以成功地对其使用b2a_base64,但结果令人困惑。那么,我该如何从中获得布尔值/整数(0,1)的列表呢? - Ufos

0

将二进制转换为其对应的字符。

k=7
dec=0
new=[]
item=[x for x in input("Enter 8bit binary number with , seprator").split(",")]
for i in item:
    for j in i:
        if(j=="1"):
            dec=2**k+dec
            k=k-1
        else:
            k=k-1
    new.append(dec)
    dec=0
    k=7
print(new)
for i in new:
    print(chr(i),end="")

-1
这是 J.F. Sebastian 的升级版。感谢 J.F. Sebastian 提供的片段。
import binascii, sys
def goodbye():
    sys.exit("\n"+"*"*43+"\n\nGood Bye! Come use again!\n\n"+"*"*43+"")
while __name__=='__main__':
    print "[A]scii to Binary, [B]inary to Ascii, or [E]xit:"
    var1=raw_input('>>> ')
    if var1=='a':
        string=raw_input('String to convert:\n>>> ')
        convert=bin(int(binascii.hexlify(string), 16))
        i=2
        truebin=[]
        while i!=len(convert):
            truebin.append(convert[i])
            i=i+1
        convert=''.join(truebin)
        print '\n'+'*'*84+'\n\n'+convert+'\n\n'+'*'*84+'\n'
    if var1=='b':
        binary=raw_input('Binary to convert:\n>>> ')
        n = int(binary, 2)
        done=binascii.unhexlify('%x' % n)
        print '\n'+'*'*84+'\n\n'+done+'\n\n'+'*'*84+'\n'
    if var1=='e':
        aus=raw_input('Are you sure? (y/n)\n>>> ')
        if aus=='y':
            goodbye()

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接