如何在Python中对一个变量进行哈希?

12

这个例子运行良好:

import hashlib
m = hashlib.md5()
m.update(b"Nobody inspects")
r= m.digest()
print(r)

现在,我想用一个变量来完成同样的事情:var= "hash me this text, please"。如何按照示例的逻辑来做?


你尝试过 m.update(var) 吗? - tobias_k
3
那会产生一个错误;那不是一个字节值。 - Martijn Pieters
@tobias_k 不是,我尝试了 m.update(var) 但是出现了错误。 - user3522371
2
供日后参考:并非每个人都知道hash.update()需要字节,因此你的问题是当你尝试使用str值时出现了异常。下次在你的问题中包含该异常 - Martijn Pieters
1
我也这么想(听起来太简单了),但当我尝试后,它确实有效,并且我得到了相同的哈希码...不过是在Python 2.7上测试的,而不是3。 - tobias_k
1
@tobias_k:但这是一个至关重要的区别;Python 3从根本上建立在Unicode和字节之间的明确区分基础之上。 - Martijn Pieters
3个回答

14

hash.update() 方法 总是需要 bytes

先将 Unicode 文本编码为字节;你要编码成什么是应用程序的决定,但如果你只想为文本生成指纹,则 UTF-8 是一个很好的选择:

m.update(var.encode('utf8')) 

然而,当你不这样做时,你会得到一个非常清晰的异常:

>>> import hashlib
>>> hashlib.md5().update('foo')
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: Unicode-objects must be encoded before hashing

如果你需要获取一个文件的哈希值,那么请以二进制模式打开该文件:

from functools import partial

hash = hashlib.md5()
with open(filename, 'rb') as binfile:
    for chunk in iter(binfile, partial(binfile.read, 2048)):
        hash.update(chunk)
print hash.hexdigest()

我按照你给我的链接并阅读了有关digest()方法的内容:它能接收非常长的短语吗?我的变量是文本文件的内容(已经是这种情况),而且我的文本文件包含很多文本,那么digest()会接受这样一个大文件内容吗? - user3522371
2
@begueradj:是的,它可以接受任何符合Python的内容。如果您正在读取文本文件,可以多次调用.digest(),每次使用下一个块。循环遍历文件以获取行,将每行传递给.digest(),并在文件完成时获取摘要。 - Martijn Pieters
2
@begueradj:或者你可以以二进制模式打开文件,这样你就不必再次编码了。 - Martijn Pieters

4

试试这个。希望对您有所帮助。 变量 var 必须进行 utf-8 编码。如果输入字符串,例如 "Donald Duck",则 var 变量将为 b'Donald Duck'。您随后可以使用 hexdigest() 对字符串进行哈希处理。

#!/usr/bin/python3
import hashlib
var = input('Input string: ').encode('utf-8')
hashed_var = hashlib.md5(var).hexdigest()
print(hashed_var)

1
我是与OP有同样的问题。由于某些原因,之前的两个答案都不能解决我的问题,但两者的结合帮助我找到了解决方案。
我最初是这样对字符串进行哈希处理的:
str = hashlib.sha256(b'hash this text')
text_hashed = str.hexdigest()
print(text_hashed)

结果;d3dba6081b7f171ec5fa4687182b269c0b46e77a78611ad268182d8a8c245b40

我对变量进行哈希的解决方案;

text = 'hash this text'
str = hashlib.sha256(text.encode('utf-8'))
text_hashed = str.hexdigest()
print(text_hashed)

结果;d3dba6081b7f171ec5fa4687182b269c0b46e77a78611ad268182d8a8c245b40


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接