在Ruby中,对URL进行哈希的最佳方法是什么?

16
我正在编写一个指向外部链接的Web应用程序。我想为每个文档创建一个非连续,非可猜测的 ID,并将其用于 URL 中。我尝试了显而易见的方法:把 URL 视为字符串并对其进行 str#crypt,但是这似乎会在任何非字母数字字符上出现问题,比如斜杠、点和下划线。
有什么建议来解决这个问题吗?
谢谢!
3个回答

35

根据你需要的字符串长度,你可以使用以下几种方法:

require 'digest'
Digest.hexencode('http://foo-bar.com/yay/?foo=bar&a=22')
# "687474703a2f2f666f6f2d6261722e636f6d2f7961792f3f666f6f3d62617226613d3232"

require 'digest/md5'
Digest::MD5.hexdigest('http://foo-bar.com/yay/?foo=bar&a=22')
# "43facc5eb5ce09fd41a6b55dba3fe2fe"

require 'digest/sha1'
Digest::SHA1.hexdigest('http://foo-bar.com/yay/?foo=bar&a=22')
# "2aba83b05dc9c2d9db7e5d34e69787d0a5e28fc5"

require 'digest/sha2'
Digest::SHA2.hexdigest('http://foo-bar.com/yay/?foo=bar&a=22')
# "e78f3d17c1c0f8d8c4f6bd91f175287516ecf78a4027d627ebcacfca822574b2"

请注意,这不是无法猜测的,你可能需要将其与其他(秘密但静态的)数据组合起来来为字符串加盐:
salt = 'foobar'
Digest::SHA1.hexdigest(salt + 'http://foo-bar.com/yay/?foo=bar&a=22')
# "dbf43aff5e808ae471aa1893c6ec992088219bbb"

现在,对于那些不知道原始内容且无法访问您的源代码的人来说,生成此哈希值变得更加困难。

3

我建议您也可以查看摘要命名空间中的不同算法。为了增加猜测难度,除了使用秘密密码盐值之外,还可以使用精确的时间戳:

require 'digest/md5'
def hash_url(url)
  Digest::MD5.hexdigest("#{Time.now.to_f}--#{url}")
end

由于任何哈希算法的结果都不能保证唯一性,在假设您的哈希可用之前,请务必检查您的结果是否与先前生成的哈希值唯一。使用Time.now使重试变得轻松实现,因为您只需要调用直到生成唯一的哈希。


0

使用 Ruby 标准库中的 Digest::MD5

Digest::MD5.hexdigest(my_url)

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接