Erlang 和 JavaScript 的 MD5 摘要匹配问题

5

在此测试Javascript实现的MD5:http://www.webtoolkit.info/javascript-md5.html,输出如下:

MD5("muzaaya") = "00e081abefbbbf72b2d5258196a9b6d0"

进入我的Erlang shell,计算同一值的MD5,我得到了以下结果:

Eshell V5.8.4  (abort with ^G)
1> erlang:md5("muzaaya").
<<0,224,129,171,239,187,191,114,178,213,37,129,150,169,
  182,208>>
2>

我该如何比较这两者?如果Javascript前端应用程序的MD5结果传到我的Erlang后端,我希望能够比较这两个摘要。我如何将Javascript的MD5摘要与Erlang的MD5摘要匹配?


4
http://sacharya.com/md5-in-erlang/ - Wrikken
1
嗯,只是让你知道,http://www.enchantedage.com/node/199 可能更正确... - Wrikken
5个回答

17

MD5哈希本质上是一个128位的数字。

在Erlang中以16个字节的二进制形式(16 * 8 = 128位)接收MD5值。需要将该二进制中的每个字节转换为十六进制表示,以便与JavaScript的MD5输出进行比较(它是一个十六进制字符串,每个字节有两个字符):

2> lists:flatten([io_lib:format("~2.16.0b", [B]) || <<B>> <= MD5]).
"00e081abefbbbf72b2d5258196a9b6d0"

首先,我们从二进制中取出每个字节,并使用io_lib模块将其格式化为十六进制字符串。然后,我们使用flatten函数将其显示为可读字符串(如果您要将该值写入文件或套接字,则不需要执行此步骤,因为它们能够处理深度io列表、嵌套的字符或二进制列表)。

使用的格式字符串~2.16.0b意味着使用基数16和填充字符0对整数进行宽度为2的填充(有关完整指南,请参见io:format/3)。

如果您想得到一个二进制,则可以使用以下二进制理解:

3> << << (list_to_binary(io_lib:format("~2.16.0b", [C])))/binary >>
     || <<C>> <= MD5 >>.
<<"00e081abefbbbf72b2d5258196a9b6d0">>

除了io_lib:format/2之外,还有http_util:integer_to_hexlist/1,尽管我不知道它是否更快。


4

另一个更快的版本:

hstr(B) when is_binary(B) ->
  << <<(hex(A)), (hex(B))>> || <<A:4,B:4>> <= B >>.

-compile({inline, [hex/1]}).

hex(0)  -> $0;
hex(1)  -> $1;
hex(2)  -> $2;
hex(3)  -> $3;
hex(4)  -> $4;
hex(5)  -> $5;
hex(6)  -> $6;
hex(7)  -> $7;
hex(8)  -> $8;
hex(9)  -> $9;
hex(10) -> $a;
hex(11) -> $b;
hex(12) -> $c;
hex(13) -> $d;
hex(14) -> $e;
hex(15) -> $f.

但最快的版本将是:
md5_hex(L) ->
  << A1:4, A2:4,  A3:4,  A4:4,  A5:4,  A6:4,  A7:4,  A8:4,
    A9:4,  A10:4, A11:4, A12:4, A13:4, A14:4, A15:4, A16:4,
    A17:4, A18:4, A19:4, A20:4, A21:4, A22:4, A23:4, A24:4,
    A25:4, A26:4, A27:4, A28:4, A29:4, A30:4, A31:4, A32:4
    >> = erlang:md5(L),
  << (hex(A1)), (hex(A2)),  (hex(A3)),  (hex(A4)),
    (hex(A5)),  (hex(A6)),  (hex(A7)),  (hex(A8)),
    (hex(A9)),  (hex(A10)), (hex(A11)), (hex(A12)),
    (hex(A13)), (hex(A14)), (hex(A15)), (hex(A16)),
    (hex(A17)), (hex(A18)), (hex(A19)), (hex(A20)),
    (hex(A21)), (hex(A22)), (hex(A23)), (hex(A24)),
    (hex(A25)), (hex(A26)), (hex(A27)), (hex(A28)),
    (hex(A29)), (hex(A30)), (hex(A31)), (hex(A32)) >>.

但是你不应该需要进行这种优化。

编辑:这个版本的hex/1甚至更快:

hex(X) ->
  element(X+1, {$0, $1, $2, $3, $4, $5, $6, $7, $8, $9, $a, $b, $c, $d, $e, $f}).

编辑2: 另一种方法:

md5_hex(L) ->
    <<X:128>> = erlang:md5(L),
    B = integer_to_binary(X,16),
    list_to_binary([lists:duplicate(32-byte_size(B),$0)|B]).

3
如果你需要一行代码,可以写成类似这样的形式:
1> B = erlang:md5("muzaaya").
<<0,224,129,171,239,187,191,114,178,213,37,129,150,169,
  182,208>>
2> lists:flatten([io_lib:format("~2.16.0b", [C]) || <<C>> <= B]).
"00e081abefbbbf72b2d5258196a9b6d0"

3
这里是位串推导式版本,可能是最快和最节省内存的方式:
hstr(B) when is_binary(B) ->
    T = {$0,$1,$2,$3,$4,$5,$6,$7,$8,$9,$a,$b,$c,$d,$e,$f},
    << <<(element(X bsr 4 + 1, T)), (element(X band 16#0F + 1, T))>>
    || <<X:8>> <= B >>.

3> M:hstr(erlang:md5("muzaaya")).

3> M:hstr(erlang:md5(“muzaaya”))。

4> <<"00e081abefbbbf72b2d5258196a9b6d0">>

4> <<“00e081abefbbbf72b2d5258196a9b6d0”>>


2
如果您想在JavaScript端执行此操作,可以使用以下代码。
function md5HexToArray ( hexStr ) {  
  var i, arr = [], arraylength = hexStr.length/2;

  for( i = 0; i < arraylength ; i++ ) {
     arr[i] = parseInt( hexStr.substr(i*2,2), 16) ;
  }

  return arr;
};

但是@Wrikken的评论看起来也应该可以完美地工作。

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接