我有7个文件需要生成MD5哈希值,这些哈希值用于确保远程数据存储的副本与本地副本完全相同。不幸的是,这两个数据存储副本之间的链接非常缓慢。虽然数据更改很少,但我有一个要求,即数据始终(或尽快)同步。为了避免在极慢的通信链路上传输7个不同的MD5哈希值,我想为每个文件生成哈希值,然后将这些哈希值组合成一个单一的哈希值来进行传输,然后在远程端重新计算/使用比较。如果“组合哈希”不同,则开始发送7个单独的哈希值,以确定哪些文件已更改。例如,以下是上周7个文件的MD5哈希值:
我想将这些哈希值组合在一起,使其成为一个单独的唯一值(也许是另一个MD5哈希值)。我可以把它发送到远程系统。在远程系统上,我将执行相同的计算以确定数据整体是否已更改。如果是,那么我将开始发送各个哈希值等。最重要的因素是我的“组合哈希”要足够短,以便使用的带宽比仅在第一次发送所有7个哈希值时少。我考虑过将7个MD5哈希值写入文件,然后对该文件进行哈希处理,但是否有更好的方法?
0709d609d69385255c496436eb50402c
709465a74411bd596595c7b9b158ae6a
4ab657320ef33e3d5eb498e4c13d41b7
3b49c6ab199994fd776bb63761414e72
0fc28c5a010fc3c06c0c930c88e31a15
c4ecd214662cac5aae0e53f6f252bf0e
8b086431e43148a2c2d943ba30d31cc6
我想将这些哈希值组合在一起,使其成为一个单独的唯一值(也许是另一个MD5哈希值)。我可以把它发送到远程系统。在远程系统上,我将执行相同的计算以确定数据整体是否已更改。如果是,那么我将开始发送各个哈希值等。最重要的因素是我的“组合哈希”要足够短,以便使用的带宽比仅在第一次发送所有7个哈希值时少。我考虑过将7个MD5哈希值写入文件,然后对该文件进行哈希处理,但是否有更好的方法?