我尝试在我们的C#应用程序中使用long作为唯一标识符(不是全局的,仅限于一个会话),用于我们的事件。您是否知道以下代码是否会生成唯一的long型标识符?
public long GenerateId()
{
byte[] buffer = Guid.NewGuid().ToByteArray();
return BitConverter.ToInt64(buffer, 0);
}
为什么我们不直接使用GUID呢?我们认为8个字节的长度已经足够了。
不会的。正如 Raymond Chen 的博客中多次强调的那样,GUID 被设计为整体上唯一的,如果你只截取其中一部分(例如只取其128位中的64位),它将失去其(伪)唯一性保证。
这里是内容:
一个客户需要生成一个8字节的唯一值,他们最初的想法是生成GUID并丢弃后半部分,只保留前8个字节。他们想知道这是否是一个好主意。
不,这不是一个好主意。 (...) 一旦你看到它是如何工作的,就清楚了,你不能仅仅丢弃GUID的一部分,因为所有的部分(除了固定的部分)共同工作以建立独特性。如果你拿走其中任何一个部分,算法都会崩溃。特别是,只保留前8个字节(64位)会给你时间戳和四个常量位;换句话说,你只有一个时间戳,而不是GUID。
由于它只是一个时间戳,所以可能会发生冲突。如果两台计算机同时生成一个这样的“截断GUID”,它们将生成相同的结果。或者如果系统时钟由于时钟重置而向后倒退,你将开始重新生成GUID,这些GUID是第一次出现在那个时间的。
我尝试在我们的C#应用程序中使用long作为唯一标识符(不是全局的,仅用于一个会话)来标识我们的事件。您知道以下内容是否会生成唯一的long id吗?
为什么不只使用计数器呢?
UUID
或GUID
在任何情况下都不能保证唯一性...只是非常不可能重复。 - Bobby如果要保持同样的唯一性程度,你不能将一个16位值压缩为8位。如果唯一性很重要,请不要自己编写任何东西。除非你真的知道自己在做什么,否则请坚持使用GUID。
如果相对简单的唯一性实现已经足够了,那么最好还是生成自己的ID,而不是从GUID中派生它们。下面的代码片段摘自我经常使用的“本地唯一标识符”类。它使得定义输出的长度和字符范围变得容易。
using System.Security.Cryptography;
using System.Text;
public class LUID
{
private static readonly RNGCryptoServiceProvider RandomGenerator = new RNGCryptoServiceProvider();
private static readonly char[] ValidCharacters = "ABCDEFGHJKLMNPQRSTUVWXYZ23456789".ToCharArray();
public const int DefaultLength = 6;
private static int counter = 0;
public static string Generate(int length = DefaultLength)
{
var randomData = new byte[length];
RandomGenerator.GetNonZeroBytes(randomData);
var result = new StringBuilder(DefaultLength);
foreach (var value in randomData)
{
counter = (counter + value) % (ValidCharacters.Length - 1);
result.Append(ValidCharacters[counter]);
}
return result.ToString();
}
}
[Fact]
public void Does_not_generate_collisions_within_reasonable_number_of_iterations()
{
var ids = new HashSet<string>();
var minimumAcceptibleIterations = 10000;
for (int i = 0; i < minimumAcceptibleIterations; i++)
{
var result = LUID.Generate();
Assert.True(!ids.Contains(result), $"Collision on run {i} with ID '{result}'");
ids.Add(result);
}
}
var s = Guid.NewGuid().ToString();
var h1 = s.Substring(0, s.Length / 2).GetHashCode(); // first half of Guid
var h2 = s.Substring(s.Length / 2).GetHashCode(); // second half of Guid
var result = (uint) h1 | (ulong) h2 << 32; // unique 8-byte long
var bytes = BitConverter.GetBytes(result);
顺便说一句,你们在这里与话题发起者聊天非常好。但是像我这样需要其他用户回答的问题呢?
是的,这将是很可能唯一的,但由于比GUID少的位数,重复的概率比GUID高-尽管仍然微不足道。
无论如何,GUID本身并不能保证唯一性。
像其他一些人说的那样,只获取GUID的一部分是破坏其唯一性的好方法。尝试使用如下代码:
var bytes = new byte[8];
using (var rng = new RNGCryptoServiceProvider())
{
rng.GetBytes(bytes);
}
Console.WriteLine(BitConverter.ToInt64(bytes, 0));
根据当前时间戳(以秒为单位)生成一个8字节的Ascii85标识符。每秒保证唯一性。在同一秒内生成5个标识符时,85%的几率不会发生冲突。
private static readonly Random Random = new Random();
public static string GenerateIdentifier()
{
var seconds = (int) DateTime.Now.Subtract(new DateTime(1970, 1, 1, 0, 0, 0)).TotalSeconds;
var timeBytes = BitConverter.GetBytes(seconds);
var randomBytes = new byte[2];
Random.NextBytes(randomBytes);
var bytes = new byte[timeBytes.Length + randomBytes.Length];
System.Buffer.BlockCopy(timeBytes, 0, bytes, 0, timeBytes.Length);
System.Buffer.BlockCopy(randomBytes, 0, bytes, timeBytes.Length, randomBytes.Length);
return Ascii85.Encode(bytes);
}
正如其他答案中大多数已经说过的那样:不,你不能只取GUID的一部分而不失去其唯一性。
如果你需要一个更短但仍然唯一的东西,请阅读Jeff Atwood的这篇博客文章:
Equipping our ASCII Armor
他展示了多种缩短GUID而不丢失信息的方法。最短的是20个字节(使用ASCII85编码)。
是的,这比你想要的8个字节长得多,但它是一个“真正”的唯一GUID……而所有试图将某些东西塞进8个字节中的尝试很可能不会真正唯一。
Int64
值。请定义:Unique
。需要保证哪个范围内的唯一性? - Bobby