在Java中生成UUID字符串的高效方法(使用UUID.randomUUID().toString()但不包括破折号)

221

我希望有一个高效的工具来生成唯一的字节序列。UUID是一个不错的选择,但UUID.randomUUID().toString()生成类似于44e128a5-ac7a-4c9a-be4c-224b6bf81b20这样的字符串,虽然很好,但我更喜欢没有连字符的字符串。

我正在寻找一种高效的方法来生成随机字符串,只包含字母数字字符(没有连字符或其他特殊符号)。


45
为什么在将这样的UUID传输到HTTP时需要删除破折号? - Bruno
7
一般来说,我认为在HTTP中不需要删除破折号……是哪一部分让你感到困扰? - Jon Skeet
3
也许在移动环境中,如果你仍然需要为每个传输的字节付费,并且使用低带宽和高延迟的网络,在某些情况下节省4个字节仍然很重要... - Guido
3
我希望删除破折号,因为我们稍后将使用UUID字符串作为唯一请求标识符,仅使用十六进制字符[a-f0-9-]更容易处理。 - Maxim Veksler
1
我已删除HTTP部分,因为它不相关(正如Maxim所解释的那样),只会让读者感到困惑(正如评论和答案中所看到的)。 - Ondra Žižka
10个回答

358

这样做就可以了:

public static void main(String[] args) {
    final String uuid = UUID.randomUUID().toString().replace("-", "");
    System.out.println("uuid = " + uuid);
}

例如,Mongodb在ObjectID中不使用破折号。因此,删除破折号对于API可能是有用的。 - Alexey Ryazhskikh
1
我会告诉你原因。我正在使用一个 API(知名度很高,非常出名),它不允许其 UUID 中有破折号。所以你必须删除它们。 - Michael Gaines
28
不需要使用replaceAll函数,它使用了正则表达式。只需使用.replace("-", "")即可。 - Craigo
1
String类的replace方法有点慢,我觉得。 - bmscomp
@bmscomp 第一次调用时速度较慢,但对于后续的调用,没有问题。 - Gaurav

36

HTTP请求中的破折号不需要删除,就像您在本主题URL中看到的那样。但是,如果您想要准备格式正确的URL而不依赖于数据,您应该使用URLEncoder.encode(String data,String encoding)而不是更改数据的标准形式。对于UUID字符串表示形式,破折号是正常的。


在这个线程的URL中可以看到,HTTP请求中的破折号不需要被删除。除非Stack Overflow以前在他们的URL中使用了UUID? - RenniePet
2
请注意,URL 是 UUID,但它带有破折号:https://dev59.com/Cm865IYBdhLWcg3wceVU?rq=1 - Octavia Togami

16

我使用了JUG(Java UUID生成器)来生成唯一的ID。它在不同的JVM中也是唯一的,很适合使用。以下是相关代码作为参考:

private static final SecureRandom secureRandom = new SecureRandom();
private static final UUIDGenerator generator = UUIDGenerator.getInstance();

public synchronized static String generateUniqueId() {
  UUID uuid = generator.generateRandomBasedUUID(secureRandom);

  return uuid.toString().replaceAll("-", "").toUpperCase();
}

您可以从此处下载该库:https://github.com/cowtowncoder/java-uuid-generator


对于您的情况,UUID.randomUUID().toString() 有什么问题吗?请注意,通过保持静态最终SecureRandom(使其易失性),您(理论上)会降低熵。另外,为什么要同步generateUniqueId?这意味着所有线程都会在此方法上被阻塞。 - Maxim Veksler
1
首先,Safehaus声称JUG更快。它可以在多台机器上生成唯一的ID,而您可能并不需要这些。它们有基于时间的方法,这是所有方法中最快的方法。是的,在这里同步不是必要的,因为我意识到SecureRandom已经是线程安全的了。为什么在SecureRandom上声明静态final会降低熵?我很好奇 :)这里有更多细节: http://jug.safehaus.org/FAQ - Sheng Chien
JUG也可以生成基于随机数的UUID;但开发人员更喜欢使用基于时间的变体的主要原因是它的速度比随机数快10-20倍(http://www.cowtowncoder.com/blog/archives/2010/10/entry_429.html);或者他们不相信随机性能够产生唯一的ID(这有点有趣)。 - StaxMan
jug.safehaus.org不再存在,但您可以在https://raw.github.com/cowtowncoder/java-uuid-generator/3.0/release-notes/FAQ找到常见问题解答。 - Daniel Serodio
1
+1 提到 JUG - 我已经审查了它的有用性,但知道还有一些严肃的 java.util.UUID 替代方案是很好的。 - Greg Dubicki

15

一个简单的解决方案是

UUID.randomUUID().toString().replace("-", "")

这个解决方案与现有解决方案类似,只是避免了String#replaceAll的调用。这里不需要正则表达式替换,所以String#replace更自然,尽管在技术上仍然是使用正则表达式实现。考虑到UUID的生成比替换更昂贵,在运行时应该没有太大的差别。

对于大多数情况来说,使用UUID类可能已经足够快了,尽管我期望某些专门编写的变体可以更快,因为它们不需要后期处理。无论如何,整个计算的瓶颈通常都将是随机数生成器。对于UUID类,它使用SecureRandom

选择使用哪个随机数生成器也是一个权衡,这取决于应用程序。如果安全性很重要,则通常建议使用SecureRandom。否则,ThreadLocalRandom是一种替代方法(比SecureRandom或旧的Random更快,但不具有密码学安全性)。


14

最终我根据UUID.java实现了自己的代码。请注意,我不是在生成UUID,而只是以我认为最有效的方式生成了32字节的随机十六进制字符串。

实现

import java.security.SecureRandom;
import java.util.UUID;

public class RandomUtil {
    // Maxim: Copied from UUID implementation :)
    private static volatile SecureRandom numberGenerator = null;
    private static final long MSB = 0x8000000000000000L;

    public static String unique() {
        SecureRandom ng = numberGenerator;
        if (ng == null) {
            numberGenerator = ng = new SecureRandom();
        }

        return Long.toHexString(MSB | ng.nextLong()) + Long.toHexString(MSB | ng.nextLong());
    }       
}

用法

RandomUtil.unique()

测试

以下是我测试过的一些输入,以确保它可以正常工作:

public static void main(String[] args) {
    System.out.println(UUID.randomUUID().toString());
    System.out.println(RandomUtil.unique());

    System.out.println();
    System.out.println(Long.toHexString(0x8000000000000000L |21));
    System.out.println(Long.toBinaryString(0x8000000000000000L |21));
    System.out.println(Long.toHexString(Long.MAX_VALUE + 1));
}

1
不确定为什么这个被投票得更高,这是所有选项中生成没有“-”的UUID最有效的方法。字符串替换并不比从长整型转换为字符串更好。虽然两者都是O(n),但在你每分钟生成数百万个UUID的规模下,它变得有意义了。 - Maxim Veksler

10

看到有这么多关于UUID的字符串替换方法,真是让我感到惊讶。那么这个怎么样:

UUID temp = UUID.randomUUID();
String uuidString = Long.toHexString(temp.getMostSignificantBits())
     + Long.toHexString(temp.getLeastSignificantBits());

这是最快的方法,因为UUID的整个toString()已经更加昂贵,更不用说必须解析和执行的正则表达式或替换为空字符串。


7
不可靠,如果前导位为0,则输出将更短。 - OG Dude
8
String.format("0x%016x%016x", f.getMostSignificantBits(), f.getLeastSignificantBits()) 可以翻译为:使用 String.format 方法格式化输出一个 16 进制字符串,其中包含两个长整型数值 f.getMostSignificantBits()f.getLeastSignificantBits()。第一个长整型数值表示 UUID 生成器生成的高位 64 位,第二个长整型数值表示低位 64 位。 - galets
@galets 虽然我已经为你解决了前导0的问题而点赞,但我想知道与使用“replace”替换破折号的替代方法相比,这种方法是否更好。 - igorcadelima
1
String.format很慢。 - Mike

6

我刚刚复制了UUID toString()方法并将其更新以删除其中的"-"。这种方法比其他任何解决方案都更快速和直接。

public String generateUUIDString(UUID uuid) {
    return (digits(uuid.getMostSignificantBits() >> 32, 8) +
            digits(uuid.getMostSignificantBits() >> 16, 4) +
            digits(uuid.getMostSignificantBits(), 4) +
            digits(uuid.getLeastSignificantBits() >> 48, 4) +
            digits(uuid.getLeastSignificantBits(), 12));
}

/** Returns val represented by the specified number of hex digits. */
private String digits(long val, int digits) {
    long hi = 1L << (digits * 4);
    return Long.toHexString(hi | (val & (hi - 1))).substring(1);
}

使用方法:

generateUUIDString(UUID.randomUUID())

另一种使用反射的实现方式

public String generateString(UUID uuid) throws NoSuchMethodException, InvocationTargetException, IllegalAccessException {

    if (uuid == null) {
        return "";
    }

    Method digits = UUID.class.getDeclaredMethod("digits", long.class, int.class);
    digits.setAccessible(true);

    return ( (String) digits.invoke(uuid, uuid.getMostSignificantBits() >> 32, 8) +
            digits.invoke(uuid, uuid.getMostSignificantBits() >> 16, 4) +
            digits.invoke(uuid, uuid.getMostSignificantBits(), 4) +
            digits.invoke(uuid, uuid.getLeastSignificantBits() >> 48, 4) +
            digits.invoke(uuid, uuid.getLeastSignificantBits(), 12));

}

2
我使用 org.apache.commons.codec.binary.Base64 将 UUID 转换为长度为 22 的 url 安全唯一字符串,并且具有与 UUID 相同的唯一性。
我在 Storing UUID as base64 String 上发布了我的代码。

2

既然UUID在toString()方法中添加了连字符,我们可以从Java自带的实现中借鉴这个实现,将字节数组缩短为32并调整偏移量。

        public static String special() {
            UUID uuid = UUID.randomUUID();
            return fastUUID(uuid.getLeastSignificantBits(), uuid.getMostSignificantBits());
        }

        private static String fastUUID(long lsb, long msb) {
            byte[] buf = new byte[32];
            formatUnsignedLong0(lsb,        4, buf, 20, 12);
            formatUnsignedLong0(lsb >>> 48, 4, buf, 16, 4);

            formatUnsignedLong0(msb,        4, buf, 12, 4);
            formatUnsignedLong0(msb >>> 16, 4, buf, 8,  4);
            formatUnsignedLong0(msb >>> 32, 4, buf, 0,  8);

            return new String(buf, 0);
        }

        private static final char[] digits = {
                '0' , '1' , '2' , '3' , '4' , '5' ,
                '6' , '7' , '8' , '9' , 'a' , 'b' ,
                'c' , 'd' , 'e' , 'f' , 'g' , 'h' ,
                'i' , 'j' , 'k' , 'l' , 'm' , 'n' ,
                'o' , 'p' , 'q' , 'r' , 's' , 't' ,
                'u' , 'v' , 'w' , 'x' , 'y' , 'z'
        };
        private static void formatUnsignedLong0(long val, int shift, byte[] buf, int offset, int len) {
            int charPos = offset + len;
            int radix = 1 << shift;
            int mask = radix - 1;
            do {
                buf[--charPos] = (byte)digits[((int) val) & mask];
                val >>>= shift;
            } while (charPos > offset);
        }

运行它:

        public static void main(String[] args) {
            IntStream.range(0, 100).forEach(i-> {
                System.out.println(special());
            });
        }

生成:

23f57da8a2784bb5acca553030f82e61
a14427efd8d147fdae315c1cf20fc53c
ee972aa1cf85414ca364bef5c74a7e57
6877ef35eab94b9485c5dd7c8c5a8a56
578721476629422381c0f625e22564a8
dbf60f068b5443d7bc6e5280696fed9f
dd611e870700480d81d394dd2125316c
04d71b9379ef4db49c28e113485ea76d
fd4e8cf3f85a45ae8c1b9bfe3e489a4a
858c4e8297f849b784b65b6096dec4d4
b30a8ca318a349b486b5693814422555
351c2fab9bc1426fa3bb512484628f12
9ce59e01db38405aab82d46f2a236880
5ffb5acb547a4f15a4621b406391bc0d
541b5fba8ddb4f1ebbd59cdcd5f59f7c
77f9460c4baa43a7bbaaf7f2aff205bd
85fa5254305b4c72b1b7c0103aaee269
062d45aa86694b06aad841236b839341
7a265293560f4223ab8248fda502c89b
b748c13ac45747b99aead4b0a2d7d179
cbcbf623c75d407fa3c88cfc89a90ed4
da263eed8771496faebb6290527f77fa
22231088dec04cffa40fb79ff56c6453
594a66de4b874b3491649c5d033917f6
4f6802ebd0cc4a39b25a67191c3af09d
8878b7ab8aa445cdadbef0f7c70d3deb
2c3ed0154f0c4ddbad498b7ae928b9bc
cac1dcaa80e54e2db3248987d2dbda4a
f9a3567e6dd54bf5900444c8b1c03815
f0d25d7b615a4495b51c01ab15093a88
243e45926311437c8b26cede2dc7de25
e4738c50e4cd448fbac252571c0907df
261d3593cc054569bcd645885d22c2ee
64a4796356a04cc4a09506aeb6f5b8fd
9aeebcbdde074ed69738589ca9bde0f1
ec040c956861466b84ed7f7cec601be0
18bd233781e44e7cb152800db4c4edc7
1b7b251df1244e8db46a45c186aada2b
3e32f644c9074cb3bbb15c5be1d9b95e
625309e3ffd14a90bfbd6d48142ac60e
664f0cf347ce4767add576da584526e7
fe3893fd376849fe9fed00e328e61470
254ce1441bbf4a7eae1cdf8d288e61e8
90896c6b309a49f48cc3b7a1570e1846
5f47acd1319245648098c1aec9b95f23
f798033052614b9eae8da7eba4ba3475
3471c4320e4e431eb1fa9f5eb5cb21e0
855f473fed034b1fa17f4f65b850e03b
1245de826d0d4373bdd4cf2157792954
543a8b16efca4fa2b5263315e8b21660
2dc186d699274257922853d783c0ec13
a92e6b1783db4b49a4aaa424b9e1b03f
16773feb48054cf0942a2a27204b3572
1e58da2107ac4ee39e28a93b32e1df1d
67622c19498d4178a1bab6b19087f2c2
412b6b4474fc43ccbeb1e7707b6420ee
7d0fd632913c425eb5f087600ccea870
439687baddb44852a43048b04d38427c
8b2dcc4e50464429a18b11e4aacf51a2
2fccb1c832894fe6b0b61bbdf175cd39
6d224b3d6e8747319fcf01b0309d8a0f
b4982e3b4b594cb4b334c95c2c96355e
c47fbaf90d1d4e9caf211f93b742631f
9440271e8ba6447d9a008e89a93016a6
8d24274b6a3f436a88362438aa6a221d
60452bd3f71747ed8c3706abb2235bd5
6fa93f2ee30740b89496439dd7227a4f
cc17504cf80641f882c8665ae166ba44
743efe8eac6e47a789928da4fb5b6f70
4c4d2df3461448c4a3e934cf4a7ea74f
b231eb3fb46240d38157764e8906aa7b
a234ae65f7ed48f6b1887644eed36cc2
c9cd5ed3df3f4a27957b45498f0c48ef
3eb2fbbb0a714bb7986aef3ee34f0254
d15968e605f0440c9e740e3f4e498a9f
63a8d50e8db24b91a13d4ac2fb6f7d5b
5377df9296154c57926672ca8b3c9478
a4db4a3a9d5148648a23aa7f4f77f1e0
d0aee355a2ba42de89d659385514b0fa
e92e7702481a4575a66d59c061459c5b
1b6c542d8f994d85a1312ab2cf4545ce
88e347a515474ec59013673e5402b97f
2187d9b2dc2b4d96baceade5ae99db44
4d641e69ca5b4acf90f8afe238d8a940
9c0f4c101c434831b928114c5fc0c401
140e16f6cf134785a98ae9baee5b9e7b
4dac5910f4d047e1b213c058e2230bf3
fb50a7e6333f49e4b469234426d5002f
c96c5f2fa167458eaa6d01997d90a980
1e79721e587c4a92aa55cdf8195c8c55
0da27fc5d8384ce299197b4e06cda1d4
a5e32d9cf5834e86b3fe02bc0e3104d6
2dc1826647594b1fb728de67d3df363c
0276371815254198bd22cc76f901b332
bf9d77b7b4a64e7a97ade2a62af1f8e0
268cce3249f64895b6b47e86cf296e5b
d523201fc950435f803bf89d5f042c45
607a4306b90b467f8b19c2c943bc92ef
adfa9fb63a874ca1ad746ff573f03f28
fe88132c70d141e8839ce9e7f0308750

应该与Java实际上一样高效(甚至更高效)。


1
这个实用类可以生成带有或不带有破折号的UUID字符串。
package your.package.name;

import java.security.SecureRandom;
import java.util.Random;

/**
 * Utility class that creates random-based UUIDs.
 * 
 */
public abstract class RandomUuidStringCreator {

    private static final int RANDOM_VERSION = 4;

    /**
     * Returns a random-based UUID as String.
     * 
     * It uses a thread local {@link SecureRandom}.
     * 
     * @return a random-based UUID string
     */
    public static String getRandomUuid() {
        return getRandomUuid(SecureRandomLazyHolder.SECURE_RANDOM);
    }

    /**
     * Returns a random-based UUID as String WITH dashes.
     * 
     * It uses a thread local {@link SecureRandom}.
     * 
     * @return a random-based UUID string
     */
    public static String getRandomUuidWithDashes() {
        return format(getRandomUuid());
    }

    /**
     * Returns a random-based UUID String.
     * 
     * It uses any instance of {@link Random}.
     * 
     * @return a random-based UUID string
     */
    public static String getRandomUuid(Random random) {

        long msb = 0;
        long lsb = 0;

        // (3) set all bit randomly
        if (random instanceof SecureRandom) {
            // Faster for instances of SecureRandom
            final byte[] bytes = new byte[16];
            random.nextBytes(bytes);
            msb = toNumber(bytes, 0, 8); // first 8 bytes for MSB
            lsb = toNumber(bytes, 8, 16); // last 8 bytes for LSB
        } else {
            msb = random.nextLong(); // first 8 bytes for MSB
            lsb = random.nextLong(); // last 8 bytes for LSB
        }

        // Apply version and variant bits (required for RFC-4122 compliance)
        msb = (msb & 0xffffffffffff0fffL) | (RANDOM_VERSION & 0x0f) << 12; // apply version bits
        lsb = (lsb & 0x3fffffffffffffffL) | 0x8000000000000000L; // apply variant bits

        // Convert MSB and LSB to hexadecimal
        String msbHex = zerofill(Long.toHexString(msb), 16);
        String lsbHex = zerofill(Long.toHexString(lsb), 16);

        // Return the UUID
        return msbHex + lsbHex;
    }

    /**
     * Returns a random-based UUID as String WITH dashes.
     * 
     * It uses a thread local {@link SecureRandom}.
     * 
     * @return a random-based UUID string
     */
    public static String getRandomUuidWithDashes(Random random) {
        return format(getRandomUuid(random));
    }

    private static long toNumber(final byte[] bytes, final int start, final int length) {
        long result = 0;
        for (int i = start; i < length; i++) {
            result = (result << 8) | (bytes[i] & 0xff);
        }
        return result;
    }

    private static String zerofill(String string, int length) {
        return new String(lpad(string.toCharArray(), length, '0'));
    }

    private static char[] lpad(char[] chars, int length, char fill) {

        int delta = 0;
        int limit = 0;

        if (length > chars.length) {
            delta = length - chars.length;
            limit = length;
        } else {
            delta = 0;
            limit = chars.length;
        }

        char[] output = new char[chars.length + delta];
        for (int i = 0; i < limit; i++) {
            if (i < delta) {
                output[i] = fill;
            } else {
                output[i] = chars[i - delta];
            }
        }
        return output;
    }

    private static String format(String string) {
        char[] input = string.toCharArray();
        char[] output = new char[36];

        System.arraycopy(input, 0, output, 0, 8);
        System.arraycopy(input, 8, output, 9, 4);
        System.arraycopy(input, 12, output, 14, 4);
        System.arraycopy(input, 16, output, 19, 4);
        System.arraycopy(input, 20, output, 24, 12);

        output[8] = '-';
        output[13] = '-';
        output[18] = '-';
        output[23] = '-';

        return new String(output);
    }

    // Holds lazy secure random
    private static class SecureRandomLazyHolder {
        static final Random SECURE_RANDOM = new SecureRandom();
    }

    /**
     * For tests!
     */
    public static void main(String[] args) {

        System.out.println("// Using `java.security.SecureRandom` (DEFAULT)");
        System.out.println("RandomUuidCreator.getRandomUuid()");
        System.out.println();
        for (int i = 0; i < 5; i++) {
            System.out.println(RandomUuidStringCreator.getRandomUuid());
        }

        System.out.println();
        System.out.println("// Using `java.util.Random` (FASTER)");
        System.out.println("RandomUuidCreator.getRandomUuid(new Random())");
        System.out.println();
        Random random = new Random();
        for (int i = 0; i < 5; i++) {
            System.out.println(RandomUuidStringCreator.getRandomUuid(random));
        }
    }
}


这是输出内容:
// Using `java.security.SecureRandom` (DEFAULT)
RandomUuidStringCreator.getRandomUuid()

'f553ca75657b4b5d85bedf1082785a0b'
'525ecc389e934f209b97d0f0db09d9c6'
'93ec6425bb04499ab47b790fd013ab0d'
'c2d438c620ea4cd5baafd448f9fe945b'
'fb4bc5734931415e94e78da62cb5fe0d'

// Using `java.util.Random` (FASTER)
RandomUuidStringCreator.getRandomUuid(new Random())

'051360b5c92d40fbbb89b40842adbacc'
'a993896538aa43faacbcfd83f913f38b'
'720684d22c584d5299cb03cdbc1912d2'
'82cf94ea296a4a138a92825a0068d4a1'
'a7eda46a215c4e55be3aa957ba74ca9c'

uuid-creator中有一个编解码器可以更高效地完成此任务:Base16Codec。例如:

// Returns a base-16 string
// It is much faster than doing `uuid.toString().replaceAll("-", "")`.
UuidCodec<String> codec = new Base16Codec();
String string = codec.encode(UUID.randomUUID());

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接