在范围内生成不同的随机数

Question

在范围内生成不同的随机数

4

我希望生成n个不同的数字，这些数字在1到N之间（当然n<=N）。N可能非常大。如果n很小，一种有效的方法是生成一个数字并将其与我们已经得到的集合进行比较，以确保它是一个新数字。它需要O(n^2)时间和O(n)内存。如果n相当大，我们可以使用Fisher-Yates随机置换算法生成随机排列（在n步后停止）。它需要O(n)时间，但我们也必须使用O(N)内存。

问题在于，如果我们不知道n有多大怎么办？我希望该算法只使用O(n)内存，并在O(n)时间内停止。这是否可能？

- nicolas.wong

这是一个相当差的副本 - N 在此处为1000，这里可能是“非常大的”。 - jrok

@j_random_hacker 这使用的是O(N)内存（而不是O(n)）。 - Bernhard Barker

1

@Floris：我的理解是他们想要一个在线算法——也就是说，随时可以廉价地添加新的、不同的样本。 - j_random_hacker

1

如果你将集合实现为哈希表，你可以获得O(1)的时间复杂度（至少是期望时间）。 - Jerry Coffin

@JerryCoffin：你说得对，我把n和N搞混了...但不知怎么地只是在哈希表中出现了这种情况，而不是在树中！ - j_random_hacker

显示剩余4条评论

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- bames53 · Answer 1

对于非常小的n，您可以基本上做相同的事情，但只需使该检查更有效。例如，检查是否已生成数字的天真方法是仅线性搜索先前生成的值列表。对于未知的n，您可以保持先前生成的值集合排序，以便可以使用更高效的搜索来识别重复项。使用天真方法，算法需要O(n²)时间，但通过对先前结果进行更智能的搜索，可以将其减少到O(n*log₂n)。