将随机字节缩放到所选的整数范围内

4

我有一个由真正随机字节构成的文件。我想要一个函数,该函数将从文件中取出一个字节并对其进行缩放,返回指定范围内的随机整数(这个单词是否合适?)。

public int getInt(int l, int h) throws IOException {
    int m = (h - l) + 1;            // number of ranges needed
    int r = 256 / m;                // size of byte range
    int x = (r * m) - 1;            // maximum allowable byte value
    int b;
    do {
        try {                       // get random byte from file
            b = ram.readUnsignedByte();
        } catch (EOFException e) {  // catch EOF, reset pointer
            b = 255; ram.seek(0);   // and set b to maximum value
        }                           // so test will fail.
    } while(b > x);                 // if byte is greater than
                                    // allowable value, loop.
    return (b / r) + l;             // return random integer
}                                   // within requested range

这是我的函数。我担心通过缩放文件中的真随机字节来破坏它们的随机性。我读到需要丢弃任何超过允许最大值的数字(例如对于0-9的数字,最大值为249,因为我只有7个值可以分配给10个不同的组)。请问我的实现是否正确?

此外,我想知道,仅仅通过使某些太大的字节无效,是否会以任何方式扭曲分布?


抱歉,我错过了您提供的范围。我必须离开,所以我删除了我的答案,因为它没有处理范围。 - T.J. Crowder
没问题,我喜欢你读取更多字节并将它们移位以获得更大值的想法。虽然我以后可能会用到它,但我只是想确保这个基本实现没有破坏文件的任何随机性。 - chrissphinx
一个32位整数由四个字节组成。因此,您可以安全地读取4个字节并将它们视为一个有符号整数。 - Omar Al-Ithawi
我不是试图将4个字节的块视为int,而是使用单个字节来生成在函数中传递的范围(int l,int h)内的随机数。 - chrissphinx
@user1684045 为了明确:您想要取一个字节,然后在这些值之间进行缩放,如果 h-l>255,则创建“间隙”? - hyde
1个回答

1

为了避免偏差,您不能使用模数,必须丢弃不在范围内的结果。

编程成功的关键是将任务分解成适当的子任务。快速规格:

  1. 添加一个函数来计算存储给定数字所需的位数
  2. 添加一个类,该类从随机文件中读取和缓冲字节,并具有从文件中获取一些位数的整数(其余位为0)的方法。
  3. 添加实际的方法以获取您的随机数:
    • 计算结果范围,并从中计算所需的位数
    • 循环获取位,添加下限,如果结果超过上限则重试

关于步骤2的说明:第一次实现可能相当粗糙,例如,您可以只获取4个字节作为整数并丢弃额外的位。稍后,您可以优化此类以保留未使用的位并在下次使用它们,以避免浪费随机位。由于获得真正好的随机位通常有点昂贵,因此对于严肃使用,这种优化可能值得进行。

有关位操作,请参见例如此SO问题: Java“位移”教程?


好主意,有什么建议可以保留未使用的位? - chrissphinx
没有时间编写完整的示例代码,但最简单的方法是添加成员变量 int lastReadByte;int usedBitsInLastReadByte;,在一个方法中你也可以有临时变量 int unusedBits = 8 - this.usedBitsInLastReadByte;,然后剩下的就是位操作和读取下一个字节,当当前字节的所有8个位都被使用时,请参见我添加到答案本身的链接。 - hyde

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接