18得票10回答
如何高效计算二项式累积分布函数?

假设我知道“成功”的概率是P。我运行测试N次,并看到S个成功。这个测试类似于抛硬币(也许正面朝上是成功,反面朝上则是失败)。 我想知道看到S个成功或比S个成功更少的成功次数的近似概率。 所以例如,如果P是0.3,N是100,我得到20个成功,那么我要求得的是获得20个或更少成功的概率。 ...

18得票6回答
生成N个数字使它们的和为1。

给定一个大小为n的数组,我想为每个索引生成随机概率,使得Sigma(a[0]..a[n-1])=1 一个可能的结果是:0 1 2 3 4 0.15 0.2 0.18 0.22 0.25 另一个完全合法的结果可以是:0 1 2 3...

18得票6回答
一个6位随机字母数字代码发生碰撞的概率是多少?

我正在使用以下Perl代码生成随机的字母数字字符串(仅包括大写字母和数字),用作MySQL数据库记录的唯一标识符。该数据库可能会保持在100万行以下,但绝对的最大值将约为300万行。 我的问题是有没有危险两条记录具有相同的随机代码,或者这种情况只会发生极少次数?由于我对概率知之甚少(如果从这个...

18得票6回答
第N个组合

有没有直接获取nCr所有组合的有序集合中第N个组合的方法? 例如:我有四个元素:[6, 4, 2, 1]。取其中三个的所有可能组合为:[[6, 4, 2], [6, 4, 1], [6, 2, 1], [4, 2, 1]]。 是否有一种算法能够让我直接获取有序结果集中第三个答案 [6, 2...

18得票2回答
LightGBM中的predict_proba()函数是如何内部工作的?

这是关于理解如何使用LightGBM预测类别概率的内部细节。 其他软件包,如sklearn,为它们的分类器提供了详细的说明。例如: LogisticRegression返回: 概率估计。 所有类别的返回估计值都按类别标签排序。 对于多类问题,如果将multi_class设置为“mu...

18得票3回答
50000个随机生成的7位十六进制字符串之间为什么没有发生碰撞?(生日悖论问题)

我遇到了一些生成多个UUID的代码,使用UUID.randomUUID(),取每个UUID的最后7位数字(最近的UUID版本在熵方面是均匀分布的),并将其用作插入行到数据库中的键。 我想知道碰撞的概率是多少。我记得生日问题。这就是那个问题的一个实例,不是吗?一年有365天,而这里有16^7个...

17得票2回答
Effective Java 条款47:了解并使用你的类库 - 有缺陷的随机整数方法示例

在Josh提供的例子中,展示了一种存在缺陷的随机方法,该方法可生成一个给定上限n的正随机数。我不理解他所谈到的两种缺陷。 书中的方法如下:private static final Random rnd = new Random(); //Common but deeply flawed s...

17得票5回答
按Zipf分布生成随机数

Zipf概率分布常被用于建模P2P系统中文件大小分布或项目访问分布,例如“Web Caching and Zip like Distribution Evidence and Implications”,但是Boost和GSL(Gnu Scientific Library)都没有提供使用该分布...

17得票8回答
创建自己的Tinyurl风格uid

我正在撰写一篇有关人类可读的 Guid/UID 的替代方案的小文章,例如 TinyURL 用于 URL 哈希值的方式(这些哈希值通常会在杂志中打印出来,因此需要很短)。 我生成的简单 UID —— 6 个字符:小写字母(a-z)或数字 0-9。 "根据我的计算,船长", 这是 6 个互斥事...

16得票4回答
64位哈希码碰撞的概率

《Numerical Recipes》这本书提供了一种计算64位哈希码以减少碰撞的方法。 该算法在http://www.javamex.com/tutorials/collections/strong_hash_code_implementation_2.shtml上展示,以下是摘录: p...