




我认为真正的分布应该是第一象限中的双曲线... 我只是想不出如何将线性、均匀分布的随机数转化为双曲线分布(如果双曲线分布是我想要的东西的话)。



  • 40 - 70: 0.02% - 0.05%
  • 10 - 40: 0.5% - 1%
  • 1 - 10: 10% - 20%
  • 0 - 1 : 剩余部分(78.95% - 89.48%)

我找到了这个统计学词汇表[http://www.stats.gla.ac.uk/steps/glossary/probability_distributions.html#cdf]。它可能会有所帮助。 - IAbstract
我不太明白。您是否有10k个介于0和70之间的浮点数,想要分配到150k个集合中? - Jonas Elfström
@Jonas Elfström:嗯,反过来说。我想生成150k个具有指定分布的随机浮点数... - ircmaxell




编辑 哦,为了从均匀分布(0,1)的值U生成Weibull分布的随机变量,只需计算b*[-log(1-u)]^(1/a)。这是1-P(X>x)的反函数,以防我计算错误。

哇,那看起来几乎和我想要的结果集一模一样(4 > 40,60 > 10,1030 > 1)。太好了!谢谢! - ircmaxell
你有没有可能更新你的回答并提供可用的PHP代码? - designosis




define( 'RandomGaussian',           'gaussian' ) ;          //  gaussianWeightedRandom()
define( 'RandomBell',               'bell' ) ;              //  bellWeightedRandom()
define( 'RandomGaussianRising',     'gaussianRising' ) ;    //  gaussianWeightedRisingRandom()
define( 'RandomGaussianFalling',    'gaussianFalling' ) ;   //  gaussianWeightedFallingRandom()
define( 'RandomGamma',              'gamma' ) ;             //  gammaWeightedRandom()
define( 'RandomGammaQaD',           'gammaQaD' ) ;          //  QaDgammaWeightedRandom()
define( 'RandomLogarithmic10',      'log10' ) ;             //  logarithmic10WeightedRandom()
define( 'RandomLogarithmic',        'log' ) ;               //  logarithmicWeightedRandom()
define( 'RandomPoisson',            'poisson' ) ;           //  poissonWeightedRandom()
define( 'RandomDome',               'dome' ) ;              //  domeWeightedRandom()
define( 'RandomSaw',                'saw' ) ;               //  sawWeightedRandom()
define( 'RandomPyramid',            'pyramid' ) ;           //  pyramidWeightedRandom()
define( 'RandomLinear',             'linear' ) ;            //  linearWeightedRandom()
define( 'RandomUnweighted',         'non' ) ;               //  nonWeightedRandom()

function mkseed()
    srand(hexdec(substr(md5(microtime()), -8)) & 0x7fffffff) ;
}   //  function mkseed()

function factorial($in) {
    if ($in == 1) {
        return $in ;
    return ($in * factorial($in - 1.0)) ;
}   //  function factorial()

function factorial($in) {
    $out = 1 ;
    for ($i = 2; $i <= $in; $i++) {
        $out *= $i ;

    return $out ;
}   //  function factorial()

function random_0_1()
    //  returns random number using mt_rand() with a flat distribution from 0 to 1 inclusive
    return (float) mt_rand() / (float) mt_getrandmax() ;
}   //  random_0_1()

function random_PN()
    //  returns random number using mt_rand() with a flat distribution from -1 to 1 inclusive
    return (2.0 * random_0_1()) - 1.0 ;
}   //  function random_PN()

function gauss()
    static $useExists = false ;
    static $useValue ;

    if ($useExists) {
        //  Use value from a previous call to this function
        $useExists = false ;
        return $useValue ;
    } else {
        //  Polar form of the Box-Muller transformation
        $w = 2.0 ;
        while (($w >= 1.0) || ($w == 0.0)) {
            $x = random_PN() ;
            $y = random_PN() ;
            $w = ($x * $x) + ($y * $y) ;
        $w = sqrt((-2.0 * log($w)) / $w) ;

        //  Set value for next call to this function
        $useValue = $y * $w ;
        $useExists = true ;

        return $x * $w ;
}   //  function gauss()

function gauss_ms( $mean,
                   $stddev )
    //  Adjust our gaussian random to fit the mean and standard deviation
    //  The division by 4 is an arbitrary value to help fit the distribution
    //      within our required range, and gives a best fit for $stddev = 1.0
    return gauss() * ($stddev/4) + $mean;
}   //  function gauss_ms()

function gaussianWeightedRandom( $LowValue,
                                 $stddev=2.0 )
    //  Adjust a gaussian random value to fit within our specified range
    //      by 'trimming' the extreme values as the distribution curve
    //      approaches +/- infinity
    $rand_val = $LowValue + $maxRand ;
    while (($rand_val < $LowValue) || ($rand_val >= ($LowValue + $maxRand))) {
        $rand_val = floor(gauss_ms($mean,$stddev) * $maxRand) + $LowValue ;
        $rand_val = ($rand_val + $maxRand) / 2 ;

    return $rand_val ;
}   //  function gaussianWeightedRandom()

function bellWeightedRandom( $LowValue,
                             $maxRand )
    return gaussianWeightedRandom( $LowValue, $maxRand, 0.0, 1.0 ) ;
}   //  function bellWeightedRandom()

function gaussianWeightedRisingRandom( $LowValue,
                                       $maxRand )
    //  Adjust a gaussian random value to fit within our specified range
    //      by 'trimming' the extreme values as the distribution curve
    //      approaches +/- infinity
    //  The division by 4 is an arbitrary value to help fit the distribution
    //      within our required range
    $rand_val = $LowValue + $maxRand ;
    while (($rand_val < $LowValue) || ($rand_val >= ($LowValue + $maxRand))) {
        $rand_val = $maxRand - round((abs(gauss()) / 4) * $maxRand) + $LowValue ;

    return $rand_val ;
}   //  function gaussianWeightedRisingRandom()

function gaussianWeightedFallingRandom( $LowValue,
                                        $maxRand )
    //  Adjust a gaussian random value to fit within our specified range
    //      by 'trimming' the extreme values as the distribution curve
    //      approaches +/- infinity
    //  The division by 4 is an arbitrary value to help fit the distribution
    //      within our required range
    $rand_val = $LowValue + $maxRand ;
    while (($rand_val < $LowValue) || ($rand_val >= ($LowValue + $maxRand))) {
        $rand_val = floor((abs(gauss()) / 4) * $maxRand) + $LowValue ;

    return $rand_val ;
}   //  function gaussianWeightedFallingRandom()

function logarithmic($mean=1.0, $lambda=5.0)
    return ($mean * -log(random_0_1())) / $lambda ;
}   //  function logarithmic()

function logarithmicWeightedRandom( $LowValue,
                                    $maxRand )
    do {
        $rand_val = logarithmic() ;
    } while ($rand_val > 1) ;

    return floor($rand_val * $maxRand) + $LowValue ;
}   //  function logarithmicWeightedRandom()

function logarithmic10( $lambda=0.5 )
    return abs(-log10(random_0_1()) / $lambda) ;
}   //  function logarithmic10()

function logarithmic10WeightedRandom( $LowValue,
                                      $maxRand )
    do {
        $rand_val = logarithmic10() ;
    } while ($rand_val > 1) ;

    return floor($rand_val * $maxRand) + $LowValue ;
}   //  function logarithmic10WeightedRandom()

function gamma( $lambda=3.0 )
    $wLambda = $lambda + 1.0 ;
    if ($lambda <= 8.0) {
        //  Use direct method, adding waiting times
        $x = 1.0 ;
        for ($j = 1; $j <= $wLambda; $j++) {
            $x *= random_0_1() ;
        $x = -log($x) ;
    } else {
        //  Use rejection method
        do {
            do {
                //  Generate the tangent of a random angle, the equivalent of
                //      $y = tan(pi * random_0_1())
                do {
                    $v1 = random_0_1() ;
                    $v2 = random_PN() ;
                } while (($v1 * $v1 + $v2 * $v2) > 1.0) ;
                $y = $v2 / $v1 ;
                $s = sqrt(2.0 * $lambda + 1.0) ;
                $x = $s * $y + $lambda ;
            //  Reject in the region of zero probability
            } while ($x <= 0.0) ;
            //  Ratio of probability function to comparison function
            $e = (1.0 + $y * $y) * exp($lambda * log($x / $lambda) - $s * $y) ;
        //  Reject on the basis of a second uniform deviate
        } while (random_0_1() > $e) ;

    return $x ;
}   //  function gamma()

function gammaWeightedRandom( $LowValue,
                              $maxRand )
    do {
        $rand_val = gamma() / 12 ;
    } while ($rand_val > 1) ;

    return floor($rand_val * $maxRand) + $LowValue ;
}   //  function gammaWeightedRandom()

function QaDgammaWeightedRandom( $LowValue,
                                 $maxRand )
    return round((asin(random_0_1()) + (asin(random_0_1()))) * $maxRand / pi()) + $LowValue ;
}   //  function QaDgammaWeightedRandom()

function gammaln($in)
    $tmp = $in + 4.5 ;
    $tmp -= ($in - 0.5) * log($tmp) ;

    $ser = 1.000000000190015
            + (76.18009172947146 / $in)
            - (86.50532032941677 / ($in + 1.0))
            + (24.01409824083091 / ($in + 2.0))
            - (1.231739572450155 / ($in + 3.0))
            + (0.1208650973866179e-2 / ($in + 4.0))
            - (0.5395239384953e-5 / ($in + 5.0)) ;

    return (log(2.5066282746310005 * $ser) - $tmp) ;
}   //  function gammaln()

function poisson( $lambda=1.0 )
    static $oldLambda ;
    static $g, $sq, $alxm ;

    if ($lambda <= 12.0) {
        //  Use direct method
        if ($lambda <> $oldLambda) {
            $oldLambda = $lambda ;
            $g = exp(-$lambda) ;
        $x = -1 ;
        $t = 1.0 ;
        do {
            ++$x ;
            $t *= random_0_1() ;
        } while ($t > $g) ;
    } else {
        //  Use rejection method
        if ($lambda <> $oldLambda) {
            $oldLambda = $lambda ;
            $sq = sqrt(2.0 * $lambda) ;
            $alxm = log($lambda) ;
            $g = $lambda * $alxm - gammaln($lambda + 1.0) ;
        do {
            do {
                //  $y is a deviate from a Lorentzian comparison function
                $y = tan(pi() * random_0_1()) ;
                $x = $sq * $y + $lambda ;
            //  Reject if close to zero probability
            } while ($x < 0.0) ;
            $x = floor($x) ;
            //  Ratio of the desired distribution to the comparison function
            //  We accept or reject by comparing it to another uniform deviate
            //  The factor 0.9 is used so that $t never exceeds 1
            $t = 0.9 * (1.0 + $y * $y) * exp($x * $alxm - gammaln($x + 1.0) - $g) ;
        } while (random_0_1() > $t) ;

    return $x ;
}   //  function poisson()

function poissonWeightedRandom( $LowValue,
                                $maxRand )
    do {
        $rand_val = poisson() / $maxRand ;
    } while ($rand_val > 1) ;

    return floor($x * $maxRand) + $LowValue ;
}   //  function poissonWeightedRandom()

function binomial( $lambda=6.0 )

function domeWeightedRandom( $LowValue,
                             $maxRand )
    return floor(sin(random_0_1() * (pi() / 2)) * $maxRand) + $LowValue ;
}   //  function bellWeightedRandom()

function sawWeightedRandom( $LowValue,
                            $maxRand )
    return floor((atan(random_0_1()) + atan(random_0_1())) * $maxRand / (pi()/2)) + $LowValue ;
}   //  function sawWeightedRandom()

function pyramidWeightedRandom( $LowValue,
                               $maxRand )
    return floor((random_0_1() + random_0_1()) / 2 * $maxRand) + $LowValue ;
}   //  function pyramidWeightedRandom()

function linearWeightedRandom( $LowValue,
                               $maxRand )
    return floor(random_0_1() * ($maxRand)) + $LowValue ;
}   //  function linearWeightedRandom()

function nonWeightedRandom( $LowValue,
                            $maxRand )
    return rand($LowValue,$maxRand+$LowValue-1) ;
}   //  function nonWeightedRandom()

function weightedRandom( $Method,
                         $maxRand )
    switch($Method) {
        case RandomGaussian         :
            $rVal = gaussianWeightedRandom( $LowValue, $maxRand ) ;
            break ;
        case RandomBell             :
            $rVal = bellWeightedRandom( $LowValue, $maxRand ) ;
            break ;
        case RandomGaussianRising   :
            $rVal = gaussianWeightedRisingRandom( $LowValue, $maxRand ) ;
            break ;
        case RandomGaussianFalling  :
            $rVal = gaussianWeightedFallingRandom( $LowValue, $maxRand ) ;
            break ;
        case RandomGamma            :
            $rVal = gammaWeightedRandom( $LowValue, $maxRand ) ;
            break ;
        case RandomGammaQaD         :
            $rVal = QaDgammaWeightedRandom( $LowValue, $maxRand ) ;
            break ;
        case RandomLogarithmic10    :
            $rVal = logarithmic10WeightedRandom( $LowValue, $maxRand ) ;
            break ;
        case RandomLogarithmic      :
            $rVal = logarithmicWeightedRandom( $LowValue, $maxRand ) ;
            break ;
        case RandomPoisson          :
            $rVal = poissonWeightedRandom( $LowValue, $maxRand ) ;
            break ;
        case RandomDome             :
            $rVal = domeWeightedRandom( $LowValue, $maxRand ) ;
            break ;
        case RandomSaw              :
            $rVal = sawWeightedRandom( $LowValue, $maxRand ) ;
            break ;
        case RandomPyramid          :
            $rVal = pyramidWeightedRandom( $LowValue, $maxRand ) ;
            break ;
        case RandomLinear           :
            $rVal = linearWeightedRandom( $LowValue, $maxRand ) ;
            break ;
        default                     :
            $rVal = nonWeightedRandom( $LowValue, $maxRand ) ;
            break ;

    return $rVal;


谢谢你提供的代码。然而,我尝试查找你提供的所有方法,但没有看到任何一个似乎适合我的模型。统计学从来不是我的强项。如果你能指出一个可能适合的模型,我会非常愿意听取建议。谢谢。 - ircmaxell
一个选项是尝试生成一系列值,并使用每个不同的预定义分布将它们绘制在图表上,以查看曲线的外观。维基百科还有关于许多这些分布的广泛条目......虽然对于您描述的内容(如果我理解正确),如果您想要更多的上限值,请尝试高斯加权上升随机数,如果您想要更多的下限值,请尝试高斯加权下降随机数......虽然泊松分布通常是许多实际情况下有用的方法。 - Mark Baker
好的,我尝试了每一种方法。GaussianWeightedFallingRandom最接近要求,但它仍然没有下降得足够快(40个单位内200个数据点,10个单位内50个数据点,1个单位内1000个数据点变成了9500个)。我尝试了csch,它看起来更接近(因为它匹配高范围),但在中间下降得太快了。你有什么想法? - ircmaxell
在这种情况下,尝试使用gaussianWeightedRandom($LowValue, $maxRand, $mean, $stddev),但设置自己的平均值和标准偏差,或修改GaussianWeightedFallingRandom() 中对gauss()的调用,改为使用gauss_ms($mean, $stddev)并设置自己的平均值和标准偏差。可能需要一些试验...但请查看维基百科页面,了解更改这些参数如何影响曲线的形状。 - Mark Baker
@MarkBaker 很棒的资源!我看到这篇文章已经相当老了,但我想问一下,基于经验数据的离散分布函数是否比理论函数更好呢? - hek2mgl
@hek2mgl - 如果我现在写它,我会用非常不同的方式来做。 - Mark Baker


生成遵循给定分布的随机数最简单(但效率不高)的方法是一种称为 Von Neumann Rejection的技术。

该技术的简单解释如下。创建一个完全包含您的分布的框(我们将称您的分布为f),然后在框内选择一个随机点(x,y)。 如果y<f(x),则使用x作为随机数。 如果y> f(x),则丢弃xy并选择另一个点。 继续这个过程,直到您有足够多的值可用。 您不拒绝的x的值将按照f进行分布。

除非我错了,不是只是在由f(x)定义的曲线下获取随机点吗?考虑到我的曲线看起来是双曲线的,点的最大密度应该在原点附近,所以生成的数字会偏向于在原点和顶点之间创建的有界框的中间(因此不会像我需要的那样偏爱较低的数字)吗? - ircmaxell

这种天真的方法很可能会在某些我现在无法看到的方面扭曲分布。 思路很简单,只需对第一个数据集进行排序并成对迭代。 然后随机15个新数字插入每对之间以得到新数组。
以下是Ruby示例,由于我不太会说PHP。 希望这样简单的想法应该很容易翻译成PHP。
numbers.each_cons(2) { |a,b| 15.times { more_numbers << a+rand()*(b-a) } }

