PHP算法生成指定大小的所有组合集合

37

我正在试图推导一个算法,它可以生成特定大小的所有可能组合,就像一个函数,接受一个字符数组和大小作为参数,并返回一个组合数组。

例如: 假设我们有一组字符: 集合A= {A,B,C}

a)大小为2的所有可能组合:(3 ^ 2 = 9)

AA, AB, AC
BA, BB, BC
CA, CB, CC

b) 所有大小为3的可能组合:(3^3 = 27)

AAA, AAB, AAC,
ABA, ABB, ACC,
CAA, BAA, BAC,
.... ad so on total combinations = 27
请注意,配对大小可以大于人口总数。例如,如果集合包含3个字符,则我们也可以创建大小为4的组合。
编辑:还要注意这与排列不同。在排列中,我们不能重复使用字符,例如如果我们使用排列算法,AA就不能出现。在统计学中,这被称为抽样。
5个回答

64

我会使用递归函数。以下是带有注释的(可行的)示例。希望这对您有用!

function sampling($chars, $size, $combinations = array()) {

    # if it's the first iteration, the first set 
    # of combinations is the same as the set of characters
    if (empty($combinations)) {
        $combinations = $chars;
    }

    # we're done if we're at size 1
    if ($size == 1) {
        return $combinations;
    }

    # initialise array to put new values in
    $new_combinations = array();

    # loop through existing combinations and character set to create strings
    foreach ($combinations as $combination) {
        foreach ($chars as $char) {
            $new_combinations[] = $combination . $char;
        }
    }

    # call same function again for the next iteration
    return sampling($chars, $size - 1, $new_combinations);

}

// example
$chars = array('a', 'b', 'c');
$output = sampling($chars, 2);
var_dump($output);
/*
array(9) {
  [0]=>
  string(2) "aa"
  [1]=>
  string(2) "ab"
  [2]=>
  string(2) "ac"
  [3]=>
  string(2) "ba"
  [4]=>
  string(2) "bb"
  [5]=>
  string(2) "bc"
  [6]=>
  string(2) "ca"
  [7]=>
  string(2) "cb"
  [8]=>
  string(2) "cc"
}
*/

你可以编写自己的笛卡尔积函数来代替双重foreach,但在这个例子中似乎有些过度设计。 - Joel Hinz
1
这不是迭代函数。它是递归的,因为它明显在不断地调用自身... - Irdrah
3
对于那些不想让每个组合中存在重复字符的人,将最后一个 foreach 循环更改为:如果(strpos($combination,$char)=== false),{$new_combinations[] = $combination . $char;} - xfscrypt
这个函数能否在新版本的PHP 7.2中执行,或者在新版本中优化当前函数没有任何消息?@JoelHinz? - Andreas Hunter
@JoelHinz 我并不是在告诉你,你的代码不能在新版本的语言上运行。你的代码可以在较新和较旧版本的PHP上运行,我也亲自测试过了。我只是想问一下,是否有可能通过使用新的语言特性来优化生成时间。谢谢你的回复。 - Andreas Hunter
显示剩余2条评论

6
您可以使用递归来完成此操作。请注意,根据您的定义,“长度为n+1的组合”可以从长度为n的组合中生成,方法是取每个长度为n的组合并附加来自您的集合中的一个字母。如果您在意的话,可以通过数学归纳法证明这一点。

例如,对于一个集合{A,B,C},长度为1的组合如下:

A, B, C

长度为2的组合如下:
(A, B, C) + A = AA, BA, CA
(A, B, C) + B = AB, BB, BC
(A, B, C) + C = AC, CB, CC

这是代码,可以在ideone上查看。
function comb ($n, $elems) {
    if ($n > 0) {
      $tmp_set = array();
      $res = comb($n-1, $elems);
      foreach ($res as $ce) {
          foreach ($elems as $e) {
             array_push($tmp_set, $ce . $e);
          }
       }
       return $tmp_set;
    }
    else {
        return array('');
    }
}
$elems = array('A','B','C');
$v = comb(4, $elems);

是的,那是正确的,但如何将其泛化为一个算法来创建大小为n的组合呢? - asim-ishaq
@asim-ishaq 这是因为我所描述的这个属性对于所有的 n 都成立。我会进行编辑。 - cyon

6
一个可能的算法是:
$array_elems_to_combine = array('A', 'B', 'C');
$size = 4;
$current_set = array('');

for ($i = 0; $i < $size; $i++) {
    $tmp_set = array();
    foreach ($current_set as $curr_elem) {
        foreach ($array_elems_to_combine as $new_elem) {
            $tmp_set[] = $curr_elem . $new_elem;
        }
    }
    $current_set = $tmp_set;
}

return $current_set;

基本上,您要做的是取出当前集合的每个元素,并将元素数组的所有元素附加到其后面。

第一步:结果为('a', 'b', 'c'),第二步后: ('aa', 'ab', 'ac', 'ba', 'bb', 'bc', 'ca', 'cb', 'cc') 以此类推。


我正在尝试测试它。$arra_of_elem是什么?在第二个和第三个循环中,请使用foreach而不是for。 - asim-ishaq
@asim-ishaq 这是一个包含要组合的元素的数组或集合。在您的情况下:Array('A','B','C') - Santiago Alessandri
无法正常工作。对于任何给定的大小,它都会生成大小为3的组合。 - asim-ishaq
@asim-ishaq 我刚在 http://writecodeonline.com/php/ 上测试了上述代码,将返回值更改为 print_r,对于4个元素的组合运行良好。 - Santiago Alessandri

2

这里有一个由朋友编写的代码,它可以从一组数字中生成X个数字的独特组合。

如果您有一组数字,例如1,3,4,7,12,您可以生成X个数字的集合,所有数字都是唯一的,没有重复的。

第一个函数适用于PHP 7.4或更高版本,第二个函数使用键来存储值。两者都基于基准测试非常良好。

function get_combos74($map, $size, &$generated = [], $loop = 1, $i = 0, $prefix = [])
{
    if ($loop == 1) {
        sort($map);
    }

    for (; $i < count($map); $i++) {
        if ($loop < $size) {
            get_combos74($map, $size, $generated, $loop + 1, $i + 1, [...$prefix, $map[$i]]);
        } else {
            $generated[] = [...$prefix, $map[$i]];
        }
    }

    return $generated;
}
function get_combosSTR($map, $size, &$generated = [], $loop = 1, $i = 0, $prefix = '')
{
    if ($loop == 1) {
        sort($map);
    }

    for (; $i < count($map); $i++) {
        if ($loop < $size) {
            get_combosSTR($map, $size, $generated, $loop + 1, $i + 1, "$prefix{$map[$i]}:");
        } else {
            $generated["$prefix{$map[$i]}"] = 0;
        }
    }

    return $generated;
}

0

另一个使用数字基础转换的想法

$items = ['a', 'b', 'c', 'd'];
$length = 3;
$numberOfSequences = pow(count($items), $length);
for ($i = 0; $i < $numberOfSequences; $i++) {
    $results[] = array_map(function ($key) use ($items) {
        return $items[base_convert($key, count($items), 10)];
    }, str_split(str_pad(base_convert($i, 10, count($items)), $length, 0, STR_PAD_LEFT)));
}

return $results;

警告,您不应该在items数组中拥有比base_convert参数可以处理的元素更多:而该数字为36。 - user1913526

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接