将生成器分成块的最佳方法

5

你能帮我写一个代码吗,将生成器的结果分成100个一组,并将它们更美观地保存到数据库中。

$batchSize = 100;

$batch = [];
$i = 0;

/** 
 * @yield array $item
 */
foreach(itemsGenerator() as $item) {
    $batch[] = $item;
    $i++;

    if ($i === $batchSize) {
        Db::table('items')->save($batch);

        $batch = [];
        $i = 0;
    }

    $cnt++;
}

if ($batch) {
     Db::table('items')->save($batch);
}

我不想在itemsGenerator中放置将逻辑分成块的代码。


1
也许更适合于codereview.stackexchange.com。 - Mark Baker
1个回答

11
你可以将代码块的逻辑放入一个独立的可重用函数中。
解决方案1:每个代码块都是一个生成器。 https://3v4l.org/3eSQm
function chunk(\Generator $generator, $n) {
    for ($i = 0; $generator->valid() && $i < $n; $generator->next(), ++$i) {
        yield $generator->current();
    }
}

function foo() {
  for ($i = 0; $i < 11; ++$i) {
    yield $i;
  }
}

for ($gen = foo(); $gen->valid();) {
    $chunk = [];
    foreach (chunk($gen, 3) as $value) {
        $chunk[] = $value;
    }
    print json_encode($chunk) . "\n";
}

解决方案2:每个块都是一个数组。

https://3v4l.org/aSfeR

function generator_chunks(\Generator $generator, $max_chunk_size) {
  $chunk = [];
  foreach ($generator as $item) {
    $chunk[] = $item;
    // @todo A local variable might be faster than count(), but adds clutter to the code. So using count() for this example code.
    if (count($chunk) >= $max_chunk_size) {
      yield $chunk;
      $chunk = [];
    }
  }
  if ([] !== $chunk) {
      // Remaining chunk with fewer items.
      yield $chunk;
  }
}

function generator() {
    for ($i = 0; $i < 11; ++$i) {
        yield $i;
    }
}

foreach (generator_chunks(generator(), 3) as $chunk) {
    print json_encode($chunk) . "\n";
}

现在,整个块将作为数组一次性存储在内存中,但并非整个序列。

可能有办法使每个块的行为像生成器。但这是另一个故事了。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接