MRI Ruby的线程和性能问题

4

这是我在SO上的第一个问题,但我已经潜水很久了,所以如果我违反了任何规则或发布了垃圾问题,请原谅。

我正在尝试更好地理解线程,并决定测试MRI并查看其总体性能。

鉴于以下代码(和输出),为什么线程操作比非线程变体要慢得多?

代码

class Benchmarker
  def self.go
    puts '----------Benchmark Start----------'
    start_t = Time.now
    yield
    end_t = Time.now
    puts "Operation Took: #{end_t - start_t} seconds"
    puts '----------Benchmark End------------'
  end
end

# using mutex
puts 'Benchmark 1 (threaded, mutex):'
Benchmarker.go do
  array = []
  mutex = Mutex.new
  5000.times.map do
    Thread.new do
      mutex.synchronize do
        1000.times do
          array << nil
        end
      end
    end
  end.each(&:join)
  puts array.size
end

# using threads
puts 'Benchmark 2 (threaded, no mutex):'
Benchmarker.go do
  array = []
  5000.times.map do
    Thread.new do
      1000.times do
        array << nil
      end
    end
  end.each(&:join)
  puts array.size
end

# no threads
puts 'Benchmark 3 (no threads):'
Benchmarker.go do
  array = []
  5000.times.map do
    1000.times do
      array << nil
    end
  end
  puts array.size
end

输出

Benchmark 1 (threaded, mutex):
----------Benchmark Start----------
5000000
Operation Took: 3.373886 seconds
----------Benchmark End------------
Benchmark 2 (threaded, no mutex):
----------Benchmark Start----------
5000000
Operation Took: 5.040501 seconds
----------Benchmark End------------
Benchmark 3 (no threads):
----------Benchmark Start----------
5000000
Operation Took: 0.454665 seconds
----------Benchmark End------------

提前致谢。

1个回答

5

当线程数达到较高数量(5000)时,调度程序在线程之间切换所需的开销远大于每个线程实际执行的工作量。通常最多需要30-50个线程。

尝试降低线程数,并按比例增加每个线程执行的工作量:

  20.times.map do
    Thread.new do
      250000.times do
        array << nil
      end
    end
  end.each(&:join)

同时,您应该看到更加可比较的结果。

请注意,您可能会看到下限 Time(threaded) >= Time(non-threaded) - 这意味着多线程版本的时间不能低于单线程版本。这是由于MRI的GIL只允许一个线程在同一时间执行(它们永远不能并行运行)。一些Ruby实现,如JRuby,允许线程并行执行。


1
谢谢Martin,我刚刚重新测试了一下,发现结果确实更加可比。已标记为已回答。 - Jamie Pirie

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接