在尝试使用ZeroMQ Push/Pull(也被称为Pipeline)套接字类型时,我很难理解这种模式的实用性。它被描述为一种“负载均衡器”。
对于一个单一的服务器向多个工作者发送任务,Push/Pull将在所有客户端之间平均分配任务。例如有3个客户端和30个任务,每个客户端获得10个任务:client1获得任务1、4、7...,client2获得2、5...以此类推。很公平,但实际上通常存在任务复杂度或客户端计算资源的异构混合(或可用性),此时这种模式就会出现严重问题。所有任务似乎都是预定好的,而服务器不知道客户端的进度或是否可用。如果client1崩溃,则其剩余的任务不会被分配给其他客户端,而是保留在client1队列中。如果client1仍然无法正常运行,那么这些任务将永远没有人处理。相反,如果某个客户端更快地处理其任务,则它不会获得更多任务并保持空闲,因为这些任务保留给其他客户端安排。
使用REQ/REP是一种可能的解决方案;任务只分配给可用资源。
那么我是错过了什么吗?如何有效地使用Push/Pull呢?有没有一种方法可以处理客户端、任务等的不对称性,使用此套接字类型?
谢谢!以下是一个简单的Python示例:
# server
import zmq
import time
context = zmq.Context()
socket = context.socket(zmq.PUSH)
#socket = context.socket(zmq.REP) # uncomment for Req/Rep
socket.bind("tcp://127.0.0.1:5555")
i = 0
time.sleep(1) # naive wait for clients to arrive
while True:
#msg = socket.recv() # uncomment for Req/Rep
socket.send(chr(i))
i += 1
if i == 100:
break
time.sleep(10) # naive wait for tasks to drain
.
# client
import zmq
import time
import sys
context = zmq.Context()
socket = context.socket(zmq.PULL)
#socket = context.socket(zmq.REQ) # uncomment for Req/Rep
socket.connect("tcp://127.0.0.1:5555")
delay = float(sys.argv[1])
while True:
#socket.send('') # uncomment for Req/Rep
message = socket.recv()
print "recv:", ord(message)
time.sleep(delay)
在命令行上启动三个客户端,带有延迟参数(即1、1和0.1),然后启动服务器,观察所有任务如何均匀分布。 然后关闭其中一个客户端,以查看其剩余任务未被处理。
取消注释所示的行,将其切换到Req/Rep
类型的套接字,并观察更有效的负载平衡器。
ZMQ_HWM
选项,在所有下游 puller 上将其设置为一个较小的数字,那么这样不会强制 pusher 将所有请求发送到连接的第一个 puller 吗? - smac89