我的DataFlow管道以一个
BatchBlock
开始,有多个任务将项发布到这个BatchBlock
中。现在,这个BatchBlock
依靠定时器和TriggerBatch()
方法的帮助将数据传播到下一个块。
在这种情况下,您可以假设创建BatchBlock
时提供的批处理大小都不是(非常高的)批处理大小,即每个触发的批处理可能具有不同的大小。
在触发BatchBlock
之前,我想删除即将传播到管道中下一个块中的批处理中存在的所有重复项。我能做到吗?