11得票1回答
为什么“熵”一词出现在反熵协议中?

反熵协议是一种流言协议。http://en.wikipedia.org/wiki/Gossip_protocol。我想知道有人能否解释一下这里“熵”一词的意义。

8得票3回答
什么情况下使用向量时钟而不是版本向量?

我一直在努力寻找适用于向量时钟和版本向量的用例示例,以及它们可能有何不同。我知道它们的工作方式基本相同,向量时钟使用receive和send函数,而版本向量则使用sync函数,但我不理解这两种选择之间的区别。它们只是表达同一事物的两种不同方式,还是在使用案例上存在真正的区别?我只能找到一个相关...

8得票4回答
多数据源同步数据

我们的团队正尝试构建一个预测性维护系统,其任务是查看一组事件并预测这些事件是否描述了一组已知的异常。我们正在设计阶段,当前的系统设计如下: - 事件可能会发生在物联网系统的多个来源上(例如云平台、边缘设备或任何中间平台)。 - 事件由数据源推送到消息队列系统中(我们目前选择了Apache Ka...

10得票2回答
Zookeeper和托管复制数据库服务之间的区别

我刚刚接触到Zookeeper,想知道Zookeeper和AWS DynamoDB或AWS S3(存储服务)这种可用、一致、持久、分布式、复制的数据库服务有什么区别。像配置管理和分布式同步等关键特性在AWS DynamoDB等数据库服务中也能很好地实现。我理解Zookeeper和DynamoD...

10得票1回答
我该如何让我的Django网站从多台机器提供服务,也就是如何将其分布式?

我有一个Django网站,我想使其分布式。虽然我理解系统设计和分布式系统的概念,但仍然无法想象如何使用多个服务器提供服务。我正在尝试将我的系统分布式,这样我就可以从两台机器上提供我的网站(这就是分布式系统的工作方式)。我已经用Django编写了我的网站。我想知道如何将同样的网站服务于2台机器。...

7得票5回答
分布式系统:领导者选举

我目前正在开发一个分布式系统,我们需要实现某种领导者选举。 问题在于,我们希望避免所有计算机都必须相互了解 - 只有领导者知道其他计算机。我们是否可以使用广播等快速方法来实现我们想要的结果? 或者我们只需要至少知道一个计算机,就能进行良好的领导者选举吗? 假设所有计算机都在同一子网中。

12得票3回答
如何使用ZooKeeper设计任务分配

我计划编写一个应用程序,其中将拥有分布式Worker进程。其中之一将是Leader,负责将任务分配给其他进程。设计Leader选举过程相当简单:每个进程都尝试在同一路径上创建一个临时节点。获得成功的人成为领导者。 现在,我的问题是如何设计均匀分配任务的过程?有没有相关的方法? 我稍微解释一...

19得票4回答
如何解决著名的`未处理的cuda错误,NCCL版本2.7.8`错误?

我看到了多个关于以下问题的问题:RuntimeError: NCCL error in: /opt/conda/conda-bld/pytorch_1614378083779/work/torch/lib/c10d/ProcessGroupNCCL.cpp:825, unhandled cud...

24得票3回答
什么是zookeeper和raft的区别?

虽然有点愚蠢,但是Zookeeper与Raft相比有什么不同,不是在谈论ZAB而是Zookeeper本身。 我知道Raft可以通过服务器进行领导者选举等操作,但是Zookeeper的作用是什么?有没有类比的方式来解释呢?

65得票4回答
为什么关系型数据库管理系统在 CAP 定理中不具备分区容错性,但它是可用的?

关于RDBMS在CAP定理中被归类为CA,我有两个疑问: 1)它说RDBMS不是分区容错的,但是RDBMS比像MongoDB或Cassandra这样的其他技术少分区容错吗?是否有一种RDBMS设置,我们放弃CA使其成为AP或CP? 2)它是如何做到CAP-Available的?是通过主从设...