13得票13回答
有没有获取Hadoop中nameservice的活动namenode的命令?

该命令:hdfs haadmin -getServiceState machine-98 只有在知道机器名称的情况下才能正常工作。是否有类似以下命令的指令:hdfs haadmin -getServiceState <nameservice> 哪个命令可以告诉你活动namenode...

13得票1回答
S3备份的高可用性和可靠性

我对此进行了一些研究,但没有找到任何实质性的答案,因此转向 StackOverflow 寻求帮助。 Amazon S3 在高可用性和可靠性方面有多可靠?我知道它有服务级别协议,但如果 AWS 中的可用区 (AZ) 或整个区域出现问题怎么办呢? 我查看了 Amazon S3 的设置文档。在尝...

12得票1回答
在Azure上托管的高可用性Service Fabric WebApi

我们在Azure上托管一个无状态的Owin WebAPI,该WebAPI位于我们服务织物群集(实例计数-1)中的所有节点上。该WebAPI旨在供公众使用,即使内部服务和WebAPI本身升级也应高度可用。我们的Azure负载均衡器(LB)在群集前面,每5秒使用TCP探针在端口80上探测群集,以确...

12得票1回答
合并多个相同的Kafka Streams主题

我有两个Kafka主题,从不同的来源流式传输完全相同的内容,这样在一个来源失败时我就可以高可用。我试图使用Kafka Streams 0.10.1.0将这两个主题合并为一个输出主题,以便在发生故障时不会错过任何消息,当所有来源都正常时也不会出现重复。 使用KStream的leftJoin方法...

12得票4回答
高可用性的Airflow设置

如何部署Apache Airflow(以前称为Airbnb的Airflow)调度程序以实现高可用性? 我不是在询问后端DB或RabbitMQ,这些应该显然部署在高可用性配置中。 我的主要关注点是调度程序 - 是否需要特别处理?

12得票1回答
RabbitMQ集群和镜像队列的背后行为

请有人解释一下在RabbitMQ集群中,多个节点和队列以镜像方式工作时,在向从节点发布消息时发生了什么? 据我所读的,除了发布操作之外的所有操作都只会发送给主节点,然后主节点将操作的影响广播到从节点(这是来自文档的)。就我理解来说,这意味着消费者将始终从主队列中消费消息。此外,如果我向从节点...

12得票1回答
什么是HA Gearman作业服务器的最佳实践?

从gearman的主页上可以看到,他们提到可以使用多个作业服务器运行,以便如果一个作业服务器死亡,客户端可以选择另一个作业服务器。根据下面的陈述和图表,似乎作业服务器之间不进行通信。 我们的问题是那些排队在死亡的作业服务器中的作业会发生什么情况?有哪些最佳实践来确保这些服务器具有高可用性,以...

12得票1回答
多宿主 SQL Server 与高可用性组

我们有两个服务器(SQL-ATL01、SQL-ATL02)组成故障转移集群,每个服务器作为SQL Server高可用性组(HAG)的一部分运行。每台服务器有两张网卡。一张是10Gbit的网卡,直接连接到另一台服务器,并用于在192.168.99.x子网上同步HAG。另一张是1Gbit的网卡,用...

12得票2回答
Kafka:确保高可用性所需的最少代理数量是多少?

假设我想在小型部署上生产高可用性的Kafka,我必须使用以下配置: min.insync.replicas=2 // Don't want to lose messages in case of 1 broker crash default.replication.factor=3 ...

11得票4回答
停止接受新的TCP连接,而不丢弃任何现有连接。

我有两个服务器在负载均衡器后监听TCP端口。负载均衡器可以检测客户端的TCP连接尝试是否失败,并将其重试到第二个服务器,而不会断开该连接。我希望能够在不中断任何客户端连接的情况下关闭这两个服务器中的任何一个进行维护。 我的服务器使用此代码来处理客户端请求:ServerSocketFactor...