15得票4回答
关于崩溃安全和容错编程的资源

我喜欢 LWN 文章 "Crash-only software",想要了解更多有关崩溃安全和容错编程的知识。 在故障情况下确保持久状态的一致性是令人惊讶的困难。这里我甚至没有谈论分布式操作:即使在单个节点上也很难实现:即使是普通的 Berkeley DB(BDB 数据存储或 BDB 并发数据...

14得票4回答
如果双工通道出现故障,我该如何自动重新建立连接?

我正在使用WCF开发一个基于.Net 3.5的客户端/服务器应用程序。基本上,长时间运行的客户端服务(在多台机器上)通过netTcpBinding与服务器建立双向连接。然后,服务器使用客户端的回调合同执行某些按需操作,客户端以异步方式响应(我认为这是相当标准的东西)。我子类化了DuplexCl...

13得票4回答
Erlang如何实现容错,或者在这方面有什么帮助?

Erlang如何具备容错能力或者在这方面提供帮助?

13得票2回答
计划任务或服务的容错和可靠性最佳实践

我一直在开发许多作为Windows服务或定时任务运行的应用程序。 现在,我希望确保这些应用程序具有容错性和可靠性。例如:我有一个每小时运行一次的服务。如果服务在运行时崩溃,我希望应用程序能够再次运行相同的时间段(包括数据处理的事务)以避免数据丢失。此外,我还希望程序报告详细的错误信息。我的目...

12得票5回答
容错软件架构文章

我正在寻找一些关于容错软件架构的好文章。请问您有什么推荐吗?

11得票1回答
Erlang中如何处理内存耗尽?

使用Erlang的“让它崩溃”哲学,如果一个进程无法分配所需内存以继续进行操作,人们会期望整个VM不会崩溃;实际上,如果系统具有一种启发式方法来杀死某些进程以释放一些内存,那么其他进程将处理此事并恢复。根监管者可能不太可能被启发式方法杀死。 这与大多数现代流行语言形成鲜明对比,后者只是死亡或...

11得票1回答
MPICH/OpenMPI中的容错性

我有两个问题- Q1. 在MPI中,除了检查点/回滚之外,是否有更有效的处理错误情况的方式?如果一个节点“死亡”,程序会突然停止... 是否有任何方法可以在节点死亡后继续执行?(如果以精度为代价就没有问题) Q2. 我在“https://dev59.com/vnVC5IYBdhLWcg3w...

10得票3回答
SQLite3的数据库文件在突然断电或操作系统崩溃时是否会损坏?

我使用sqlite3的open()方法打开数据库文件并获得了数据库连接,该连接在程序退出之前将不会关闭。如果出现意外错误,例如计算机突然断电或操作系统崩溃,那么数据库文件的模式是否会受损,或者它的句柄丢失?更具体地说,如果我重新启动计算机,它是否仍然可写?顺便说一下,发生错误时数据丢失对我并不...

10得票2回答
Resilience4j与Hystrix。哪一个更适合实现容错性?

当我最初学习Spring Boot时,我学习了作为熔断器的spring cloud netflix hystrix。这里有许多选项可用于容错,如多个应用程序属性和基于注释的声明。此外,还有一些重要的阈值值。最重要的是hystrix数据可以通过hystrix streams提示到hystrix ...

9得票3回答
Hystrix请求缓存示例

我将尝试解释 Hystrix 请求缓存 是如何工作的,但是我并没有理解他们在文档中提供的例子。 事实上,我有以下的 HystrixCommand 子类: public class GetFizzCommand extends HystrixCommand<Fizz> { ...