有没有Python中的包支持使用无服务器架构在NFS上并发写入?我在一个超级计算机环境中工作,多个作业并行保存其数据。虽然我可以将这些计算结果保存在单独的文件中,并稍后组合它们的结果,但这要求我编写一个阅读器,该阅读器了解我如何跨作业拆分我的计算的特定方式,以便它知道如何在最终的数据结构中正确地缝合所有内容。上次我检查时,SQLite不支持NFS中的并发性。有没有SQLite的替代方案?
注意:通过“无服务器”,我是指避免显式启动另一个(在NFS之上)处理IO请求的服务器。我理解NFS使用客户端-服务器架构,但这个文件系统已经是我使用的超级计算机的一部分。我不需要自己维护。我正在寻找的是一个支持并发IO而无需设置任何(额外)服务器的包或文件格式。
示例:以下是我要并行运行的两个作业的示例:
作业1从头开始使用以下数据填充my_dict,并将其保存在文件中: my_dict{'a'}{'foo'} = [0.2, 0.3, 0.4]
作业2也从头开始使用以下数据填充my_dict,并将其保存在文件中: my_dict{'a'}{'bar'} = [0.1, 0.2]
我希望稍后加载文件,并在my_dict中看到以下内容:
请注意,拼接操作是自动完成的。在这种情况下,我选择将键在
注意:通过“无服务器”,我是指避免显式启动另一个(在NFS之上)处理IO请求的服务器。我理解NFS使用客户端-服务器架构,但这个文件系统已经是我使用的超级计算机的一部分。我不需要自己维护。我正在寻找的是一个支持并发IO而无需设置任何(额外)服务器的包或文件格式。
示例:以下是我要并行运行的两个作业的示例:
作业1从头开始使用以下数据填充my_dict,并将其保存在文件中: my_dict{'a'}{'foo'} = [0.2, 0.3, 0.4]
作业2也从头开始使用以下数据填充my_dict,并将其保存在文件中: my_dict{'a'}{'bar'} = [0.1, 0.2]
我希望稍后加载文件,并在my_dict中看到以下内容:
> my_dict{'a'}.items()
[('foo', [0.2, 0.3, 0.4]), ('bar', [2, 3, 5])]
请注意,拼接操作是自动完成的。在这种情况下,我选择将键在
my_dict ['a']
中分成多个计算,但也可以进行其他分割。基本思想是作业之间没有冲突。它隐含地假设作业添加/聚合数据,因此字典(如果使用Pandas,则为数据框)的融合始终会聚合数据,即计算数据的"外连接"。
redis
包非常容易。但是它绝对是一个服务器。 - Jan Vlcinsky