我正在从一张表中导入23亿个关联数据,但进度较慢,每小时只能导入500万个,需要耗费20天才能完成迁移。我听说过neo4j批量插入和批量插入工具,可以通过导入csv文件来实现,但是最新的代码有些问题,无法运行。
在neo4j中,我有大约1亿个关联关系,需要检查是否有重复的关系。请问有什么方法可以加速这些操作吗?
当前的代码类似于:
在neo4j中,我有大约1亿个关联关系,需要检查是否有重复的关系。请问有什么方法可以加速这些操作吗?
当前的代码类似于:
begin transaction
for 50K relationships
create or get user node for user A
create or get user node for user B
check there is relationship KNOW between A to B if not create the relationhsip
end transaction
我还阅读了以下内容: