我正在进行一个涉及数十亿条记录的学术项目的架构阶段。该项目在计算能力方面应该非常轻量级,且高度可扩展。
信息结构非常简单:我需要存储一系列具有不同特征的项。这些特征包括整数、小数、日期、字符串等。导入数据时,可以知道每个特征的类型。此外,特征可用于引用其他项。
我需要能够按其特征(一个以上)获取和排序列表 - 可能使用查询,例如>,<,= 和正则表达式,长度,左侧,右侧,中间用于字符串对比特征值和用户任意输入。
报告方面需要求和、平均值、分组等功能,但对于此类需求而言要求更加宽松,无需完全具备立方体功能,但越多越好。
我对NoSQL世界非常陌生。您有什么建议吗?
信息结构非常简单:我需要存储一系列具有不同特征的项。这些特征包括整数、小数、日期、字符串等。导入数据时,可以知道每个特征的类型。此外,特征可用于引用其他项。
我需要能够按其特征(一个以上)获取和排序列表 - 可能使用查询,例如>,<,= 和正则表达式,长度,左侧,右侧,中间用于字符串对比特征值和用户任意输入。
报告方面需要求和、平均值、分组等功能,但对于此类需求而言要求更加宽松,无需完全具备立方体功能,但越多越好。
我对NoSQL世界非常陌生。您有什么建议吗?