我刚刚阅读了DataStax的文章 "Cassandra数据建模基础规则",总结来说,我们应该根据查询而不是关系/对象来建模数据库架构。因此,许多表可以具有相同的重复数据,例如
我该如何处理对象更新?例如,用户编辑了他的电子邮件,我需要手动
如果进行
users_by_email
和users_by_username
,两者都具有相同的数据。我该如何处理对象更新?例如,用户编辑了他的电子邮件,我需要手动
UPDATE
两个表还是只需INSERT
所有列的对象并不关心以前的数据(仍然在我的数据库中,但列值错误 = >电子邮件)。如果进行
UPDATE
,我该如何处理数据同步?目前,我正在手动执行此操作,但是否有工具可以帮助我?因为可能会有5或6个具有不同分区/聚簇键的表。我听说Hadoop可以做到这一点,或者Apache Spark。