Cassandra中具有相同主键的行插入会替换以前的写入。

11
在Cassandra中创建了一个基于两个列(groupname,type)的主键表。当我尝试插入多行且groupname和type相同时,它不会存储超过一行,后续的写入也是如此。在groupname和type相同的情况下,最新的写入会替换之前的相似写入。为什么Cassandra会以这种方式替换而不是写入我插入的每一行呢?
cqlsh:resto> insert into restmaster (rest_id,type,rname,groupname,address,city,country)values(blobAsUuid(timeuuidAsBlob(now())),'SportsBar','SportsDen','VK Group','Majestic','Bangalore','India');

写作 2

insert into restmaster (rest_id,type,rname,groupname,address,city,country)values(blobAsUuid(timeuuidAsBlob(now())),'SportsBar','Sports Spot','VK Group','Bandra','Mumbai','India');

写作 3

cqlsh:resto> insert into restmaster (rest_id,type,rname,groupname,address,city,country)values(blobAsUuid(timeuuidAsBlob(now())),'SportsBar','Cricket Heaven ','VK Group','Connaught Place','New Delhi','India');

我期望的结果(查看第4、5、6行)

 groupname      | type       | rname
----------------+------------+-----------------
           none |      Udipi |  Gayatri Bhavan
           none |     dinein |    Blue Diamond
       VK Group |  FoodCourt |        FoodLion
       VK Group |  SportsBar |      Sports Den
       VK Group |  SportsBar |     Sports Spot
       VK Group |  SportsBar |  Cricket Heaven
  Viceroy Group | Vegetarian |  Palace Heights
 Mainland Group |    Chinese |  MainLand China
      JSP Group |  FoodCourt |        Nautanki
          Ohris |  FoodCourt |           Ohris

但这是实际的结果(写入3已替换之前插入的2行[第4、5行])

 cqlsh:resto> select groupname,type,rname From restmaster;

 groupname      | type       | rname
----------------+------------+-----------------
           none |      Udipi |  Gayatri Bhavan
           none |     dinein |    Blue Diamond
       VK Group |  FoodCourt |        FoodLion
       VK Group |  SportsBar | Cricket Heaven 
  Viceroy Group | Vegetarian |  Palace Heights
 Mainland Group |    Chinese |  MainLand China
      JSP Group |  FoodCourt |        Nautanki
          Ohris |  FoodCourt |           Ohris


cqlsh:resto> describe table restmaster;

CREATE TABLE restmaster (
  groupname text,
  type text,
  address text,
  city text,
  country text,
  rest_id uuid,
  rname text,
  PRIMARY KEY ((groupname), type)
) WITH
  bloom_filter_fp_chance=0.010000 AND
  caching='KEYS_ONLY' AND
  comment='' AND
  dclocal_read_repair_chance=0.100000 AND
  gc_grace_seconds=864000 AND
  index_interval=128 AND
  read_repair_chance=0.000000 AND
  replicate_on_write='true' AND
  populate_io_cache_on_flush='false' AND
  default_time_to_live=0 AND
  speculative_retry='99.0PERCENTILE' AND
  memtable_flush_period_in_ms=0 AND
  compaction={'class': 'SizeTieredCompactionStrategy'} AND
  compression={'sstable_compression': 'LZ4Compressor'};

你知道主键是什么吗? - Raedwald
1个回答

14
所有插入到Cassandra数据库的操作实际上都是插入/更新操作,并且每个唯一定义的主键只能有一个非键值集合。这意味着您永远不能在一个主键上拥有多组值,并且只能看到最后一次写入。
更多信息: http://www.datastax.com/documentation/cql/3.1/cql/cql_intro_c.html 更新:数据模型
如果您使用像以下这样的键:
Primary Key ((groupname),type,rname)
只要您拥有独特的餐厅名称,就可以获得您所期望的结果。但您真正应该问的是:“我想对这些数据执行哪些查询?” 所有Cassandra表都应基于满足一类查询。我上面写的关键字基本上是说:“此表是为快速查找特定组中的所有餐厅而构建的,并且我使用的唯一条件将是类型和餐厅名称”。 可以使用该模式执行的示例查询
 SELECT * FROM restmaster WHERE groupname = 'Lettuce Entertain You' ;
 SELECT * FROM restmaster WHERE groupname = 'Lettuce Entertain You' and type = 'Formal'  ;
 SELECT * FROM restmaster WHERE groupname = 'Lettuce Entertain You' and type = 'Formal' 
    and rname > 'C' and rname < 'Y' ;
如果这不是你想在应用程序中执行的查询类型,或者你想要除此之外的其他查询,那么你很可能需要额外的表格。

那么在我的情况下,如何插入多个由同一公司拥有的餐厅数据呢?groupname=公司名称,type=餐厅类型,[主键(groupname,type)]。我希望将groupname作为分区键,因为我希望所有由该公司拥有的餐厅都存储在同一个物理节点上(以便快速检索数据)。 - Vikram
扩展答案并附带示例 - RussS

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接