Cassandra读取超时

Question

Cassandra读取超时

cassandracassandra-2.0datastaxdatastax-java-drivercassandra-cli

7

我正在从Cassandra 2.0中提取大量数据，但很不幸出现了超时异常。我的表：

CREATE KEYSPACE StatisticsKeyspace
  WITH REPLICATION = { 'class' : 'SimpleStrategy', 'replication_factor' : 3 };


CREATE TABLE StatisticsKeyspace.HourlyStatistics(
KeywordId text,
Date timestamp,
HourOfDay int,
Impressions int,
Clicks int,
AveragePosition double,
ConversionRate double,
AOV double,
AverageCPC double,
Cost double,
Bid double,
PRIMARY KEY(KeywordId, Date, HourOfDay)
);
CREATE INDEX ON StatisticsKeyspace.HourlyStatistics(Date);

我的查询：

SELECT KeywordId, Date, HourOfDay, Impressions, Clicks,AveragePosition,ConversionRate,AOV,AverageCPC,Bid 
FROM StatisticsKeyspace.hourlystatistics 
WHERE Date >= '2014-03-22' AND Date <= '2014-03-24'

我已经在我的cassandra.yaml文件中更改了配置。

read_request_timeout_in_ms: 60000
range_request_timeout_in_ms: 60000
write_request_timeout_in_ms: 40000
cas_contention_timeout_in_ms: 3000
truncate_request_timeout_in_ms: 60000
request_timeout_in_ms: 60000

但它仍然在大约10秒钟左右抛出超时。有什么想法可以解决这个问题吗？

- Wild Goat

1

这是使用cassandra-cli还是Java应用程序？从您的标签中仍不清楚，尽管查询提示了cli。 - John

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- John · Accepted Answer

如果使用Datastax的Java客户端，则默认启用5000行集的分页功能。如果仍然遇到超时问题，您可以尝试减少此设置。

public Statement setFetchSize(int fetchSize)

(查看更多)

如果您正在使用cli，您可能需要尝试一些手动分页：

SELECT KeywordId, Date, HourOfDay, Impressions, Clicks,AveragePosition,ConversionRate,AOV,AverageCPC,Bid 
FROM StatisticsKeyspace.hourlystatistics 
WHERE Date >= '2014-03-22' AND Date <= '2014-03-24' 
LIMIT 100;

SELECT * FROM ....  WHERE token(KeywordId) > token([Last KeywordId received]) AND ...
LIMIT 100;

为了检测一些集群问题，您可以尝试使用限制为1的select语句，也许存在潜在的问题。

希望对您有所帮助。

如果您的查询仍然存在性能问题，我建议您查看您的二级索引，因为传输的数据量似乎是合理的（只返回“小”数据类型）。如果我没错的话，更改提取大小不会有太大变化。相反，您是否只在“日期”（时间戳）列中插入日期？如果您插入实际的时间戳，由于基数较高，该列上的二级索引将非常缓慢。如果您只插入日期，则时间戳将默认为日期+"00:00:00"+TZ，这应该减少基数，从而提高查找速度。（注意时区问题！）为了绝对确定，尝试在具有不同数据类型的列上进行二级索引，例如Date的int（计算自1970-01-01以来的天数或其他内容）。