11得票3回答
Datastax Cassandra-Driver(Python)导入失败

当导入DataStax Cassandra驱动程序(Python)时,出现以下错误: 错误File "cassandra.py", line 1, in <module> from cassandra.cluster import Cluster File "/home/...

10得票2回答
提交Spark应用程序的JAR包是否必要?

如标题所述,我想知道是否需要spark-submit *.jar? 我已经使用Datastax Enterprise Cassandra一段时间了,但现在我也需要使用Spark。我几乎观看了来自DS320: DataStax Enterprise Analytics with Apache ...

10得票2回答
Cassandra批量查询和单个插入性能的比较

我使用Cassandra Java驱动程序。 我每秒收到150k个请求,将它们插入到8个具有不同分区键的表中。 我的问题是哪种方式更好: - 批量插入到这些表中 - 逐一插入 我提出这个问题是因为,考虑到我的请求大小(150k),批处理听起来像更好的选择,但由于所有表都具有不同的分区键...

10得票2回答
为什么在Datastax Cassandra中需要关闭swap?

我对Datastax cassandra不熟悉。在阅读cassandra的安装过程时,建议关闭操作系统的交换空间(swap area)。有人能说明原因吗?这是否会影响操作系统级别的操作?

10得票3回答
从Cassandra ResultSet获取一个BigInteger属性

我正在尝试获取Cassandra列族中键值对的数量。以下是我使用的代码。PreparedStatement statement = client.session .prepare("select count(*) from corpus.word_usage"); Re...

9得票1回答
Pandas和Cassandra: numpy数组格式不兼容

我正在使用Python cassandra驱动程序连接和查询我们的Cassandra集群。 我想通过Pandas操作我的数据,文档中有一个关于cassandra驱动程序的区域,正好提到了这一点: https://datastax.github.io/python-driver/api/cas...

9得票1回答
如何在使用SparkConf连接远程Cassandra集群时通过“需要身份验证”?

我正在尝试使用Apache Spark和Cassandra进行数据分析。因此,我编写了一段Java代码来访问运行在远程机器上的Cassandra。我使用了以下Java代码。 public class JavaDemo implements Serializable { private tra...

9得票1回答
Cassandra 错误信息:由于本地暂停,不会将节点标记为下线。为什么?

我有6个节点,其中1个是Solr,5个是Spark节点,使用Datastax。我的集群在类似亚马逊EC2的服务器上,带有EBS卷。每个节点都有3个EBS卷,使用LVM组成一个逻辑数据磁盘。在我的OPS中心中,同一节点经常变得无响应,导致我的数据系统连接超时。我的数据量约为400GB,有3个副本...

9得票2回答
如何防止Cassandra提交日志占用磁盘空间

我在AWS上运行着一个两节点的Datastax AMI集群。昨天,Cassandra开始拒绝来自任何地方的连接,系统日志没有显示任何问题。经过大量调试后,我发现提交日志已经填满了分配的挂载点上的所有磁盘空间,这似乎导致连接被拒绝(删除一些提交日志,重新启动后就能连接了)。 我使用的是Data...

9得票2回答
卡桑德拉Datastax企业版使用亚马逊弹性IP

我希望在Amazon EC2实例上运行Cassandra Datastax Enterprise,但不使用节点私有IP地址,而是使用弹性公共IP。 我的当前配置如下: /etc/dse/cassandra/cassandra.yaml seed_provider: - class_n...