这是我要做的事情。
我创建了两个 DataStax Enterprise 集群节点,并在其上创建了一个 Java 程序来获取一个表(Cassandra 数据库表)的计数。
此程序是在来自 Windows 计算机的 Eclipse 中构建的。
从 Windows 运行此程序时,在运行时会出现以下错误:
初始作业未接受任何资源;检查您的集群 UI 以确保工作者已注册并具有足够的内存
相同的代码已经成功编译并在那些集群上运行,没有任何问题。我为什么会收到上述错误?
代码:
import org.apache.spark.SparkConf;
import org.apache.spark.SparkContext;
import org.apache.spark.api.java.JavaSparkContext;
import org.apache.spark.sql.SchemaRDD;
import org.apache.spark.sql.cassandra.CassandraSQLContext;
import com.datastax.bdp.spark.DseSparkConfHelper;
public class SparkProject {
public static void main(String[] args) {
SparkConf conf = DseSparkConfHelper.enrichSparkConf(new SparkConf()).setMaster("spark://10.63.24.14X:7077").setAppName("DatastaxTests").set("spark.cassandra.connection.host","10.63.24.14x").set("spark.executor.memory", "2048m").set("spark.driver.memory", "1024m").set("spark.local.ip","10.63.24.14X");
JavaSparkContext sc = new JavaSparkContext(conf);
CassandraSQLContext cassandraContext = new CassandraSQLContext(sc.sc());
SchemaRDD employees = cassandraContext.sql("SELECT * FROM portware_ants.orders");
//employees.registerTempTable("employees");
//SchemaRDD managers = cassandraContext.sql("SELECT symbol FROM employees");
System.out.println(employees.count());
sc.stop();
}
}