42得票2回答
yarn和yarn install有什么区别?

我正在尝试使用 Helium 在 Apache Zeppelin 上安装一个额外的插件。Helium 使用以下安装命令来下载此软件包:com.github.eirslett.maven.plugins.frontend.lib.TaskRunnerException: 'yarn instal...

37得票5回答
运行Zeppelin时出现“未识别的VM选项'MaxPermSize=512m'”

当我尝试通过以下任一方式运行Zeppelin时bin/zeppelin.sh 或者bin/zeppelin-deamon.sh start 我遇到了如下错误信息。Unrecognized VM option 'MaxPermSize=512m' Error: Could not create ...

36得票7回答
Spark + s3 - 错误 - java.lang.ClassNotFoundException: 找不到类org.apache.hadoop.fs.s3a.S3AFileSystem

我有一个 Spark EC2 集群,我正在从 Zeppelin 笔记本提交一个 Pyspark 程序。我已经加载了 hadoop-aws-2.7.3.jar 和 aws-java-sdk-1.11.179.jar 并将它们放置到 spark 实例的 /opt/spark/jars 目录中。但是...

27得票1回答
在Zeppelin中没有可用的解释器

我刚刚在我的Mac电脑(Yosemite 10.10.3)上安装了以下软件: Oracle Java 1.8更新45 Scala 2.11.6 Spark 1.4(预编译版本: http://d3kbcqa49mib13.cloudfront.net/spark-1.4.0-bin-had...

27得票4回答
从Apache SQL Spark中删除临时表

我在使用Zeppelin下使用Apache Spark注册了registertemptable:val hvacText = sc.textFile("...") case class Hvac(date: String, time: String, targettemp: Integer,...

25得票1回答
应该将`SPARK_HOME`设置为什么?

安装了apache-maven-3.3.3和scala 2.11.6,然后运行:$ git clone git://github.com/apache/spark.git -b branch-1.4 $ cd spark $ build/mvn -DskipTests clean packag...

25得票3回答
如何在Zeppelin/Spark/Scala中美观地打印数据框?

我在Zeppelin 0.7笔记本中使用Spark 2和Scala 2.11。我有一个数据框,可以像这样打印:dfLemma.select("text", "lemma").show(20,false) 输出结果如下:+-------------------------------------...

22得票4回答
为什么 SparkContext 会随机关闭,如何从 Zeppelin 重新启动它?

我在Zeppelin中编写spark-sql查询,有时候会突然出现以下错误(没有更改过代码):Cannot call methods on a stopped SparkContext. 然后输出结果在下方继续说道:The currently active SparkContext was c...

20得票1回答
如何在Zeppelin中检查Spark和Scala的版本?

当我运行交互式 spark-shell 时,会显示 Spark 版本(2.2.0)和 Scala 版本(2.11.8)。Welcome to ____ __ / __/__ ___ _____/ /__ _\ \/ _ \/ _ `/ ...

20得票4回答
Zeppelin:如何在Zeppelin中重新启动sparkContext

我正在使用 Zeppelin 的隔离模式,它可以在 Spark 集群中为每个笔记本启动一个新的作业。当笔记本执行完成后,我希望能够通过 Zeppelin 来终止该作业。为此我使用了 sc.stop 命令来停止 SparkContext 和作业,但是下一次尝试运行笔记本时,它无法重新启动 spa...