8得票1回答
在单个图表中显示多个数据点

Scala: val df = sc.parallelize(Seq( ("Jan" , "1", "1","3"), ("Feb" , "2", "5","2"), ("Mar" , "2", "3","1"))) .toDF("time" , "f1", ...

15得票1回答
将Spark.SQL DataFrame和pandas DataFrame互相转换

在 %pyspark 环境下,是否有可能将 <br> 转换为 pd.DataFrame?

11得票6回答
使用spark-csv在zeppelin中读取csv文件

我想在Zeppelin中读取csv文件,并希望使用databricks的spark-csv软件包:https://github.com/databricks/spark-csv 在spark-shell中,我可以使用以下命令来使用spark-csv:spark-shell --package...

20得票4回答
Zeppelin:如何在Zeppelin中重新启动sparkContext

我正在使用 Zeppelin 的隔离模式,它可以在 Spark 集群中为每个笔记本启动一个新的作业。当笔记本执行完成后,我希望能够通过 Zeppelin 来终止该作业。为此我使用了 sc.stop 命令来停止 SparkContext 和作业,但是下一次尝试运行笔记本时,它无法重新启动 spa...

25得票3回答
如何在Zeppelin/Spark/Scala中美观地打印数据框?

我在Zeppelin 0.7笔记本中使用Spark 2和Scala 2.11。我有一个数据框,可以像这样打印:dfLemma.select("text", "lemma").show(20,false) 输出结果如下:+-------------------------------------...

8得票1回答
如何在Zeppelin中使用Plotly

我看到过 zeppelin-plotly,但它似乎太复杂了。另一个让我担心的问题是它涉及修改 zeppelin 的 .war 文件,我不想因错误而破坏东西。 有没有其他方法可以在 Zeppelin 中使用 Plotly?

8得票1回答
Zeppelin与SparkR无法将数据框显示为表格。

齐柏林飞艇R解释器文档说明: If you return a data.frame, Zeppelin will attempt to display it using Zeppelin's built-in visualizations. 这可以在文档示例中看到: 然而,当我尝试...

9得票4回答
如何在Zeppelin中添加一个jar包?

如何在Zeppelin中为%hive解释器添加jar包? 我尝试过: %z.dep(''); add jar <jar path> 此外,Zeppelin Hive解释器抛出ClassNotFoundException异常 在./interpreter/hive/中添加内...

10得票1回答
Spark抛出java.util.NoSuchElementException: key not found: 67

在 Zeppelin 中运行 Spark 二分 k-means 算法。//I transform my data using the TF-IDF algorithm val idf = new IDF(minFreq).fit(data) val hashIDF_features = i...

9得票1回答
本地Git存储中的Zeppelin笔记本存储

我已经按照这里的指导设置了本地Git仓库中的Zeppelin笔记本存储:https://zeppelin.incubator.apache.org/docs/0.6.0-incubating-SNAPSHOT/storage/storage.html#Git,但我仍不清楚如何在Git中存储笔记...