20得票6回答
如何在Zeppelin中抑制变量值的打印输出

给定以下代码片段:val data = sc.parallelize(0 until 10000) val local = data.collect println(s"local.size") Zeppelin将local的完整值打印到笔记本屏幕上。如何更改该行为?

17得票3回答
在Zeppelin中将Pandas数据框转换为Spark数据框

我是zeppelin的新手。我有一个使用案例,其中我有一个pandas数据帧。我需要使用zeppelin的内置图表来可视化集合,但我在这里没有清晰的方法。我的理解是,如果数据以RDD格式存在,则可以使用zeppelin可视化数据。因此,我想将pandas数据帧转换为spark数据帧,然后进行一...

17得票3回答
通过API与Jupyter Notebooks进行交互

问题: 我想通过Jupyter API从另一个应用程序与Jupyter互动,特别是我想从该应用程序运行我的笔记本(对我来说,完美的变体是在运行之前编辑某些段落)。我已经阅读了API文档,但没有找到需要的内容。 我使用了Apache Zeppelin 来实现这一目的,它具有相同的结构(笔记本和...

17得票3回答
Apache Zeppelin有智能感知吗?

Apache Zeppelin的笔记本UI是否支持智能感知/自动完成功能? 如果有,我该如何使用它? 我尝试在互联网上搜索,但未能找到可用的源。这个链接称要使用 ctrl-,但并未起作用。我想知道在项目移至Apache后是否删除了智能感知支持。

17得票10回答
在 Zeppelin 0.7.1 中运行 Spark 代码时出现 NullPointerException。

我已经安装了Zeppelin 0.7.1。当我尝试执行Zeppelin Tutorial笔记本中提供的示例Spark程序时,我遇到了以下错误。java.lang.NullPointerException at org.apache.zeppelin.spark.Utils.invoke...

16得票1回答
字段“features”不存在。SparkML。

我正在尝试使用Zeppelin在Spark ML中构建模型。 我对这个领域不熟悉,希望得到一些帮助。我认为我需要为列设置正确的数据类型,并将第一列设置为标签。任何帮助都将不胜感激,谢谢。val training = sc.textFile("hdfs:///ford/fordTrain.csv...

15得票1回答
将Spark.SQL DataFrame和pandas DataFrame互相转换

在 %pyspark 环境下,是否有可能将 <br> 转换为 pd.DataFrame?

15得票1回答
皮筋飞船:将Scala数据框转换为Python

如果我有一个包含DataFrame的Scala段落,我能够与Python共享和使用它吗?(据我所知,pyspark使用py4j) 我尝试了这个: Scala段落: x.printSchema z.put("xtable", x ) Python段落: %pyspark impor...

15得票1回答
使用d3.js和Apache Zeppelin

我正在尝试将d3.js与Apache Zeppelin集成,以添加更多的可视化选项。 我发现了一个例子,其中有人使用leaflet.js在这里实现了它,并尝试做类似的事情 - 不幸的是,我对angularJS(Zeppelin用于解释前端语言)不太熟悉。我也没有流式数据。以下是我的代码,只是...

15得票2回答
Zeppelin笔记本的键盘快捷键

以前有一个Jira(问题跟踪系统)关于键盘快捷键的,但似乎没有相关文档。 https://issues.apache.org/jira/browse/ZEPPELIN-391 是否有一份综合性的快捷键备忘单?特别是与 jupyter 键盘快捷键进行比较;例如,使用 dd 删除单元格。