8得票1回答
如何在Zeppelin中使用Plotly

我看到过 zeppelin-plotly,但它似乎太复杂了。另一个让我担心的问题是它涉及修改 zeppelin 的 .war 文件,我不想因错误而破坏东西。 有没有其他方法可以在 Zeppelin 中使用 Plotly?

8得票2回答
在Zeppelin笔记本中设置全局变量是否可行?

我正在尝试使用Zeppelin笔记本创建一个多段仪表板。我希望使用仪表板的人只需输入特定参数一次。例如,如果我正在制作一个关于不同网站信息的仪表板,仪表板用户只需选择他们想要获取信息的特定网站一次,整个多段仪表板将会更新。这是否可能?我如何在笔记本中设置全局变量?为了澄清,我打算在Zeppel...

8得票2回答
在启动集群时配置EMR上的Zeppelin的Spark解释器

我正在EMR上创建集群,并配置Zeppelin从S3中读取笔记本。为此,我使用了一个JSON对象,看起来像这样: [ { "Classification": "zeppelin-env", "Properties": { }, "Configuratio...

8得票2回答
在Spark中读取Avro文件。

我已经将一个AVRO文件读入Spark RDD中,现在需要将其转换为SQL DataFrame。我该怎么做。 这是我目前为止所做的。 import org.apache.avro.generic.GenericRecord import org.apache.avro.mapred.{Av...

8得票1回答
在单个图表中显示多个数据点

Scala: val df = sc.parallelize(Seq( ("Jan" , "1", "1","3"), ("Feb" , "2", "5","2"), ("Mar" , "2", "3","1"))) .toDF("time" , "f1", ...

8得票1回答
将Spark SQL Zeppelin查询的结果保存/导出

我们正在使用Apache Zeppelin分析数据集。我们有一些查询需要运行,这些查询返回的结果很多,我们希望在Zeppelin中运行查询,但保存结果(显示仅限于1000个)。是否有一种简单的方法可以让Zeppelin将查询的所有结果保存到S3存储桶中呢?

8得票1回答
将Spark DataFrame从Python移植到Zeppelin中的Scala

我在 Zeppelin 的 Python 段落中创建了一个 Spark DataFrame。 sqlCtx = SQLContext(sc) spDf = sqlCtx.createDataFrame(df) 并且 df 是一个 pandas 数据帧 print(type(df)) &...

8得票1回答
Zeppelin与SparkR无法将数据框显示为表格。

齐柏林飞艇R解释器文档说明: If you return a data.frame, Zeppelin will attempt to display it using Zeppelin's built-in visualizations. 这可以在文档示例中看到: 然而,当我尝试...

8得票4回答
Zepplin更改端口,但Spark Master端口已被占用

当我在AWS上启动Zeppelin时,它会在8080端口上启动,但是由于有Spark Master,所以会显示端口已被使用... 我尝试在"zeppelin-site.xml.template"的配置文件中更改Zeppelin的端口。 <property> <name&...

8得票1回答
如何从Spark DataFrame中选择一个稳定的行子集?

我在Zeppelin笔记本中使用以下方式将文件加载到DataFrame中: val df = spark.read.format("com.databricks.spark.csv").load("some_file").toDF("c1", "c2", "c3") 这个DataFram...