得票数最多 'apache-zeppelin' 问题 - 第5页

标签列表

关联标签

8得票1回答

如何在Zeppelin中使用Plotly

我看到过 zeppelin-plotly，但它似乎太复杂了。另一个让我担心的问题是它涉及修改 zeppelin 的 .war 文件，我不想因错误而破坏东西。有没有其他方法可以在 Zeppelin 中使用 Plotly？

pythonapache-sparkplotlyapache-zeppelin

8得票2回答

在Zeppelin笔记本中设置全局变量是否可行？

我正在尝试使用Zeppelin笔记本创建一个多段仪表板。我希望使用仪表板的人只需输入特定参数一次。例如，如果我正在制作一个关于不同网站信息的仪表板，仪表板用户只需选择他们想要获取信息的特定网站一次，整个多段仪表板将会更新。这是否可能？我如何在笔记本中设置全局变量？为了澄清，我打算在Zeppel...

apache-sparkapache-zeppelin

8得票2回答

在启动集群时配置EMR上的Zeppelin的Spark解释器

我正在EMR上创建集群，并配置Zeppelin从S3中读取笔记本。为此，我使用了一个JSON对象，看起来像这样： [ { "Classification": "zeppelin-env", "Properties": { }, "Configuratio...

apache-sparkemramazon-emrapache-zeppelin

8得票2回答

在Spark中读取Avro文件。

我已经将一个AVRO文件读入Spark RDD中，现在需要将其转换为SQL DataFrame。我该怎么做。这是我目前为止所做的。 import org.apache.avro.generic.GenericRecord import org.apache.avro.mapred.{Av...

scalaapache-sparkapache-spark-sqlapache-zeppelin

8得票1回答

在单个图表中显示多个数据点

Scala： val df = sc.parallelize(Seq( ("Jan" , "1", "1","3"), ("Feb" , "2", "5","2"), ("Mar" , "2", "3","1"))) .toDF("time" , "f1", ...

apache-zeppelin

8得票1回答

将Spark SQL Zeppelin查询的结果保存/导出

我们正在使用Apache Zeppelin分析数据集。我们有一些查询需要运行，这些查询返回的结果很多，我们希望在Zeppelin中运行查询，但保存结果（显示仅限于1000个）。是否有一种简单的方法可以让Zeppelin将查询的所有结果保存到S3存储桶中呢？

apache-spark-sqlapache-zeppelin

8得票1回答

将Spark DataFrame从Python移植到Zeppelin中的Scala

我在 Zeppelin 的 Python 段落中创建了一个 Spark DataFrame。 sqlCtx = SQLContext(sc) spDf = sqlCtx.createDataFrame(df) 并且 df 是一个 pandas 数据帧 print(type(df)) &...

pythonscalaapache-sparkapache-spark-sqlapache-zeppelin

8得票1回答

Zeppelin与SparkR无法将数据框显示为表格。

齐柏林飞艇R解释器文档说明： If you return a data.frame, Zeppelin will attempt to display it using Zeppelin's built-in visualizations. 这可以在文档示例中看到：然而，当我尝试...

sparkrapache-zeppelin

8得票4回答

Zepplin更改端口，但Spark Master端口已被占用

当我在AWS上启动Zeppelin时，它会在8080端口上启动，但是由于有Spark Master，所以会显示端口已被使用... 我尝试在"zeppelin-site.xml.template"的配置文件中更改Zeppelin的端口。 <property> <name&...

apache-sparkapache-zeppelin

8得票1回答

如何从Spark DataFrame中选择一个稳定的行子集？

我在Zeppelin笔记本中使用以下方式将文件加载到DataFrame中： val df = spark.read.format("com.databricks.spark.csv").load("some_file").toDF("c1", "c2", "c3") 这个DataFram...

scalaapache-spark-sqlapache-zeppelin