47得票6回答
为什么PySpark无法找到py4j.java_gateway?

我安装了Spark,运行了sbt assembly,并且可以毫无问题地打开bin/pyspark。然而,我在将pyspark模块加载到ipython时遇到了问题。我收到以下错误:In [1]: import pyspark -----------------------------------...

45得票9回答
如何添加第三方Java JAR文件以在PySpark中使用

我有一些Java第三方数据库客户端库,我想通过它们进行访问。 java_gateway.py 例如:通过Java网关使客户端类(不是JDBC驱动程序!)可供Python客户端使用: java_import(gateway.jvm, "org.mydatabase.MyDBClient"...

25得票4回答
如何隐藏 "py4j.java_gateway:Received command c on object id p0"?

当日志级别设置为INFO时,我不停地收到一堆形如py4j.java_gateway:Received command c on object id p0的日志信息。请问如何隐藏这些信息?

20得票4回答
findspark.init() IndexError: 列表索引超出范围错误。

在Python 3.5 Jupyter环境中运行以下内容时,我收到下面的错误。有什么想法是什么导致了这个错误?import findspark findspark.init() 错误:IndexError Traceback (mo...

19得票2回答
如何在Python中使用pySpark添加SparkListener?

我想创建一个 Jupyter/IPython 扩展程序,用于监控 Apache Spark 作业。 Spark 提供了 REST API。 但是,我希望通过回调函数来发送事件更新,而不是轮询服务器。 我正在尝试使用 SparkListener 向 SparkContext.addSparkLi...

17得票4回答
Pyspark错误:"Py4JJavaError:在调用数据框的count()方法时发生错误。"

我是Spark的新手,并且我正在使用Pyspark 2.3.1将csv文件读入数据框中。我能够读入文件并在anaconda环境中运行的Jupyter笔记本中打印值。这是我正在使用的代码:# Start session spark = SparkSession \ .builder \ .app...

16得票10回答
当调用z:org.apache.spark.api.python.PythonRDD.collectAndServe时,出现了py4j.protocol.Py4JJavaError。

我在我的电脑(Ubuntu)上安装了Apache Spark和PySpark,并在Pycharm中更新了环境变量(例如spark_home,pyspark_python)。我想要做的是:import os, sys os.environ['SPARK_HOME'] = ".../spark-2...

15得票3回答
Pyspark py4j PickleException: "expected zero arguments for construction of ClassDict" Pyspark中的py4j出现了Pickle异常:"期望构造ClassDict时没有参数"。

这个问题是针对熟悉py4j并能帮助解决pickling错误的人。我尝试向pyspark PythonMLLibAPI中添加一个方法,该方法接受一个命名元组的RDD,执行一些操作,并返回一个RDD形式的结果。 该方法的模型基于PYthonMLLibAPI.trainALSModel()方法,其...

15得票1回答
使用py4J的最简单示例

我在Python的conda虚拟环境中使用pip安装了py4J。我编写了一个超级简单的示例AdditionApplication.java来测试py4J,但它无法编译。 javac AdditionApplication.java 会失败,并报错说GatewayServer未定义。 我对...

14得票5回答
Pyspark错误:py4j.java_gateway:尝试连接Java服务器(127.0.0.1:50532)时发生错误。

你好,我正在使用Pyspark进行工作,首次使用ML包实现情感分析项目。代码一直运行良好,但突然出现了上述错误: ERROR:py4j.java_gateway:An error occurred while trying to connect to the Java server (12...