笔记本很好,但是REPL有时更加有用。我是否可以以某种方式运行在Databricks上执行的spark-shell?例如:
spark-shell --master https://adb-5022.2.azuredatabricks.net/
我查看了与Databricks相关的可用工具(如databricks connect、dbx等),但似乎没有这样的功能。
笔记本很好,但是REPL有时更加有用。我是否可以以某种方式运行在Databricks上执行的spark-shell?例如:
spark-shell --master https://adb-5022.2.azuredatabricks.net/
spark-shell
相同,驱动程序将位于您的本地计算机上,而执行器则是远程的。 databricks-connect
软件包安装了修改后的Apache Spark分发版,因此您可以使用spark-shell
,pyspark
,spark-submit
等工具 - 只需确保该目录在PATH
中即可。
P.S. 但我真的不明白为什么笔记本对您不起作用 - spark-shell
没有任何比它们更优越的功能。
databricks-connect test
,它使用pyspark shell运行一些测试,但然后指令跳到设置IDE。Databricks-connect使用说明说:usage: databricks-connect [-h] {configure,test,get-jar-dir,get-spark-home}
。实际上没有直接运行REPL的选项。 - Kombajn zbożowy