在Google Dataproc集群创建后并运行期间,是否可以安装Python包?
我尝试在主节点命令行中使用“pip install xxxxxxx”,但似乎无法工作。
Google的Dataproc文档没有提到这种情况。
我尝试在主节点命令行中使用“pip install xxxxxxx”,但似乎无法工作。
Google的Dataproc文档没有提到这种情况。
在创建集群后通常不可能这样做。我建议使用初始化操作来完成此操作。
正如您所注意到的,默认情况下也未提供pip
。因此,您需要运行easy_install pip
,然后运行pip install
命令。
最后,如果您想在任何自动化中使用此集群,和/或者您想要保持封闭性,我建议创建一个wheel
,将其存储在GCS中,并在初始化操作中下载。您可以安装您的wheel。与直接从pip安装许多包相比,Wheels具有更快的速度。
2019 更新
请参阅此教程以配置Dataproc上的Python环境:https://cloud.google.com/dataproc/docs/tutorials/python-configuration