问题: 我想在Amazon自己的集群中保存到AWS S3存储桶,而无需进行身份验证或使用库。基本上,我希望从在Amazon集群上运行的程序保存数据到S3存储桶。
我正在AWS EMR集群中运行一些Python3程序,并尝试将文件保存到AWS S3存储桶中的一个文件夹中,如果该文件夹不存在,则要创建它。
我目前保存文件的方式类似于以下方式。我已经尝试了“with”方法,但它也不起作用。
由于某些原因,使用Spark RDDs的方法将RDD保存为
我正在AWS EMR集群中运行一些Python3程序,并尝试将文件保存到AWS S3存储桶中的一个文件夹中,如果该文件夹不存在,则要创建它。
我目前保存文件的方式类似于以下方式。我已经尝试了“with”方法,但它也不起作用。
output = open("s3://mybucket/myfile.txt", "w+")
output.write("hello world\n")
由于某些原因,使用Spark RDDs的方法将RDD保存为
part-xxxxx
文件到S3存储桶中时,无需提供身份验证即可正常工作。rdd.saveAsTextFile("s3://mybucket/")
< p > saveAsTextFile()
方法是否需要身份验证,或者在后台进行身份验证?
如果不需要身份验证即可将文件保存到亚马逊的 S3 存储桶中,则是否可以使用 Python 的 open
方法来完成此操作,而无需像 saveAsTextFile()
RDD 方法那样需要身份验证呢?