我在Pandas中使用read_csv
从S3读取数据。我想知道它是否首先将文件下载到本地磁盘,然后再加载到内存中,还是直接将传入的数据流式传输到内存中,而没有中间加载到磁盘。
我对Spark的sqlContext.read.load
函数也有同样的问题。
我在Pandas中使用read_csv
从S3读取数据。我想知道它是否首先将文件下载到本地磁盘,然后再加载到内存中,还是直接将传入的数据流式传输到内存中,而没有中间加载到磁盘。
我对Spark的sqlContext.read.load
函数也有同样的问题。