我正在处理来自https://opendata.rdw.nl/Voertuigen/Open-Data-RDW-Gekentekende_voertuigen_brandstof/8ys7-d773的数据(使用“Exporteer”按钮下载CSV文件)。
当我使用read.csv()
将数据导入到R中时,它需要3.75 GB的内存,但是当我使用pd.read_csv()
将其导入到pandas中时,它需要6.6 GB的内存。
为什么这个差异如此之大?
我使用以下代码在R中确定数据框的内存使用情况:
library(pryr)
object_size(df)
以及Python:
df.info(memory_usage="deep")