我正在尝试绘制一个包含三百万行数据的漂亮直方图(我有2个CPU/16GB RAM)。即使我提供了bin,也无法得到绘图。有没有更有效的方法来绘制直方图?请查看下面的代码。
df0 = dd.read_csv(filename, sep="|", header=None, dtype=np.str, error_bad_lines=False, usecols=col0, quoting=3, encoding='ISO-8859-1')
dfs = df0[df0['DocumentTypeStndCode']=='D'].compute()
dfs['Price'] = dfs[pd.to_numeric(dfs['Price'], errors='coerce').notnull()]
sns.distplot(dfs['Price'], bins=[0, 10000, 200000, 400000, 2000000], kde=False)
plt.show()