我正在遍历一个目录并读取一些文件并解析它们。我只需要获取数据帧的大小。我使用
每个目录都有10个文件,从0到9编号。我将所有这些
len(df.index)
来实现这一目的。每个目录都有10个文件,从0到9编号。我将所有这些
len(df.index)
添加到一个数据帧中,其中字母['A', 'B', 'C', 'D']
来自类别列表。这些值通过df2.loc[seed,nd] = len(df.index)
添加到数据帧中。结果数据帧如下: A B C D
0 10515.0 160592.0 221621.0 198884.0
1 9777.0 161307.0 222064.0 199841.0
2 10957.0 159954.0 219553.0 198622.0
3 12731.0 157862.0 221250.0 NaN
4 11765.0 162177.0 NaN NaN
5 8849.0 155631.0 NaN NaN
6 10549.0 160976.0 NaN NaN
7 8694.0 158953.0 NaN NaN
8 11696.0 160952.0 NaN NaN
9 10590.0 161046.0 NaN NaN
在我的脚本中,我使用for循环爬取两个目录,X
和Z
,生成了两个像上面那样的数据框。
问题在于,我想使用Seaborn水平条形图绘制这个数据框,代码如下:
sns.barplot(data=df2)
但是我不知道如何指定类别,例如这里显示的(链接)。
如何实现这个目标?我需要更改我的数据框格式吗?
我希望结果像这样(来自MS Excel)