我收到了一个CSV文件,其中,
是用来分隔字段的分隔符,但不幸的是,它还作为表示小数点(德国表示法)的符号。
因此,有些行将具有不同数量的列。奇怪的是,Excel可以解析/读取文件。在pandas中是否也可以读取这样的文件?到目前为止,我只得到了类似于
Error tokenizing data. C error: Expected 97 fields in line 3, saw 98
编辑
这里是一个最简示例:
pd.read_csv(os.path.expanduser('~/Downloads/foo.csv'), sep=',', decimal=',')
使用 ~/Downloads/foo.csv
文件并包含以下内容
first, number, third
some, 1, other
foo, 1.5, bar
baz, 1,5, some
当我在R中加载数据时
See spec(...) for full column specifications.
Warnung: 1538 parsing failures.
row col expected actual
1 -- 93 columns 97 columns
2 -- 93 columns 98 columns
3 -- 93 columns 97 columns
4 -- 93 columns 102 columns
5 -- 93 columns 99 columns
在pandas中是否有这样一种宽容模式?
sep=',\s'
的方法来读取它。 - root